niedziela, 3 lipca 2011

Darmowe narzędzia do obróbki plików TMX

Pliki TMX, to najogólniej pliki pamięci tłumaczeniowej tworzone przez zarówno profesjonalne jak i darmowe narzędzia wspomagające tłumaczenie. Jeden plik tmx jest nierówny drugiemu i nie można często tak po prostu wgrać plik tmx stworzony przez jeden program do drugiego programu.

Ja najczęściej używam OmegiT, darmowego narzędzia, które po przetłumaczeniu generuje pliki tmx w formacie 1.1. Posiadam również Tradosa 2007, który tworzy pliki tmx w formacie 2.0. Powstaje więc problem konwersji 1.1-2.0. Drugi problem, to występowanie nietypowych znaków w plikach tmx, które nie pozwalają na ich wczytanie przez program tłumaczący. Potrzebna jest więc ich "walidacja" czyli wskazanie problemów i możliwość ich usunięcia z plików. Trzeci, to sytuacja, gdy ktoś nam przesyła bi-teksty (parallel texts), teksty dwujęzyczne, w postaci dwóch oddzielnych plików albo w tabelce excela. Nie mogę ich tak po prostu wczytać do OmegiT, muszę najpierw przekonwertować je do plików pamięci tłumaczeniowej tmx. Czy można sobie poradzić w takiej sytuacji darmowymi narzędziami?


A oto darmowe narzędzia (jakie znalazłem w sieci) przydatne do konwersji pamięci tłumaczeniowych do formatu TMX obsługiwanego przez OmegęT.

  1. Bitex2TMX. Aligner. Stosuję, gdy posiadam stare dwa dokumenty, źródłowy i przetłumaczony i chcę z nich utworzyć pamięć tłumaczenową tmx. Będę z nich korzystać w przyszłych tłumaczeniach. 
  2. ANCFileConversion Konwerter Unicode pozwala zamienić system kodowania znaków, np. UTF-16 na UTF-8. Pliki TM Tradosa są w UTF-16 a OmegaT obsługuje jedynie UTF-8.
  3. TM-Database Konwerter CSV do TMX 1.1. Pozwala konwertować pliki tekstowe CSV do formatu TMX 1.1 obsługiwanego przez OmegęT
  4. TMXValidator Walidator okazał się pomocny, gdy OmegaT stwierdziła, że w konwertowanych przeze mnie pamięciach tłumaczeniowych występują znaki, których nie może parsować. TMX Validator znalazł i naprawił błąd. Pliki się otworzyły. (inna podobna aplikacja oferowana jest przez twórców klona OmegiT - na stronie OmegaT Plus.)
  5. OkapiFramework Swiss Army knife dla tłumaczy. Masa różnych narzędzi pomagających konwertować różne formaty, przeglądać i edytować pamięci tłumaczeniowe i wykonywać masę innych przydatnych rzeczy. Jestem w trakcie poznawania tego narzędzia.
Co najciekawsze... wszystkie te narzędzia są stosunkowo niewielkich rozmiarów, można je zabrać ze sobą na kluczu USB razem z CAT'em OmegąT lub Anaphraseusem (plugin do OpenOffice portable, polecam również dodanie do OpenOffice'a i OmegiT sprawdzania gramatyki - Language Tool).

PS. Nasi południowoafrykańscy koledzy próbują powiązać OmegęT z OpenOfficem w jedno środowisko. Myślę, że to może być bardzo ciekawy projekt. Autshumato. Ciekawe jest też udostępnienie przez IBM ich środowiska CAT jako oprogramowania otwartego OpenTM2.
Pobawiłem się też ostatnio nowym projektem CAT'a Virtaal. Myślę, że jest to już bardzo obiecujące narzędzie do lokalizacji. Na razie używam go by edytować i przeglądać pliki TMX.

2 komentarze:

  1. Mogę tylko żałować, że prasa komputerowa już się takimi tematami nie zajmuje. Jeszcze kilka lat temu zaproponowałbym Panu napisanie artykułu o CAT do PC Worlda, dzisiaj jednak czytelnik oczekuje tematów zdecydowanie "konsumenckich".
    Kiedyś bawiłem się troszkę serwisem Google Narzędzia dla tłumaczy, ale moja wiedza jest skromniutka i bardzo amatorska.
    http://translate.google.com/toolkit/
    Interesowałem się również narzędziami wspomagającymi tworzenie słowników (jestem autorem liczącego niemal 30 tys. haseł słownika interlingua-polski), choć ostatnio brakuje mi już czasu na te zabawy. Może na emeryturze :-)

    OdpowiedzUsuń
  2. Szkoda, Panie Pawle, że takie gazety jak PC World nie byłyby zainteresowane tematem narzędzi wspomagających tłumaczenie. Rynek tłumaczeniowy jest obecnie bardzo dojrzały, działają na nim nie tylko tłumacze, osoby wykształcone w tym zawodzie, ale specjaliści powracający z zagranicy, studenci usiłujący dorobić sobie. Myślę, że jest to dość liczny krąg odbiorców.
    Uważam, że OmegaT zasługuje dziś na taki artykuł. Już nic nie tłumaczę bez niej. Bardzo mi pomaga.

    OdpowiedzUsuń