czwartek, 28 lipca 2011

Jesus saves, czyli używaj programu do backupu.

Bardzo często zdarza mi się obserwować czyjeś nieszczęście polegające na padnięciu komputera podczas pracy. Samemu zdarza mi się niechcący przycisnąć przycisk na listwie... Osobiście podczas pracy z projektem tłumaczeniowym zawsze używam programu Syncron Portable (dostępny na stronie http://portableapps.com/apps/utilities/synkron_portable) i ustawiam tak, by przy każdej zmianie pliku w katalogu na twardym dysku, w którym znajduje się mój projekt, był on kopiowany do pamięci USB. Pada komputer? Mam wszystko na kluczu USB, co najwyżej bez maks 3-5 minut pracy.

środa, 27 lipca 2011

Toolbox - profesjonalne narzędzie leksykograficzne?

http://www.sil.org/computing/toolbox/ Program do tworzenia słowników dla lingwistów. Zapoznaję się z jego przydatnością - dla mnie najważniejsza byłaby jego współpraca z programami CAT, tworzenie słowników, z których mogłyby korzystać programy wspomagające pracę tłumacza. Na pewno by posługiwać się nim, trzeba najpierw zapoznać się z tutorialami.

Interlex2 - aplikacja do tworzenia własnych słowniczków i nauki słówek.

Na stronie http://www.vocab.co.uk/ znalazłem bardzo ciekawą aplikację do tworzenia własnych słowników i nauki słówek - Interlex 2.

Aplikacja umożliwia wpisywanie skrótu opisującego część mowy i uwzgędnienie kilku tłumaczeń tego samego słówka (również podczas nauki). Nauka słowek może odbywać się z wykorzystaniem czterech różnych rodzajów quizów.

Myślę, że jest to bardzo przydatna aplikacja dla nauczycieli i kursantów, pozwalająca szybko przygotować listy słówek i nauczyć się słownictwa. Wyobrażam sobie wykorzystanie takiej aplikacji wraz z concordancerem. Nauczyciel najpierw "przepuszcza" artykuł, który będzie opracowywany podczas lekcji, przez concordancer, tworzy listy wyrażeń i zwrotów w ich otoczeniu. Następnie wprowadza je do interlexa i udostępnia uczniom do nauki jako zadanie domowe...

poniedziałek, 25 lipca 2011

Transkrybowanie tekstów... Sound Scriber.

 http://www-personal.umich.edu/~ebreck/sscriber.html

SoundScriber to darmowy odtwarzacz mp3 ułatwiający transkrybowanie dzięki specjalnemu trybowi odtwarzania przypominającemu dyktowanie. Wypowiedź nagraną na dyktafon można przesłuchać i spisać dość wygodnie dzięki funkcji wielokrotnych powtórzeń. Długość powtarzanych kawałków, przesunięcie, ilość powtórzeń i prędkość odtwarzania można dostosować do własnej szybkości pisania na klawiaturze. Program umożliwia również dodawanie zakładek.

EDIT: Dzięki info od pana Pawła Wimmera dodaję jeszcze jedną aplikację... Express Scribe:
http://www.nch.com.au/scribe/index.html

czwartek, 21 lipca 2011

Programowanie dla tłumaczy...AutoIt

Autoit to język skryptowy podobny do Basic, napisany z myślą o automatyzowaniu czynności wykonywanych w Windowsach. Przykładem użyteczności w mojej codziennej pracy są makra  napisane przez Samuela Murraya a wspomagające pracę tłumacza: http://leuce.com/tempfile/omtautoit/
Skorzystałem i używam jego makro Omtaddterm. Makro pozwala wskazać słowo śródłowe i jego tłumaczenie a następnie dopisać je do pliku tekstowego w formacie UTF-8 z wykorzystaniem wybranego separatora. Plik ten następnie może wykorzystywać OmegaT jako leksykon.  Przerobiłem jedynie tak, aby makro zapisywało pary wyrazów do leksykonu w tym samym katalogu, w którym samo się znajduje.

Zalety AutoIt
  • Kompletne środowisko jest niewielkie, przenośne na kluczu USB. 
  • Można nagrywać makra, można kompilować pliki wykonywalne exe.
  • Istnieją liczne tutoriale i gotowe makra, które można przerabiać. 
  • Pomaga zautomatyzować wiele czynności wykonywanych codziennie w Windows i pozwala oszczędzić dużo czasu.
AutoIt można poprać ze strony: http://www.autoitscript.com/, polecam również edytor z podświetlaniem i podpowiedziami kodu AutoIt http://www.autoitscript.com/autoit3/scite/

wtorek, 19 lipca 2011

Czy tłumaczenia maszynowe są przydatne?

Google w swojej usłudze automatycznego tłumaczenia stosuje metody statystyczne .
Do tłumaczenia wykorzystuje najprawdopodobniej to samo narzędzie indeksujące i wyszukiwawcze, które dotychczas służyło do wyszukiwania najtrafniejszych rezultatów w usłudze "Google Search". Narzędzie to przeszukuje największy na świecie korpus językowy, którym jest cały internet, by określić najbardziej prawdopodobne tłumaczenie. Z czasem, wraz ze wzrostem ilości przetłumaczonych tekstów w internecie, metoda statystyczna będzie umożliwiała coraz trafniejsze tłumaczenia. I calkiem użyteczne jako podpowiedzi dla tłumacza.

Czy tłumacz musi znać się na wszystkim?

Nie musi, ale warto, by choć starał się zrozumieć to co tłumaczy :-)
Proces tłumaczenia wiąże się zawsze ze zbieraniem informacji. Tak to sobie wyobrażam:

Gdy dostaję do ręki tłumaczenie dotyczące urządzenia czy procesu technologicznego, którego nie rozumiem, pierwszą rzecz jaką robię to zbieram informację:
1. O podobnych przetłumaczonych tekstach.
2. O istniejących w sieci leksykonach.
3. Jeśli możliwe, przynajmniej korzystając z Wikipedii zapoznaję się bliżej z urządzeniem. Sprawdzam, czy w sieci istnieje rysunek z opisem podzespołów i części zamiennych w języku docelowym.

W trakcie tłumaczenia:
1. Zapisuję na osobnej kartce problemy, jakie sprawiają mi poszczególne terminy. Czasem decyduję się na zmianę tłumaczenia jakiegoś terminu w całym tekście więc taka lista problemów przydaje mi się podczas końcowej weryfikacji.
2. Robię sobie od czasu do czasu przerwę, aby poczytać o podobnych urządzeniach w języku obcym w sieci.

Po jego zakończeniu.
1. Sprawdzam, czy wprowadziłem zmiany zgodnie z listą problemową, którą tworzyłem na bieżąco podczas tłumaczenia.
2. Zdarza się, że gdy zrozumiem zasadę działania urządzenia, okazuje się, że zmieniam strukturę zdania czy całych akapitów, w porozumieniu ze zleceniodawcą, by wersja w języku docelowym była bardziej czytelna.

 Weźmy przykład. Głośne tłumaczenie Raportu z wypadku lotniczego na rosyjski... Krok 1, to zapoznanie się z podobnym rosyjskim raportem, objaśnieniami i słowniczkiem, jeśli taki jest do niego dołączony.Takie zapoznawanie się może odbywać się już w trakcie tłumaczenia, w razie potrzeby, w zależności od dostępnego czasu.  Na pewno tłumacz poradziłby sobie wtedy z tłumaczeniem terminu ILS i każdym innym.

 Po prostu, przed tłumaczeniem warto parę minut poświęcić na googlowanie, ściągnięcie kilku podobnych tekstów a potem posługiwać się skrótem klawiaturowym Ctrl+F i czytać ze zrozumieniem.

poniedziałek, 18 lipca 2011

Artykuł o CAT... wstęp.

Tworzę wstęp do mojego artykułu... na razie burza mózgu wygląda tak.

(CAT jest potrzebny tłumaczowi, ponieważ)
CAT poprawia jakość tłumaczeń specjalistycznych, ponieważ pozwala uzyskać większą spójność (leksykalną, frazeologiczną) tłumaczenia.

Zwiększa też wydajność odciążając tłumacza od konieczności żmudnego ręcznego przeszukiwania i pamiętania o tłumaczeniach przeszłych, co jest bardzo przydatne, gdy w trakcie tłumaczenia tłumacz podejmie decyzję, by jakąś frazę tłumaczyć inaczej. CAT wskazuje też na wystąpienia fraz podobnych i zaznacza różnice mięcy nimi, co jest bardzo przydatne, gdy jest to tłumaczenie uaktualniające poprzednią wersję.
(Proszę sobie tylko wyobrazić tłumaczenie uaktualnionej ulotki lekarstwa, gdy tłumacz otrzymał poprzednią wersję wraz z jej tłumaczeniem bez CAT - niektórzy zdecydowaliby sie na tłumaczenie od nowa, by uniknąć błędu)

Pozwala na tworzenie wartości dodanej tłumacza i biura tłumaczeniowego, w postaci pamięci tłumaczeniowej - korpusów przetłumaczonych tekstów oraz glosariuszy, które ponownie mogą być wykorzystane by wspomagać pracę tłumacza.

(CAT dla kogo)
Dla każdego, przygodę z CAT'em można rozpocząć używając darmowych narzędzi, takich jak  OmegaT czy Anaphraseus.

niedziela, 17 lipca 2011

Podcasty do nauki języków ze słuchu.

Gdy internet się upowszechnił, pojawiła się możliwość korzystania zarówno z wersji audio jak i materiałów pomocniczych do czytania na stronach internetowych. Dziś audycje można ściągać na komórkę aplikacjami do słuchania podcastów, np. Nokia Podcasting.

Na PC można się posłużyć programem Juice Portable. Jest to wersja przenośna, której nie trzeba instalować. Można ją nosić na kluczu usb lub wprost w pamięci odtwarzacza, który podłączamy do PC by zgrać interesujące nas podcasty.

Przykłady linków podcastów dla uczących się:

VOA Special English Podcasts: http://www.voanews.com/learningenglish/podcasts/

Deutsche Welle Podcasts im Überblick: http://www.dw-world.de/dw/article/0,,2341353,00.html (trzeba przewinąć do nagłówka) PODCASTS ZUM THEMA "DEUTSCH LERNEN")

Zapraszam równiez do zapoznania się z postami:

Słuchanie audycji w języku obcym uproszczonym.
http://www.jakprzetlumaczyc.pl/2011/07/suchanie-audycji-w-jezyku-obcym.html

Osłuchanie się z językiem, radia internetowe.
http://www.jakprzetlumaczyc.pl/2011/07/osuchanie-sie-z-jezykiem-radia.html

czwartek, 14 lipca 2011

Baza stacji radiowych na krótkich, średnich, UKF

Ktoś, kto słucha wciąż tradycyjnego radia na falach krótkich czy średnich, na pewno skorzysta z bazy danych stacji słyszalnych dla danej lokalizacji.

Bazy dla fal średnich i krótkich ukrywają się pod linkiem AM.  http://fmscan.org/index.php?r=m

Po lewej klikam "Frequencies for any locations."

Następnie ukaże się lista zakresów fal. Wybieram "Shortwave Complete..." ostatnią pozycję, bo nie jestem pewien, na którym paśmie coś właśnie słychać.

Uwaga: Trzeba określić swoją lokalizację (w nagłówku tabeli jest "Change Location". Lokalizację można wskazać na mapce.

W odpowiedzi baza wygeneruje listę nadających stacji a na zielono wskaże te, które powinny być słyszalne.   Słyszalne, bo baza określa jaka będzie moc sygnału po stronie odbiorczej, prezentując ją w postaci intensywności koloru zielonego.

Inne bazy danych nadajników:
http://www.hfcc.org/data/

Concondancer - do sporządzania list słówek

W tym poście opisuję możliwość tworzenia list słownictwa za pomocą darmowego oprogramowania. Studiując na anglistyce w Poznaniu i pełniąc dyżur w salce komputerowej miałem okazję poznać kolegów i koleżanki zajmujące się leksykografią... pamiętam, że korzystali oni z korpusów(zbiorów tekstów charakteryzujących się określonymi cechami wspólnymi: czasem i miejscem powstania i stylem) z concordancerów (oprogramowania do analizy leksykograficznej m.in. częstości występowania słów i ich otoczenia w korpusach) oraz ze standardowych relacyjnych baz danych (Paradox, dBase) do ostatecznej obróbki list i tworzenia z nich słowników. Przypominając sobie ich pracę wpadłem na taki pomysł:

  1. Znaleźć darmowy program concordancer... jest! Znalazłem: http://www.antlab.sci.waseda.ac.jp/ program napisał pan profesor Laurence Anthony z Uniwersytetu Waseda w Japonii. Opis programu w Wikipedii: http://en.wikipedia.org/wiki/AntConc
  2. Zebrać korpusy... po prostu teksty z danej dziedziny i w danym języku (np. angielski, budownictwo albo rosyjski, wiadomości), przekopiować je z plików html, bezpośrednio ze stron, z pdf_ow, ocr'owanego podręcznika budownictwa etc. - do plików tekstowych.
    Uwaga: Jeżeli pliki te mają zawierać znaki nie-łacińskie (cyrylicę, znaki arabskie, chiński etc.) należy plik zapamiętać jako txt z kodowaniem znaków Unicode (np. UTF-8), nie ANSI. Jest to bardzo ważne. Również w concordancerze w opcjach należy zaznaczyć, że pracujemy z korupsami w których znaki kodowane są w UTF-8 a nie ANSI. Jeżeli tego nie zrobimy to takie pliki korpusu mogą się okazać bezużyteczne, np. w jęz. rosyjskim pojawią się nam jakieś bezsensowne znaki zapytania i krzaczki.
  3. Wygenerować listy wyrazów posortowane według częstości występowania w korpusach. Najczęściej występujące (być, mieć, modalne, przedimki) możemy wykasować, uwzględnimy tylko słowa poniżej określonego progu częstości występowania.
  4. Kopiujemy liste do bazy np. do excela/Open Office calc'a albo nawet do tabeli worda (dodajemy pustą kolumnę na polskie odpowiedniki).
  5. Korzystając ze słownika i (concordancera, bo ułatwia on nam analizę poszczególnych słów - w jakim otoczeniu występują one w naszych korpusach) opracowujemy już ręcznie tłumaczenia polskie i przykłady.
  6. Exportujemy tak opracowane listy do supermemo, paukera lub innego programu do wkuwania słówek albo drukujemy papierowe fiszki.

W efekcie mamy zbiory słówek dotyczące wybranej przez nas dziedziny, uporządkowane wg. trudności (częstości występowania), w rzeczywistym otoczeniu i kontekscie (jeżeli przyłożyliśmy się w pkt. 5) no i przede wszystkim, za darmo. Szczególnie mogłoby się to spodobać ludziom, którzy pragnęliby zgłębić współczesne słownictwo w wąskich dziedzinach (np. mikrobiologii, neurologii etc.). Coraz częściej korzystają one z literatury w wersji elektronicznej (jeśli nie, to wersje papierowe współcześnie łatwo skanować i OCR'ować do plików txt.
Jeszcze jedną zaletą tego rozwiązania, np. w przypadku rosyjskiego jest to, że nie muszę rosyjskich słówek i ich ew. otoczenia wpisywać ręcznie. Byłaby to dla mnie mordęga, bo nie potrafię pisać bezwzrokowo na klawiaturze rosyjskiej.
---
Inne podobne concordancer'y:
TextSTAT http://www.niederlandistik.fu-berlin.de/textstat/software-en.htm
AConcorde http://www.andy-roberts.net/software/aConCorde/index.html

Słuchanie audycji w języku obcym uproszczonym.

Jedną z możliwości osłuchania się z językiem obcym i uczenia się ze słuchu jest słuchanie audycji specjalnie spreparowanych dla uczących się. Zdania wypowiadane są wolno a stosowane słownictwo jest uproszczone.

Przykłady materiałów przygotowanych specjalnie dla uczących się. Lektor mówi wolno, wyraźnie i posługuje się prostym słownictwem:
Angielski: VOA Special English http://www1.voanews.com/learningenglish/home/
(godny polecenia jest również kanał Youtube http://www.youtube.com/user/VOALearningEnglish)
Niemiecki: DW Langsam Gesprochene Nachrichten http://www.dw-world.de/dw/0,,8030,00.html
Francuski: Le journal en français facile http://www.rfi.fr/lffr/statiques/accueil_apprendre.asp
Rosyjskihttp://nclrc.org/webcasts/russian/
Arabskihttp://nclrc.org/webcasts/arabic/

Ponadto, istnieją aplikacje pozwalające na odsłuchiwanie plików audio wolniej bez zmiany wysokości głosu, np. darmowy plugin do winampa http://www.winamp.com/plugin/slow-me-down/21827

środa, 13 lipca 2011

Darmowa szkoła po angielsku.

Indian Institute of Science (IISc) and IITs oferuje wykłady z przedmiotów technicznych w języku angielskim (z akcentem indyjskim, ale za to w kontekście, z notatkami na tablicy).
Polecam, słucham właśnie wstępu do elektroniki cyfrowej.
Youtube: http://www.youtube.com/iit

Do informacji dotarłem dzięki Amitowi Agarwalowi i jego stronie Digital Inspiration http://www.labnol.org

Khanacademy jest jednym ze zwycięzców konkursu Google Inc. na projekty i pomysły, które mogą zmienić świat na lepsze. http://www.project10tothe100.com/ Ciekawym jest np. projekt http://www.usfirst.org promujący nauki matematyczne i techniczne wśród dzieci.

Również, MIT udostępnia materiały i wykłady online. Zapisałem się na studia z elektroniki :-)))
http://ocw.mit.edu/courses/electrical-engineering-and-computer-science/6-002-circuits-and-electronics-spring-2007/video-lectures/ 

poniedziałek, 11 lipca 2011

AWB - idealna kompresja nagrań mowy (kursy, audiobooki).

Pliki mp3 nagrywanego przeze mnie radia internetowego, podcastów i kursów językowych zajmują wiele megabajtów pamięci. Kompresja Adaptive Multirate Wideband, pozwala uzyskać pliki nawet dziesięciokrotnie mniejsze przy zachowaniu dobrej czytelności i jakości mowy. Pliki AWB odtwarzane są przez większość współczesnych telefonów komórkowych, smartfonów. Czym je kompresować, czym odtwarzać?

Nokia Audiobooks Aplikacja do kompresji audiobooków na PC oraz aplikacja w Symbianie do słuchania na nokiach. Pozwala skompresować ogromne pliki do bardzo niewielkich rozmiarów, dziesiątki godzin nagrania do kilku megabajtów. Jakość odtwarzanego dźwięku jest doskonała w przypadku mowy (nie nadaje się do muzyki). Projekt nie jest już rozwijany ale aplikacja działa bez zarzutu!!! Uwaga: Aby umożliwić rekompresję plików mp3, konieczne jest skopiowanie do katalogu aplikacji kompresora mp3 lame.exe, którego aplikacja nie zawiera.


Tak skompresowanych audiobooków można słuchać nie tylko na komórkach ale i na PC posługując się aplikacją Total Vieo Player (aplikację tę noszę ze sobą na kluczu USB). Znalazłem też inny ciekawy odtwarzacz AIC_Audio_Player, który dodatkowo pozwala regulować prędkość odtwarzania (niestety, bez zachowania tonacji).

Update: Nowa aplikacja do słuchania audiobooków w formacie awb, nQa: http://wiki.maemo.org/Nqaap#Getting_nQa_Audiobook_Player

Zestaw aplikacji dla tłumaczy na klucz USB

Ciekawy zestaw aplikacji na klucz USB zawierających przeróżne narzędzia, znalazłem na stronie http://letconex.blogspot.com/2010/06/portable-cat-usbtrans.html


Dla mnie interesującym odkryciem w tym zestawie są dwie aplikacje:
ForeignDesk TermBase - program do zarządzania i konwertowania plików z terminologią (Trados, CSV). (Aby działało, musi być zainstalowany silnik microsoftu do obsługi baz danych mdb.)
Maxprograms - narzędzia, które umożliwiają konwersję plików csv do formatu pamięci tłumaczeniowej tmx oraz ich weryfikację.

sobota, 9 lipca 2011

Osłuchanie się z językiem, radia internetowe.

Z językiem angielskim osłuchałem się za schyłkowego PRL'u dzięki audycjom BBC i VOA (Special English) na falach krótkich. Po zimnej wojnie w eterze ucichło ale wymyślono internet, dzięki czemu użytkownik komputera może słuchać dowolnej stacji na ziemi bez pośrednictwa zawodnych fal eteru. Dzięki temu dopływający do naszych uszu dźwięk jest dużo lepszej jakości. Do nagrywania audycji radia internetowego, można zastosować darmowe narzędzia  umożliwiające ripowanie (nie nagrywanie ale zrzucanie strumieni do plików mp3, ogg, aac, bez ich rekompresji). Dwa przykłady  :

XMplay http://www.xmplay.com/ typowy odtwarzacz mp3/aac na PCta. W dialogu otwierania nowego pliku można wkleić adres radia internetowego i zaznaczyć opcję nagrywania do pliku.

Streamripper http://streamripper.sourceforge.net/ aplikacja uruchamiana z linii poleceń.
Aby nagrywać stację National Public Radio, w katalogu gdzie znajduje się plik streamripper.exe tworzę plik start.bat zawierający zapis, np. streamripper.exe http://scfire-dll-aa03.stream.aol.com:80/stream/1062. Aplikację noszę na odtwarzaczu mp3. Gdziekolwiek jest dostęp do sieci, podłączam moją mp3'ke do komputera i uruchamiam streamripper za pomocą pliku start.bat. Nagrywa się od razu na odtwarzacz.

Składnia, jaką stosuję w pliku wykonywalnym bat: streamripper.exe -a  url_stacji nazwapliku.mp3

Switch -a powoduje nagrywanie do pojedynczego pliku. Jeżeli w parametrach nie została nadana nazwa pliku, domyślnie zostanie mu nadana nazwa w postaci bieżącej daty.

Alternatywą dla radia internetowego na żywo są podcasty. Na komórkach nokii z symbianem można zainstalować program do ładowania z sieci podcastów. Pakiet internetowy 100mb miesięcznie to tylko 4 zł. Ja tak słucham Deutsche Welle - Langsam Gesprochene Nachrichten. Bardzo to wygodne szczególnie gdy marnuje się czas w jakiejś kolejce czy korku.

A oto lista stacji, z których najczęściej słucham, obecnie z przewagą stacji niemieckich:

Deutschlandfunk
http://www.dradio.de/streaming/dlf_lq_mp3.m3u
http://www.dradio.de/streaming/dlf.m3u

Deutsche Welle
http://metafiles.gl-systemhaus.de/dw/radio_de_64.m3u
http://metafiles.gl-systemhaus.de/dw/radio_en_64.m3u

http://www.listenlive.eu/dw-de.m3u
http://www.listenlive.eu/dw.m3u

http://mediacenter.dw-world.de/german/live/#!/media=audio&broadcast=german


Deutschalnd Radio Kultur
http://www.dradio.de/streaming/dkultur_lq_mp3.m3u
http://www.dradio.de/streaming/dlf.m3u

Deutschland Radio Wissen
http://www.dradio.de/streaming/dradiowissen_lq_mp3.m3u
http://www.dradio.de/streaming/dradiowissen.m3u

NPR (English)
http://www.npr.org/streams/mp3/nprlive24.pls

Radio Wnet (polskie)
http://media.radiownet.pl:8000/stream

Baby Radio (polskie dla dzieci)
http://www.radio.pionier.net.pl/stream.pls?radio=babyradio

piątek, 8 lipca 2011

Kataryna: tłumacz opóźnina raport Millera (nie o polityce)

http://kataryna.blox.pl/2011/07/Tlumacz-opoznia-raport-Millera.html

Kataryna: W googlach bez problemu można znaleźć raport MAK po rosyjsku, a w nim na pierwszych kilkunastu stronach tłumaczenia wszystkich użytych terminów, w tym tego podobno strasznie problematycznego ILS. Uprzejmie informuję więc tłumaczy za grube pieniądze tłumaczących raport Millera i skarżących się, że nie wiedzą co zrobić z ILS, że sam MAK w rosyjskiej wersji raportu zostawia skrót ILS, tłumacząc go w słowniczku jako "instrumentalnaja sistiema zachoda za pasadku" (sorry, nie chce mi się szukać cyrylicy).  

Tak jak Pani Katarynie, trudno mi uwierzyć, by tłumaczom raportu na angielski i rosyjski, problem sprawiało przetłumaczenie terminów takich jak ILS.   Nie dopuszczam nawet do siebie takiej myśli, że dzieje się inaczej, że po prostu do biura przyszło 300 stron, to się do nich usiadło i chwilkę po rozpoczęciu tłumaczenia stwierdziło się, że nie wiadomo jak ten ILS przetłumaczyć na język rosyjski.  Zakładam, że raport Millera tłumaczy renowowane biuro, które zatrudnia doświadczonych tłumaczy technicznych.

Wyobrażam sobie, że:
  1. Stworzyli oni zespół projektowy.
  2. Nim przystąpili do tłumaczenia, poświęcili kilka godzin na zebranie informacji, literatury, korpusu tekstów dotyczącego wypadków lotniczych (np. sam raport MAK). Zapewnili sobie stały kontakt z ekspertem ds. wypadków.   
  3. W ramach projektu przygotowali wspólną bazę terminologiczną, wspólny leksykon. Taki leksykon może rozrastać się na bieżąco, podczas tłumaczenia. Po zakończeniu tłumaczenia, można dołączyć do niego leksykon, by rozwiać wątpliwości.
  4. Zaplanowali czas i zasoby: 300 stron, np. 3-4 tłumaczy o określonym profilu jak najbardziej zbliżonym do wymaganego (techniczny, prawny, wojskowy, techniki lotniczej) 1-2 dni na przygotowanie, tydzień na tłumaczenie, tydzień na weryfikację  przez native speakerów i konsultantów ds. wypadków lotniczych. 
  5. Użyli CATa. Programu wspomagającego tłumaczenie. Trudno mi sobie wyobrazić profesjonale biuro tłumaczeniowe obsługujące władze państwowe, które nie stosuje "kotka" do tłumaczenia tak ważnych dokumentów. Pamięć jest zawodna, a CAT pozwala zachować spójność tłumaczenia, pozwala reagować na poprzednie wystąpienia podobnych fraz w tłumaczeniu, sygnalizuje wystąpienie terminologii zawartej w leksykonie, ułatwia weryfikację i korektę podczas tłumaczenia.  
Bardzo bym się zdziwił, gdyby moja wyobraźnia mnie zawiodła.

(uaktualnienie 11-07-2011)
Ciekawostka. Zapytanie ofertowe na forum Proz.com dotyczące tłumaczenia dokumentacji katastrofy lotniczej.
http://www.proz.com/translation-jobs/521200.
Cytat: "Ponieważ naszego Klienta obowiązują przepisy jakie mają zastosowanie do jednostek administracji publicznej stawki dla przysięgłych nie mogą przekroczyć w naszej finalnej ofercie dla klienta stawek zgodnych z Rozporządzeniem w tej sprawie. Niestety w chwili obecnej nie jestem w stanie przekazać informacji jaką ostatecznie objętość będą miały dokumenty do tłumaczenia."  
Mój komentarz: Jest coś bardzo nieodpowiedzialnego w przepisach o zamówieniach publicznych, co nagminnie powoduje, że tańsza oferta zwykle okazuje się w praniu wielokrotnie droższa niż średnia w Europie. Poraża mnie nie uwzględnianie w publicznych zapytaniach ofertowych kryteriów jakościowych i brak szczegółowych procedur dotyczących ważnych dla Państwa tłumaczeń.

Anki - system flashcardowy do nauki słówek.

http://ankisrs.net/   Naukę słówek można sobie ułatwić stosując system flashcardowy, który będzie odpytywać nas, pamiętać oceny, jakie sobie wystawiliśmy i  planować powtórki. Moim faworytem jest Anki, system flashcardowy dostępny zarówno w wersji online jak i offline (z możliwością synchronizacji, również w wersji przenośnej na kluczu USB).

Słówka można wprowadzać samemu lub skorzystać z gotowych, udostępnionych przez innych użytkowników. Podczas nauki użytkownik sam wystawia sobie oceny, a system flashcardowy zaplanuje jego powtórkę.

Autor programu Anki umieścił szczegółowy tutorial w serwisie youtube.

poniedziałek, 4 lipca 2011

Pomysł na artykuł.

Chciałbym napisać krótki artykuł dla laików na temat narzędzia wspomagającego tłumaczenie (CAT) OmegiT. Wstępnie mój plan wygląda mniej więcej tak:

Wstęp: OmegaT, 
->darmocha
->obsługiwane pliki (MS Office 2007, Open Office, HTML)

Zalety, funkcje:
-> spójność tłumaczenia (odnosimy się do takich tematów jak zmęczenie, słaba pamięć tłumacza)
-> powtarzalność segmentów tłumaczeniowych
-> podpowiedzi z własnej pracy, starych tłumaczeń (segmenty, leksykon)
-> podpowiedzi, wykorzystanie wskazówek zleceniodawcy
-> podpowiedzi, google translate
-> podpowiedzi, słownik w formacie star-dict (strasznie bym chciał, gdyby twórcy naszych słowników technicznych wydali jeśli nie swoje słowniki w formacie star-dict to choćby np zabezpieczoną omegę-t z ich słownikiem,
-> wszystko przenośne na kluczu USB
-> spellchecker - jakikolwiek z open-office'a - działa.
-> language checker - działa dla języka polskiego, pozwala poprawić najbardziej podstawowe błędy interpunkcji,
-> tzw. tokenizers - umożliwiają radzenie sobie z końcówkami fleksyjnymi, niestety dla j.polskiego niedostępna funkcja

Dla laików, w praktyce:
Odpala się omegęT
Tworzy się nowy projekt,
Zasysa do niego wszystkie pliki,
Tłumaczy się (w osobnych oknach omegaT podpowiada, jeśli wystąpiły już podobne tłumaczenia w przeszłości)
Sprawdza, czy nie opuściło się jakiegoś segmentu,
Generuje pliki docelowe
Voila...

niedziela, 3 lipca 2011

CAT

Youtube staje się coraz bogatszym źródłem tutoriali, również w dziedzinie narzędzi wspomagających tłumaczenie.

Znalazłem 2 tutoriale opisujące krok po kroku jak stworzyć projekt i tłumaczyć posługując się darmowym CAT'em OmegaT. Zachęcam do obejrzenia nawet początkujących tłumaczy, którzy nigdy nie mieli styczności z oprogramowaniem wspomagającym tłumaczenia.




Darmowe narzędzia do obróbki plików TMX

Pliki TMX, to najogólniej pliki pamięci tłumaczeniowej tworzone przez zarówno profesjonalne jak i darmowe narzędzia wspomagające tłumaczenie. Jeden plik tmx jest nierówny drugiemu i nie można często tak po prostu wgrać plik tmx stworzony przez jeden program do drugiego programu.

Ja najczęściej używam OmegiT, darmowego narzędzia, które po przetłumaczeniu generuje pliki tmx w formacie 1.1. Posiadam również Tradosa 2007, który tworzy pliki tmx w formacie 2.0. Powstaje więc problem konwersji 1.1-2.0. Drugi problem, to występowanie nietypowych znaków w plikach tmx, które nie pozwalają na ich wczytanie przez program tłumaczący. Potrzebna jest więc ich "walidacja" czyli wskazanie problemów i możliwość ich usunięcia z plików. Trzeci, to sytuacja, gdy ktoś nam przesyła bi-teksty (parallel texts), teksty dwujęzyczne, w postaci dwóch oddzielnych plików albo w tabelce excela. Nie mogę ich tak po prostu wczytać do OmegiT, muszę najpierw przekonwertować je do plików pamięci tłumaczeniowej tmx. Czy można sobie poradzić w takiej sytuacji darmowymi narzędziami?


A oto darmowe narzędzia (jakie znalazłem w sieci) przydatne do konwersji pamięci tłumaczeniowych do formatu TMX obsługiwanego przez OmegęT.

  1. Bitex2TMX. Aligner. Stosuję, gdy posiadam stare dwa dokumenty, źródłowy i przetłumaczony i chcę z nich utworzyć pamięć tłumaczenową tmx. Będę z nich korzystać w przyszłych tłumaczeniach. 
  2. ANCFileConversion Konwerter Unicode pozwala zamienić system kodowania znaków, np. UTF-16 na UTF-8. Pliki TM Tradosa są w UTF-16 a OmegaT obsługuje jedynie UTF-8.
  3. TM-Database Konwerter CSV do TMX 1.1. Pozwala konwertować pliki tekstowe CSV do formatu TMX 1.1 obsługiwanego przez OmegęT
  4. TMXValidator Walidator okazał się pomocny, gdy OmegaT stwierdziła, że w konwertowanych przeze mnie pamięciach tłumaczeniowych występują znaki, których nie może parsować. TMX Validator znalazł i naprawił błąd. Pliki się otworzyły. (inna podobna aplikacja oferowana jest przez twórców klona OmegiT - na stronie OmegaT Plus.)
  5. OkapiFramework Swiss Army knife dla tłumaczy. Masa różnych narzędzi pomagających konwertować różne formaty, przeglądać i edytować pamięci tłumaczeniowe i wykonywać masę innych przydatnych rzeczy. Jestem w trakcie poznawania tego narzędzia.
Co najciekawsze... wszystkie te narzędzia są stosunkowo niewielkich rozmiarów, można je zabrać ze sobą na kluczu USB razem z CAT'em OmegąT lub Anaphraseusem (plugin do OpenOffice portable, polecam również dodanie do OpenOffice'a i OmegiT sprawdzania gramatyki - Language Tool).

PS. Nasi południowoafrykańscy koledzy próbują powiązać OmegęT z OpenOfficem w jedno środowisko. Myślę, że to może być bardzo ciekawy projekt. Autshumato. Ciekawe jest też udostępnienie przez IBM ich środowiska CAT jako oprogramowania otwartego OpenTM2.
Pobawiłem się też ostatnio nowym projektem CAT'a Virtaal. Myślę, że jest to już bardzo obiecujące narzędzie do lokalizacji. Na razie używam go by edytować i przeglądać pliki TMX.

Dzień pierwszy, uruchamiam blog.

Uruchamiam blog na temat tłumaczeń. Nie uważam siebie za mistrza supertłumacza, po prostu chcę się dzielić moimi nowymi odkryciami i doświadczeniami w tej dziedzinie.