TES pomoże stworzyć listę terminologii z istniejących korpusów tłumaczeniowych.
Wersję pod windows można załadować tutaj: http://lpg.uoc.edu/TES/
Po rozpakowaniu archiwum znajdziemy w nim dwa pliki wykonywalne: TES Wizard i TES Edytor,
1. Za pomocą LF Alignera z istniejących dokumentów i ich tłumaczeń stworzyłem dwujęzyczny korpus w postaci pliku tekstowego, w którym dwie kolumny oddzielone są tabulatorem (tab delimited).
2. Za pomocą TES Wizarda:
- wgrałem dokument (przycisk Bilingual Corpus Extraction),
- drugim przyciskiem zdefiniowałem plik wyjściowy kandydatów na moje hasła słownikowe (przycisk Select Output File),
- trzeci przycisk umożliwił mi ustawienie maks. liczby słów w haśle oraz wybór pliku ze słowami Stop Words (w programie załączone są pliki dla j. angielskiego i hiszpańskiego)
- a następnie wcisnąłem czwarty przycisk by wygenerować listę kandydatów.
- wgrałem plik tekstowy, mój dwujęzyczny korpus (File/Open Par.CorpusFile),
- wgrałem listę kandydatów. Uwaga. Należy wgrać nie całą listę*.txt a jej część z rozszerzeniem kolejno: part0 a po opracowaniu kolejną part1 etc. ze względu na ograniczoną pamięć komputera,
- ujrzałem listę kandydatów na hasła mojego słownika. Zaznaczając kolejne słowa (trzeba zaznaczyć myszką) można opracowywać kolejne hasła. Program będzie w tym pomagać. Należy:
(a) wybrać z menu Translate i zobaczyć w sąsiadującym polu listę rozwijaną proponowanych przez program tłumaczeń ,
(b) wybrać z menu Search i zobaczyć, w jakim otoczeniu słowo i proponowane tłumaczenie występują w tekstach źródłowych (wszystkie wystąpienia w korpusie!).
TES Wizard:
http://www.screencast.com/t/DCzIgg4TAb
TES Editor:
http://www.screencast.com/t/WOdPmqvG
Polecam jego blog: http://traduccio.blogs.uoc.edu/
Brak komentarzy:
Prześlij komentarz