OmegaT

z Wikipédie, slobodnej encyklopédie
Prejsť na: navigácia, hľadanie
OmegaT
Základné informácie
Autor Keith Godfrey
Vývojár Didier Briel, Zoltan Bartko, Tiago Saboga, atď...
Posledná stabilná verzia 2.0.5_02 (5. február 2010)
Posledná testovacia verzia 2.1.3 beta (21. február 2010)
Operačný systém Viacplatformový softvér
Typ softvéru Počítačom podporovaný preklad
Licencia GPL

Computer n screen.svg Pozri aj Informačný portál

OmegaT je nástroj pre počítačom podporovaný preklad (CAT) napísaný v programovacom jazyku Java. Je to slobodný softvér ktorý pôvodne vyvinul Keith Godfrey v roku 2000, a v súčasnosti sa jeho vývoju venuje tím vedený Didierom Brielom.

Program OmegaT je určený pre profesionálnych prekladateľov. Medzi jeho vlastnosti patrí segmentácia nastaviteľná používateľom pomocou regulárnych výrazov, prekladová pamäť, hľadanie podobných výrazov, zoraďovanie zhodných výrazov, hľadanie v slovníku, kontextové hľadanie v prekladových pamätiach a hľadanie kľúčových výrazov v referenčných materiáloch.

Vyžaduje si prostredie Java 1.4, ktoré je dostupné pre Linux, Mac OS X a Microsoft Windows 98 alebo vyšší.

Názov OmegaT (názov registrovaný na stránke SourceForge) je teraz registrovanou obchodnou značkou. V súčasnosti iba softvér vydaný Projektom OmegaT môže používať názov OmegaT[1].

História[upraviť | upraviť zdroj]

Program OmegaT prvýkrát vyvinul Keith Godfrey v roku 2000. Pôvodný základ bol napísaný v C++, ale prvé verejné vydanie vo februári 2001 bolo napísané v Jave.

Prvá Java verzia používala proprietárny formát prekladových pamätí, a pre jej fungovanie bola potrebná Java 1.3. Ponúkala podporu pre dokumenty StarOffice, takzvaný obyčajný text a Unicode text, a HTML, a mohla robiť iba segmentáciu na úrovni blokov (čo pre väčšinu praktických účelov znamenalo segmentáciu podľa odstavcov).

Od verzie 1.4.4 do verzie 1.6.0 viedol vývoj Maxym Mychalčuk. Po ňom vedenie prevzal Henry Pijffers a bol správcom vydávania až do verzie 1.7.1. V súčasnosti je správcom vydávania Didier Briel.

OmegaT vyžaduje Java 1.4 alebo lepšie, a používa niekoľko knižníc pod licenciou LGPL.

Vývoj[upraviť | upraviť zdroj]

Vývoj kódu má v súčasnosti na starosti tím ktorý vedie Didier Briel. Medzi aktuálnych prispievateľov do kódu patria Zoltan Bartko, Didier Briel, Kim Bruning, Henry Pijffers, Tiago Saboga, a zopár ďalších. Vývojári reagujú na hlásenia o chybách a na požiadavky na vylepšenia podané na vývojárskej stránke SourceForge.[2]

Vydania[upraviť | upraviť zdroj]

  • Stabilná verzia (v súčasnosti 1.7.3 aktualizácia 1) sa vydáva so stabilnou sadou vlastností a s aktuálnou používateľskou príručkou. Menšie aktualizácie pre stabilnú verziu obsahujú opravy chýb a napokon aj nové lokalizácie.
  • Vývoj potom pokračuju vkladaním nového kódu do kódového repozitára takže testeri môžu overiť jeho stabilitu a použiteľnosť.
  • Keď je už tento kód považovaný za stabilný, vydá sa predbežná (testovacia) verzia (v súčasnosti 1.8). Predbežná verzia obsahuje nový kód ale používateľská príručka je v stave stabilnej verzie. Nakoniec budú zahrnuté nové lokalizácie starého vydania.
  • Keď bola používateľská príručka doplnená o vlastnosti predbežnej verzie, vydá sa stabilná verzia a začne sa nový vývojový cyklus.

Aktuálna stabilná verzia, 1.7.3_1,[3] má vlastnosti ako sú flexibilné pravidlá segmentácie ktoré umožäujú segmentáciu podľa viet, výrazne zlepšenú podporu TMX (až do 1.4b level2), vyhľadávanie založené na regulárnych výrazoch, podpora DocBook, a nové grafické používateľské rozhranie. V porovnaní s predchádzajúcou verziou 1.6, nová verzia 1.7 obsahuje 18 vylepšení funkčnosti, vrátane priamej podpory Office 2007 XML, a 36 opráv chýb. Používateľská príručka bola úplne prepracovaná, a už je k dispozícii v angličtine a ďalších siedmich jazykoch. Program je dostupný v 27 jazykoch.

Aktuálna predbežná verzia, 1.8, [4] obsahuje 13 vylepšení funkčnosti, ako je kontrola pravopisu. Pomocou Hunspell, rovnaký základ pre solvníky ako je v OpenOffice.org a Firefoxe, umožňuje kontrolu pravopisu vo viac než 80 jazykoch. .

Postup práce v OmegaT[upraviť | upraviť zdroj]

Používateľ umiestní zdrojové dokumenty, existujúce prekladové pamäte a akékoľvek slovníky do príslušných podpriečinkov prekladového projektu. Keď sa projekt "otvorí", OmegaT extrahuje preložiteľný text zo všetkých rozpoznaných dokumentov. Ako prekladateľ prekladá každý segment, OmegaT pridáva prekladové jednotky do prekladovej pamäte. Nakoniec, OmegaT vytvorí cieľové dokumenty zlúčením prekladovej pamäte so zdrojovými dokumentmi.

Počas prekladu, sa v priľahlom okne Zhody/Slovníka zobrazujú približne zhodné výrazy z prekladovej pamäte a zhodné termíny zo slovníkov pre aktuálny segment. Približne zhodné výrazy prekladateľ vkladá pomocou klávesových skratiek. Približne zhodné výrazy ktoré presahujú úroveň nastaviteľnú používateľom môžu byť voliteľne vkladané automaticky.

Prekladateľ môže kedykoľvek prejsť na iný dokument v tom istom projekte pomocou okna pre zobrazenie Súborov projektu, alebo na iný segment v rovnakom súbore pomocou klávesových skratiek alebo dvojkliknutím na príslušný segment.

Kedykoľvek sa do projektu pridajú ďalšie zdrojové dokumenty, prekladové pamäte alebo slovníky alebo sa v tých súboroch vykonajú manuálne zmeny, musí prekladateľ projekt "znovu načítať", aby program OmegaT rozpoznal novo pridané segmenty. Projekt musí byť tiež znovu načítaný aj vtedy keď sa uprostred prekladu urobia zmeny v pravidlách segmentácie.

Spolupráca medzi prekladateľmi[upraviť | upraviť zdroj]

Prekladatelia používajúci rôzne nástroje pre počítačom podporovaný preklad môžu zdieľať iba svoje prekladové pamäte ak (a) jeden alebo obidva z ich programov môžu importovať a/alebo exportovať proprietárny formát toho druhého programu alebo (b) obidva programy môžu importovať a exportovať nezávislý formát. OmegaT umožňuje druhú možnosť. Môže importovať a exportovať nezávislý štandardný priemyselný formát TMX (Translation Memory eXchange).

Súbory slovníka programu OmegaT sú obyčajné textové súbory s položkami oddelenými pomocou tabulátora so zdrojovým pojmom v prvom stĺpci a cieľovým textom v druhom stĺpci, tretí stĺpec môže byť použitý na čokoľvek (napr. komentáre používateľa. Ďalšie stĺpce program OmegaT ignoruje. OmegaT nepodporuje štandardný priemyselný formát pre slovníky TBX ktorý navrhuje LISA.[5]

Podporované formáty zdrojových dokumentov[upraviť | upraviť zdroj]

OmegaT môže priamo prekladať nasledujúce formáty:

S formátovanými dokumentmi zaobchádza pomocou značkovaného textu spôsobom podobným s inými komerčnými nástrojmi prekladových pamätí.

V súčasnosti, OmegaT nepodporuje priamo formáty súborov ako sú WordML, ExcelML, a Latex, alebo formáty ako neočistené súbory RTF Tradosu alebo TTX súbory. Neočistené súbory RTF je možné prekladať úpravou pravidiel segmentácie po konverzii do podporovaného formátu.

Nepodporované formáty súborov možno pre OmegaT sprístupniť pomocou doplnkových nástrojov ako sú:

OpenOffice.org[upraviť | upraviť zdroj]

OmegaT neposkytuje priamu podporu pre formáty Microsoft Office - Word, Excel a PowerPoint. Avšak, OpenOffice.org (a varianty)[7] možno použiť na konverziu takýchto formátov do formátu OpenDocument, ktorý OmegaT natívne podporuje. Ale aktuálna verzia (1.7.3) priamo podporuje formáty súborov MS Office 2007.

Translate Toolkit[upraviť | upraviť zdroj]

Translate Toolkit, sada nástrojov v jazyku python, poskytuje používateľom niekoľko konvertorov do a z Portable Object, vrátane súbory Mozilla .properties a dtd, súborov CSV, súborov Qt .ts, súborov XLIFF. Obsahuje niekoľko nástrojov pre manipuláciu s takýmito súbormi pred alebo po ich inštalácii v OmegaT.

po4a[upraviť | upraviť zdroj]

Formáty súborov ako LaTeX, TeX, POD atď môžu byť skonvertované do a z Portable Object pomocou nástroja po4a.[8]

Okapi Framework[upraviť | upraviť zdroj]

Text Extraction Utility (Nástroj pre extrakciu textu) z Okapi Framework má voľbu pre vytvorenie stromu priečinkov projektu OmegaT.[9] čo sprístupňuje v ďalšie cudzie formáty pre OmegaT. Okapi je aplikácia .Net 2.0 a vyžaduje pre svoje fungovanie Windows. Nebude fungovať na slobodných implementáciách .Net ktoré nepodporujú .Net 2.0. Je tiež možné vytvoriť súbor XLIFF špecifický pre OmegaT v aktuálnej predbežnej verzii (1.7.2).

Podporované formáty pamätí a slovníkov[upraviť | upraviť zdroj]

Interný formát prekladovej pamäte OmegaT nie je pre používateľa viditeľný, ale vždy pri automatickom uložení prekladového projektu, sa všetky nové alebo aktualizované prekladové jednotky automaticky exportujú a pridajú do troch externých TMX pamätí: natívneho TMX OmegaT, level 1 TMX a level 2 TMX.

  • Natívny TMX súbor je pre použitie v projektoch OmegaT.
  • Súbor level 1 TMX uchováva textové informácie a možno ho použiť s CAT nástrojmi podporujúcimi TMX level 1 a 2.

Súbor level 2 uchováva textové informácie ako aj informácie o značkách v texte a možno ho použiť s CAT nástrojmi podporujúcimi TMX level 2.

Exportované súbory level 2 obsahujú interné značky OmegaT vložené do značiek TMX čo umožňuje takýmto TMX súborom generovať zhodné výrazy v CAT nástrojoch podporujúcich TMX level 2. Testy boli kladné v programoch Trados a SDLX.

OmegaT môže importovať súbory TMX do verzie 1.4b level 1 ako aj level 2. Súbory level 2 importované do OmegaT nebudú generovať zhody v rovnakom rozsahu keďže OmegaT ignoruje obsah formátovacieho vloženého osahu. OmegaT rozpoznáva svoje vlastné súbory TMX level 2 bez problémov čo umožňuje ich použitie v iných projektoch OmegaT ako keby to boli natívne TMX súbory OmegaT. Tu znova, testy boli kladné so súbormi TMX vytvorenými pomocou programov DVX, Trados a SDLX.

Pre slovníky, používa obyčajné textové súbory s položkami oddelenými tabulátorom. Štruktúra súborov slovníka je extrémne jednoduchá: prvý stĺpec obsahuje slovo v zdrojovom jazyku, druhý stĺpec obsahuje zodpovedajúce slová v cieľovom jazyku, tretí stĺpec (voliteľný) môže obsahovať čokoľvek vrátane komentárov o kontexte atď. Takéto slovníky možno jednoducho vytvoriť exportovaním 3-stĺpcových tabuľkových dokumentov do formátu CSV s nasledujúcimi parametrami: oddeľovač poľa={tabulátor}, oddeľovač slov={medzera}.

Dokumentácia[upraviť | upraviť zdroj]

Keď sa OmegaT spustí, zobrazí sa rýchly sprievodca nazvyný "Rýchly začiatok". V inštalácii OmegaT sa nachádza rozsiahla Používateľská príručka. Obidva dokumenty preložili dobrovoľníci do niekoľkých jazykov. Nakoniec, archivované správy používateľských skupín OmegaT sú verejne prístupné bez registrácie.

Lokalizácie[upraviť | upraviť zdroj]

Používateľské rozhranie OmegaT a sprievodná dokumentácia sú prekladané dobrovoľníkmi.[10]

Aktuálna stabilná verzia (1.7.3 aktualizácia 1) je lokalizovaná do nasledujúcich jazykov:

  • Úplné lokalizácie (okrem iných dokumentov obsahujú grafické používateľské rozhranie - GUI - a príručku):
    • baskická
    • katalánska
    • holandská
    • maďarská
    • ruská
    • srbochorvátska
    • slovinská
  • Čiastočné lokalizácie (obsahujú GUI a tutoriál, niekedy príručku zo série 1.6):
    • albánska
    • bieloruská
    • česká
    • dánska
    • esperantská
    • francúzska
    • nemecká
    • grécka (iba GUI)
    • japonská
    • talianska
    • poľská
    • portugalská (Brazília)
    • zjednodušená čínska
    • slovenská
    • španielska
    • tradičná čínska
    • turecká
    • ukrajinská

Pre celkovo 27 jazykov.

Projekt OmegaT[upraviť | upraviť zdroj]

Projekt OmegaT je tiež druhom skupiny "počítačovej gramotnosti" ktorá sa sústreďuje na potreby prekladateľov.

Používatelia OmegaT sú vítaní pri prispievaní nástrojmi ktoré sami napísali na základe potrieb prekladateľov ktoré ešte nepokrýva samotný hlavný program OmegaT.[11]

Príbuzný softvér[upraviť | upraviť zdroj]

Nástroje vytvorené prispievateľmi do OmegaT[upraviť | upraviť zdroj]

Prispievatelia do OmegaT vytvorili niekoľko nástrojov pre účely použitia v spojení s OmegaT. Niektoré z nich sú užitočné iba s predchádzajúcimi verziami OmegaT.

Nájdete ich alebo na webovej stránke OmegaT[12] alebo na webovom pristore používateľskej e-mailovej konferencie:[13]

  • segmentovacie makrá OpenOffice.org od Benjamina Sibanda
  • zarovnávací nástroj od Didiera Briela
  • zárovnnávací nástroj od Dmitriho Gabinského
  • Dmitriho Wordfast TMX konvertor
  • Dmitriho nástroja na výber jazyka
  • nástroj na zlúčenie TMX od Henryho Pijffersa
  • Henryho nástroj na očistenie TMX
  • externá kontrola pravopisu od Marca Priora
  • Marcov nástroj na segmentáciu viet
  • makro na odstránenie interných značiek z TMX súborov od Sonje Tomaskovic
  • zbierka skriptov Samuela Murraya

Pozri aj[upraviť | upraviť zdroj]

Externé odkazy[upraviť | upraviť zdroj]

Používateľská skupina[upraviť | upraviť zdroj]

Referencie[upraviť | upraviť zdroj]

  1. OmegaT registered trademark use policy
  2. OmegaT development site Podávanie požiadaviek na vylepšenia a hlásení o chybách
  3. OmegaT stable version 1.7.3 update 1 has been released - vydané 17. feb. 2008
  4. OmegaT test version 1.8 released - vydané 2. marca 2008
  5. LISA - Localization Industry Standards Association
  6. Open Document Format for Office Applications - formát ISO/IEC 26300:2006
  7. OpenOffice.org - voľne šíriteľný kancelársky balík ktorý ponúka konverzné filtre do a z najpoužívanejších formátov súborov Microsoft Office
  8. po4a - konverzný nástroj do a z formátu Portable Object, aplikácia perlu nachádzajúca sa ako balíček v Debiane
  9. Okapi Framework - nástroj na extrakciu textu môže vytvárať stromy priečinkov projektu OmegaT
  10. Localization process ako prispieť prekladom
  11. OmegaT Getting Involved - prekladatelia sú povzbudzovaní písať svoje vlastné doplnkové nástroje
  12. OmegaT Resources - nástroje tretích strán na webovej stránke OmegaT
  13. OmegaT Files - nástroje tretích strán na webovom priestore e-mailovej konferencie OmegaT (je potrebná registrácia)