Apertium

z Wikipédie, slobodnej encyklopédie
Prejsť na: navigácia, hľadanie
Apertium
Apertium-tolk.png
Základné informácie
Posledná stabilná verzia 3.1.1 (21. máj 2009)
Operačný systém POSIX kompatibilné
Dostupné jazyky viacjazyčný
Typ softvéru Strojový preklad
Licencia GNU General Public License
Ďalšie odkazy
Webová stránka www.apertium.org

Computer n screen.svg Pozri aj Informačný portál

Apertium je rule-based platforma pre strojový preklad. Apertium je otvorený softvér vydaný pod GNU General Public License licenciou.

História[upraviť | upraviť zdroj]

Apertium vzniklo ako jeden z engine-ov pre strojový preklad v projekte OpenTrad, ktorý bol sponzorovaný španielskou vládou. Pôvodne bolo navrhnuté na preklad úzko súvisiacich jazykov, aj keď nedávno expandovalo, aby obsiahlo aj navzájom odlišnejšie jazyky. Pre vytvorenie nového systému pre strojový preklad je potrebné len vyvinúť lingvistické dáta (slovníky, pravidlá) v dobre špecifikovanom XML formáte.

Jazykové dáta vyvinuté pre Apertium (v spolupráci s Universidade de Vigo, Universitat Politècnica de Catalunya a Universitat Pompeu Fabra) momentálne podporujú (v stabilnej verzii) astúrčinu, baskitčinu, bretónčinu, bulharčinu, katalánčinu, dánčinu, angličtinu, Esperanto, francúzštinu, gálčinu, islandčinu, macedónčinu, nórčinu (Bokmål a Nynorsk), okcitánčinu, portugalčinu, románčinu, španielčinu, švédčinu a waleštinu. Úplný zoznam jazykov je uvedený nižšie. Vo vývoji projektu Apertium je zapojených aj niekoľko spoločností, vrátane Prompsit Language Engineering, Imaxin Software a Eleka Ingeniaritza Linguistikoa.

Apertium je shallow-transfer systém pre strojový preklad, ktorý používa finite state transducery na všetky lexikálne transformácie, a skrytý Markovov model na part-of-speech tagging (t. j. gramatickú analýzu slovných druhov) alebo rozoznávanie slovných druhov. Pre niektoré dvojice jazykov (napr. bretónčina-francúzština) sú použité taktiež Constraint Grammar tagger-e.

Projekt sa zúčastnil v programe Google Summer of Code 2009 a 2010, a taktiež v Google Code-in 2010.[1]

Dvojice jazykov[upraviť | upraviť zdroj]

Zoznam momentálne stabilných dvojíc jazykov; ukázanie kurzorom na kód jazyka zobrazí jazyk, ktorý daný kód reprezentuje.

ast eu br bg ca da en eo fr gl is mk nb nn oc pt ro es sv cy
Astúrčina nie nie nie nie nie nie nie nie nie nie nie nie nie nie nie nie áno (⇄) nie nie
Baskitčina nie nie nie nie nie nie nie nie nie nie nie nie nie nie nie nie áno (→) nie nie
Bretónčina nie nie nie nie nie nie nie áno (→) nie nie nie nie nie nie nie nie nie nie nie
Bulharčina nie nie nie nie nie nie nie nie nie nie áno (⇄) nie nie nie nie nie nie nie nie
Katalánčina nie nie nie nie nie áno (⇄) áno (←) áno (⇄) nie nie nie nie nie áno (⇄) áno (⇄) nie áno (⇄) nie nie
Dánčina nie nie nie nie nie nie nie nie nie nie nie nie nie nie nie nie nie áno (←) nie
Angličtina nie nie nie nie áno (⇄) nie áno (⇄) nie áno (⇄) áno (←) áno (←) nie nie nie nie nie áno (⇄) nie áno (←)
Esperanto nie nie nie nie áno (←) nie áno (⇄) nie nie nie nie nie nie nie nie nie áno (←) nie nie
Francúzština nie nie áno (←) nie áno (⇄) nie nie nie nie nie nie nie nie nie nie nie áno (⇄) nie nie
Gálčina nie nie nie nie nie nie áno (⇄) nie nie nie nie nie nie nie áno (⇄) nie áno (⇄) nie nie
Islandčina nie nie nie nie nie nie áno (→) nie nie nie nie nie nie nie nie nie nie nie nie
Macedónčina nie nie nie áno (⇄) nie nie áno (→) nie nie nie nie nie nie nie nie nie nie nie nie
Nórčina (Bokmål) nie nie nie nie nie nie nie nie nie nie nie nie áno (⇄) nie nie nie nie nie nie
Nórčina (Nynorsk) nie nie nie nie nie nie nie nie nie nie nie nie áno (⇄) nie nie nie nie nie nie
Okcitánčina nie nie nie nie áno (⇄) nie nie nie nie nie nie nie nie nie nie nie áno (⇄) nie nie
Portugalčina nie nie nie nie áno (⇄) nie nie nie nie áno (⇄) nie nie nie nie nie nie áno (⇄) nie nie
Rumunčina nie nie nie nie nie nie nie nie nie nie nie nie nie nie nie nie áno (←) nie nie
Španielčina áno (⇄) áno (←) nie nie áno (⇄) nie áno (⇄) áno (⇄) áno (⇄) nie nie nie nie nie áno (⇄) áno (⇄) áno (←) nie nie
Švédčina nie nie nie nie nie áno (→) nie nie nie nie nie nie nie nie nie nie nie nie nie
Waleština nie nie nie nie nie nie áno (→) nie nie nie nie nie nie nie nie nie nie nie nie

Pozri aj[upraviť | upraviť zdroj]

Referencie[upraviť | upraviť zdroj]

  • Corbí-Bellot, M. et al. (2005) "An open-source shallow-transfer machine translation engine for the romance languages of Spain" in Proceedings of the European Association for Machine Translation, 10th Annual Conference, Budapest 2005, pp. 79–86
  • Armentano-Oller, C. et al. (2006) "Open-source Portuguese-Spanish machine translation" in Lecture Notes in Computer Science 3960 [Computational Processing of the Portuguese Language, Proceedings of the 7th International Workshop on Computational Processing of Written and Spoken Portuguese, PROPOR 2006], p 50-59.

Externé odkazy[upraviť | upraviť zdroj]

Zdroj[upraviť | upraviť zdroj]

Tento článok je čiastočný alebo úplný preklad článku Apertium na anglickej Wikipédii.