Apertium
Apertium | |
Logo | |
Základné informácie | |
---|---|
Posledná stabilná verzia | 3.4.2 (15. máj 2016 ) |
Vyvinutý v | C++ |
Operačný systém | POSIX kompatibilné |
Lokalizácia | viacjazyčný |
Typ softvéru | Strojový preklad |
Licencia | GNU General Public License |
Ďalšie odkazy | |
Webová stránka | www.apertium.org |
Pozri aj Informačný portál |
Apertium je rule-based platforma pre strojový preklad. Apertium je otvorený softvér vydaný pod GNU General Public License licenciou.
História
[upraviť | upraviť zdroj]Apertium vzniklo ako jeden z engine-ov pre strojový preklad v projekte OpenTrad, ktorý bol sponzorovaný španielskou vládou. Pôvodne bolo navrhnuté na preklad úzko súvisiacich jazykov, aj keď nedávno expandovalo, aby obsiahlo aj navzájom odlišnejšie jazyky. Pre vytvorenie nového systému pre strojový preklad je potrebné len vyvinúť lingvistické dáta (slovníky, pravidlá) v dobre špecifikovanom XML formáte.
Jazykové dáta vyvinuté pre Apertium (v spolupráci s Universidade de Vigo, Universitat Politècnica de Catalunya a Universitat Pompeu Fabra) momentálne podporujú (v stabilnej verzii) astúrčinu, baskitčinu, bretónčinu, bulharčinu, katalánčinu, dánčinu, angličtinu, Esperanto, francúzštinu, galčinu, islandčinu, macedónčinu, nórčinu (Bokmål a Nynorsk), okcitánčinu, portugalčinu, románčinu, španielčinu, švédčinu a waleštinu. Úplný zoznam jazykov je uvedený nižšie. Vo vývoji projektu Apertium je zapojených aj niekoľko spoločností, vrátane Prompsit Language Engineering, Imaxin Software a Eleka Ingeniaritza Linguistikoa.
Apertium je shallow-transfer systém pre strojový preklad, ktorý používa finite state transducery na všetky lexikálne transformácie, a skrytý Markovov model na part-of-speech tagging (t. j. gramatickú analýzu slovných druhov) alebo rozoznávanie slovných druhov. Pre niektoré dvojice jazykov (napr. bretónčina-francúzština) sú použité taktiež Constraint Grammar tagger-e.
Projekt sa zúčastnil v programe Google Summer of Code 2009 a 2010, a taktiež v Google Code-in 2010.[1]
Dvojice jazykov
[upraviť | upraviť zdroj]Zoznam momentálne stabilných dvojíc jazykov; ukázanie kurzorom na kód jazyka zobrazí jazyk, ktorý daný kód reprezentuje.
ast
|
eu
|
br
|
bg
|
ca
|
da
|
en
|
eo
|
fr
|
gl
|
is
|
mk
|
nb
|
nn
|
oc
|
pt
|
ro
|
es
|
sv
|
cy
| |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Astúrčina | — | nie | nie | nie | nie | nie | nie | nie | nie | nie | nie | nie | nie | nie | nie | nie | nie | áno (⇄) | nie | nie |
Baskitčina | nie | — | nie | nie | nie | nie | nie | nie | nie | nie | nie | nie | nie | nie | nie | nie | nie | áno (→) | nie | nie |
Bretónčina | nie | nie | — | nie | nie | nie | nie | nie | áno (→) | nie | nie | nie | nie | nie | nie | nie | nie | nie | nie | nie |
Bulharčina | nie | nie | nie | — | nie | nie | nie | nie | nie | nie | nie | áno (⇄) | nie | nie | nie | nie | nie | nie | nie | nie |
Katalánčina | nie | nie | nie | nie | — | nie | áno (⇄) | áno (←) | áno (⇄) | nie | nie | nie | nie | nie | áno (⇄) | áno (⇄) | nie | áno (⇄) | nie | nie |
Dánčina | nie | nie | nie | nie | nie | — | nie | nie | nie | nie | nie | nie | nie | nie | nie | nie | nie | nie | áno (←) | nie |
Angličtina | nie | nie | nie | nie | áno (⇄) | nie | — | áno (⇄) | nie | áno (⇄) | áno (←) | áno (←) | nie | nie | nie | nie | nie | áno (⇄) | nie | áno (←) |
Esperanto | nie | nie | nie | nie | áno (←) | nie | áno (⇄) | — | nie | nie | nie | nie | nie | nie | nie | nie | nie | áno (←) | nie | nie |
Francúzština | nie | nie | áno (←) | nie | áno (⇄) | nie | nie | nie | — | nie | nie | nie | nie | nie | nie | nie | nie | áno (⇄) | nie | nie |
Gálčina | nie | nie | nie | nie | nie | nie | áno (⇄) | nie | nie | — | nie | nie | nie | nie | nie | áno (⇄) | nie | áno (⇄) | nie | nie |
Islandčina | nie | nie | nie | nie | nie | nie | áno (→) | nie | nie | nie | — | nie | nie | nie | nie | nie | nie | nie | nie | nie |
Macedónčina | nie | nie | nie | áno (⇄) | nie | nie | áno (→) | nie | nie | nie | nie | — | nie | nie | nie | nie | nie | nie | nie | nie |
Nórčina (Bokmål) | nie | nie | nie | nie | nie | nie | nie | nie | nie | nie | nie | nie | — | áno (⇄) | nie | nie | nie | nie | nie | nie |
Nórčina (Nynorsk) | nie | nie | nie | nie | nie | nie | nie | nie | nie | nie | nie | nie | áno (⇄) | — | nie | nie | nie | nie | nie | nie |
Okcitánčina | nie | nie | nie | nie | áno (⇄) | nie | nie | nie | nie | nie | nie | nie | nie | nie | — | nie | nie | áno (⇄) | nie | nie |
Portugalčina | nie | nie | nie | nie | áno (⇄) | nie | nie | nie | nie | áno (⇄) | nie | nie | nie | nie | nie | — | nie | áno (⇄) | nie | nie |
Rumunčina | nie | nie | nie | nie | nie | nie | nie | nie | nie | nie | nie | nie | nie | nie | nie | nie | — | áno (←) | nie | nie |
Španielčina | áno (⇄) | áno (←) | nie | nie | áno (⇄) | nie | áno (⇄) | áno (⇄) | áno (⇄) | nie | nie | nie | nie | nie | áno (⇄) | áno (⇄) | áno (←) | — | nie | nie |
Švédčina | nie | nie | nie | nie | nie | áno (→) | nie | nie | nie | nie | nie | nie | nie | nie | nie | nie | nie | nie | — | nie |
Waleština | nie | nie | nie | nie | nie | nie | áno (→) | nie | nie | nie | nie | nie | nie | nie | nie | nie | nie | nie | nie | — |
Pozri aj
[upraviť | upraviť zdroj]Referencie
[upraviť | upraviť zdroj]- Corbí-Bellot, M. et al. (2005) "An open-source shallow-transfer machine translation engine for the romance languages of Spain" in Proceedings of the European Association for Machine Translation, 10th Annual Conference, Budapest 2005, pp. 79–86
- Armentano-Oller, C. et al. (2006) "Open-source Portuguese-Spanish machine translation" in Lecture Notes in Computer Science 3960 [Computational Processing of the Portuguese Language, Proceedings of the 7th International Workshop on Computational Processing of Written and Spoken Portuguese, PROPOR 2006], p 50-59.
- ↑ stránka Google Summer of Code [online]. [Cit. 2010-11-23]. Dostupné online. Archivované 2011-03-16 z originálu.
Externé odkazy
[upraviť | upraviť zdroj]Zdroj
[upraviť | upraviť zdroj]Tento článok je čiastočný alebo úplný preklad článku Apertium na anglickej Wikipédii.