Data de actualización: 19/2/2024
Versión: 2.9
O Centro Ramón Piñeiro para a investigación en humanidades inclúe entre os seus obxectivos fundacionais o desenvolvemento de recursos informáticos que axuden á incorporación da lingua galega ao mundo das novas tecnoloxías.
Con esta premisa desenvólvese XIADA, un etiquetador estatístico de alta precisión que empregamos para etiquetar e lematizar automaticamente os documentos do Corpus de Referencia do Galego Actual (CORGA), e poder así dar un salto cualitativo na recuperación de información formulando consultas que utilizan información gramatical (etiquetas, lemas, clases de palabras, trazos morfosintácticos etc.).
Nesta páxina póñense á súa disposición:
- Os recursos que emprega o etiquetador:
- Corpus de adestramento (descarga)
- Léxico (descarga)
- Etiquetario e exemplos de uso
- O propio etiquetador:
- Demostración en liña
- Anotación morfosintáctica de arquivos de texto
- Código (descarga)
- Un flexionador