XIADA: Etiquetador/Lematizador do Galego Actual

XIADA

Data de actualización: 11/4/2019
Versión: 2.7

O Centro Ramón Piñeiro para a investigación en humanidades inclúe entre os seus obxectivos fundacionais o desenvolvemento de recursos informáticos que axuden á incorporación da lingua galega ao mundo das novas tecnoloxías.

Con esta premisa desenvólvese XIADA, un etiquetador estatístico de alta precisión que empregamos para etiquetar e lematizar automaticamente os documentos do Corpus de Referencia do Galego Actual (CORGA), e poder así dar un salto cualitativo na recuperación de información formulando consultas que utilizan información gramatical (etiquetas, lemas, clases de palabras, trazos morfosintácticos etc.).

Nesta páxina póñense á súa disposición:

  1. os recursos que emprega o etiquetador:
    • corpus de adestramento (descarga)
    • léxico (descarga)
    • etiquetario e exemplos de uso
  2. o propio etiquetador:
    • demostración en liña
    • código (descarga)