XIADA: Etiquetador/Lematizador do Galego Actual

XIADA

Data de actualización: 19/2/2024
Versión: 2.9

O Centro Ramón Piñeiro para a investigación en humanidades inclúe entre os seus obxectivos fundacionais o desenvolvemento de recursos informáticos que axuden á incorporación da lingua galega ao mundo das novas tecnoloxías.

Con esta premisa desenvólvese XIADA, un etiquetador estatístico de alta precisión que empregamos para etiquetar e lematizar automaticamente os documentos do Corpus de Referencia do Galego Actual (CORGA), e poder así dar un salto cualitativo na recuperación de información formulando consultas que utilizan información gramatical (etiquetas, lemas, clases de palabras, trazos morfosintácticos etc.).

Nesta páxina póñense á súa disposición:

  1. Os recursos que emprega o etiquetador:
    • Corpus de adestramento (descarga)
    • Léxico (descarga)
    • Etiquetario e exemplos de uso
  2. O propio etiquetador:
    • Demostración en liña
    • Anotación morfosintáctica de arquivos de texto
    • Código (descarga)
  3. Un flexionador