Data de actualización: 11/4/2019
Versión: 2.7
O Centro Ramón Piñeiro para a investigación en humanidades inclúe entre os seus obxectivos fundacionais o desenvolvemento de recursos informáticos que axuden á incorporación da lingua galega ao mundo das novas tecnoloxías.
Con esta premisa desenvólvese XIADA, un etiquetador estatístico de alta precisión que empregamos para etiquetar e lematizar automaticamente os documentos do Corpus de Referencia do Galego Actual (CORGA), e poder así dar un salto cualitativo na recuperación de información formulando consultas que utilizan información gramatical (etiquetas, lemas, clases de palabras, trazos morfosintácticos etc.).
Nesta páxina póñense á súa disposición:
- os recursos que emprega o etiquetador:
- corpus de adestramento (descarga)
- léxico (descarga)
- etiquetario e exemplos de uso
- o propio etiquetador:
- demostración en liña
- código (descarga)