Corpus de Referencia do Galego Actual

Listaxe de documentos contidos na base de datos

Na súa versión actual, 4.0, o corpus etiquetado manualmente dispoñible para consulta consta de 617.494 palabras ortográficas (742.045 elementos gramaticais), que se distribúen da seguinte forma:

Palabras ortográficas
Frecuencias
Frecuencia Palabras ortográficas Frecuencia normalizada Frecuencia normalizada acumulada Frecuencia das palabras Frecuencia normalizada Frecuencia normalizada acumulada
> 5000 16 0,03 % 0,03 % 226.110,0 32,06 % 32,06 %
1000 < F ≤ 5000 44 0,07 % 0,1 % 86.991,0 12,34 % 44,4 %
500 < F ≤ 1000 54 0,09 % 0,19 % 37.647,0 5,34 % 49,74 %
100 < F ≤ 500 489 0,83 % 1,03 % 99.004,0 14,04 % 63,78 %
25 < F ≤ 100 1938 3,3 % 4,32 % 92.847,0 13,17 % 76,95 %
10 < F ≤ 25 3148 5,36 % 9,68 % 50.391,0 7,15 % 84,09 %
4 < F ≤ 10 5875 9,99 % 19,67 % 40.067,0 5,68 % 89,77 %
2 < F ≤4 6784 11,54 % 31,21 % 22.905,0 3,25 % 93,02 %
F=2 8766 14,91 % 46,12 % 17.532,0 2,49 % 95,51 %
F=1 31.672 53,88 % 100,0 % 31.672,0 4,49 % 100,0 %
Lustro
Palabras ortográficas Documentos Frec. norm. (por millón)
1975-1979 219 1 311
1980-1984 18.966 21 26.896
1985-1989 9386 6 13.310
1990-1994 80.612 54 114.316
1995-1999 139.234 316 197.449
2000-2004 118.882 369 168.587
2005-2009 226.319 867 320.944
2010-2014 23.876 39 33.859
Medio
Palabras ortográficas Documentos Frec. norm. (por millón)
Libro 252.545 476 358.136
Revista 35.122 28 49.807
Xornal 329.827 1169 467.730
Orixe
Palabras ortográficas Documentos Frec. norm. (por millón)
Escrita 617.494 1673 875.672
Bloque
Palabras ortográficas Documentos Frec. norm. (por millón)
Ficción 252.545 476 358.136
Non ficción 364.949 1197 517.536
Subtipo
Palabras ortográficas Documentos Frec. norm. (por millón)
Relato curto 252.545 476 358.136
Revista 35.122 28 49.807
Xornal 329.827 1169 467.730
Xénero
Palabras ortográficas Documentos Frec. norm. (por millón)
Narrativo 252.545 476 358.136
Xornalístico 364.949 1197 517.536
Sexo
Palabras ortográficas Documentos Frec. norm. (por millón)
Non aplica 617.494 1673 875.672
Área temática
Palabras ortográficas Documentos Frec. norm. (por millón)
Economía e política 295.566 936 419.144
Cultura e artes 39.749 133 56.368
Ciencias sociais 70.709 182 100.273
Ciencias e tecnoloxía 29.824 102 42.294
Outros 87.547 331 124.151
Sen clasificar 252.545 476 358.136
Elementos gramaticais
Frecuencias
Frecuencia Elementos gramaticais Frecuencia normalizada Frecuencia normalizada acumulada Frecuencia dos elementos Frecuencia normalizada Frecuencia normalizada acumulada
> 5000 17 0,03 % 0,03 % 322.435,0 43,4 % 43,4 %
1000 < F ≤ 5000 36 0,07 % 0,1 % 62.463,0 8,41 % 51,8 %
500 < F ≤ 1000 50 0,1 % 0,2 % 33.430,0 4,5 % 56,3 %
100 < F ≤ 500 452 0,88 % 1,07 % 88.240,0 11,88 % 68,18 %
25 < F ≤ 100 1836 3,56 % 4,63 % 87.154,0 11,73 % 79,91 %
10 < F ≤ 25 3022 5,85 % 10,48 % 48.555,0 6,54 % 86,45 %
4 < F ≤ 10 5498 10,65 % 21,13 % 37.513,0 5,05 % 91,49 %
2 < F ≤4 6171 11,95 % 33,08 % 20.903,0 2,81 % 94,31 %
F=2 7738 14,98 % 48,06 % 15.476,0 2,08 % 96,39 %
F=1 26.820 51,94 % 100,0 % 26.820,0 3,61 % 100,0 %
Lustro
Elementos gramaticais Documentos Frec. norm. (por millón)
1975-1979 259 1 349
1980-1984 23.511 21 31.644
1985-1989 11.256 6 15.150
1990-1994 101.656 54 136.820
1995-1999 166.936 316 224.682
2000-2004 140.504 369 189.106
2005-2009 268.494 867 361.370
2010-2014 29.429 39 39.609
Medio
Elementos gramaticais Documentos Frec. norm. (por millón)
Libro 315.763 476 424.990
Revista 41.546 28 55.917
Xornal 384.736 1169 517.822
Orixe
Elementos gramaticais Documentos Frec. norm. (por millón)
Escrita 742.045 1673 998.729
Bloque
Elementos gramaticais Documentos Frec. norm. (por millón)
Ficción 315.763 476 424.990
Non ficción 426.282 1197 573.739
Subtipo
Elementos gramaticais Documentos Frec. norm. (por millón)
Relato curto 315.763 476 424.990
Revista 41.546 28 55.917
Xornal 384.736 1169 517.822
Xénero
Elementos gramaticais Documentos Frec. norm. (por millón)
Narrativo 315.763 476 424.990
Xornalístico 426.282 1197 573.739
Sexo
Elementos gramaticais Documentos Frec. norm. (por millón)
Non aplica 742.045 1673 998.729
Área temática
Elementos gramaticais Documentos Frec. norm. (por millón)
Economía e política 346.073 936 465.785
Cultura e artes 45.539 133 61.292
Ciencias sociais 82.406 182 110.911
Ciencias e tecnoloxía 34.567 102 46.524
Outros 101.690 331 136.866
Sen clasificar 315.763 476 424.990