Corpus de Referencia do Galego Actual

Listaxe de documentos contidos na base de datos

Na súa versión actual, 4.1, o corpus etiquetado manualmente dispoñible para consulta consta de 616.693 palabras ortográficas (741.559 elementos gramaticais), que se distribúen da seguinte forma:

Palabras ortográficas
Frecuencias
Frecuencia Palabras ortográficas Frecuencia normalizada Frecuencia normalizada acumulada Frecuencia das palabras Frecuencia normalizada Frecuencia normalizada acumulada
> 5000 16 0,03 % 0,03 % 226.640,0 32,1 % 32,1 %
1000 < F ≤ 5000 44 0,08 % 0,1 % 87.107,0 12,34 % 44,44 %
500 < F ≤ 1000 54 0,09 % 0,19 % 37.658,0 5,33 % 49,77 %
100 < F ≤ 500 490 0,84 % 1,03 % 99.161,0 14,04 % 63,82 %
25 < F ≤ 100 1942 3,31 % 4,34 % 93.004,0 13,17 % 76,99 %
10 < F ≤ 25 3154 5,38 % 9,72 % 50.506,0 7,15 % 84,14 %
4 < F ≤ 10 5875 10,02 % 19,75 % 40.064,0 5,67 % 89,82 %
2 < F ≤4 6773 11,55 % 31,3 % 22.869,0 3,24 % 93,06 %
F=2 8745 14,92 % 46,22 % 17.490,0 2,48 % 95,53 %
F=1 31.529 53,78 % 100,0 % 31.529,0 4,47 % 100,0 %
Lustro
Palabras ortográficas Documentos Frec. norm. (por millón)
1975-1979 220 1 312
1980-1984 18.943 21 26.830
1985-1989 9386 6 13.294
1990-1994 80.470 54 113.976
1995-1999 139.086 316 196.998
2000-2004 118.789 369 168.250
2005-2009 225.958 867 320.041
2010-2014 23.841 39 33.768
Medio
Palabras ortográficas Documentos Frec. norm. (por millón)
Libro 252.013 476 356.945
Revista 35.093 28 49.705
Xornal 329.587 1169 466.819
Orixe
Palabras ortográficas Documentos Frec. norm. (por millón)
Escrita 616.693 1673 873.468
Bloque
Palabras ortográficas Documentos Frec. norm. (por millón)
Ficción 252.013 476 356.945
Non ficción 364.680 1197 516.523
Subtipo
Palabras ortográficas Documentos Frec. norm. (por millón)
Relato curto 252.013 476 356.945
Revista 35.093 28 49.705
Xornal 329.587 1169 466.819
Xénero
Palabras ortográficas Documentos Frec. norm. (por millón)
Narrativo 252.013 476 356.945
Xornalístico 364.680 1197 516.523
Área temática
Palabras ortográficas Documentos Frec. norm. (por millón)
Economía e política 295.369 936 418.353
Cultura e artes 39.703 133 56.234
Ciencias sociais 70.578 182 99.965
Ciencias e tecnoloxía 29.801 102 42.209
Outros 87.507 331 123.943
Sen clasificar 252.013 476 356.945
Sexo-autor
Palabras ortográficas Documentos Frec. norm. (por millón)
Ambos 616.693 1673 873.468
Sexo-interlocutor
Palabras ortográficas Documentos Frec. norm. (por millón)
Non aplica 599.416 1673 848.997
Non pertinente 17.277 23 24.471
Elementos gramaticais
Frecuencias
Frecuencia Elementos gramaticais Frecuencia normalizada Frecuencia normalizada acumulada Frecuencia dos elementos Frecuencia normalizada Frecuencia normalizada acumulada
> 5000 17 0,03 % 0,03 % 321.786,0 43,34 % 43,34 %
1000 < F ≤ 5000 35 0,07 % 0,1 % 61.375,0 8,27 % 51,6 %
500 < F ≤ 1000 51 0,1 % 0,2 % 34.752,0 4,68 % 56,28 %
100 < F ≤ 500 452 0,88 % 1,08 % 88.300,0 11,89 % 68,18 %
25 < F ≤ 100 1838 3,58 % 4,66 % 87.283,0 11,76 % 79,93 %
10 < F ≤ 25 3024 5,88 % 10,54 % 48.598,0 6,55 % 86,48 %
4 < F ≤ 10 5496 10,7 % 21,24 % 37.508,0 5,05 % 91,53 %
2 < F ≤4 6166 12,0 % 33,24 % 20.884,0 2,81 % 94,34 %
F=2 7708 15,0 % 48,23 % 15.416,0 2,08 % 96,42 %
F=1 26.601 51,77 % 100,0 % 26.601,0 3,58 % 100,0 %
Lustro
Elementos gramaticais Documentos Frec. norm. (por millón)
1975-1979 258 1 347
1980-1984 23.498 21 31.647
1985-1989 11.246 6 15.146
1990-1994 101.583 54 136.812
1995-1999 166.829 316 224.685
2000-2004 140.429 369 189.129
2005-2009 268.307 867 361.355
2010-2014 29.409 39 39.608
Medio
Elementos gramaticais Documentos Frec. norm. (por millón)
Libro 315.521 476 424.942
Revista 41.496 28 55.887
Xornal 384.542 1169 517.900
Orixe
Elementos gramaticais Documentos Frec. norm. (por millón)
Escrita 741.559 1673 998.729
Bloque
Elementos gramaticais Documentos Frec. norm. (por millón)
Ficción 315.521 476 424.942
Non ficción 426.038 1197 573.786
Subtipo
Elementos gramaticais Documentos Frec. norm. (por millón)
Relato curto 315.521 476 424.942
Revista 41.496 28 55.887
Xornal 384.542 1169 517.900
Xénero
Elementos gramaticais Documentos Frec. norm. (por millón)
Narrativo 315.521 476 424.942
Xornalístico 426.038 1197 573.786
Área temática
Elementos gramaticais Documentos Frec. norm. (por millón)
Economía e política 345.879 936 465.828
Cultura e artes 45.512 133 61.295
Ciencias sociais 82.338 182 110.892
Ciencias e tecnoloxía 34.539 102 46.517
Outros 101.637 331 136.884
Sen clasificar 315.521 476 424.942
Sexo-autor
Elementos gramaticais Documentos Frec. norm. (por millón)
Ambos 741.559 1673 998.729
Sexo-interlocutor
Elementos gramaticais Documentos Frec. norm. (por millón)
Non aplica 720.854 1673 970.843
Non pertinente 20.705 23 27.885