Listaxe de documentos contidos na base de datos
Na súa versión actual, 4.1, o corpus etiquetado manualmente dispoñible para consulta consta de 616.693 palabras ortográficas (741.559 elementos gramaticais), que se distribúen da seguinte forma:
Palabras ortográficas
Frecuencias |
Frecuencia |
Palabras ortográficas |
Frecuencia normalizada |
Frecuencia normalizada acumulada |
Frecuencia das palabras |
Frecuencia normalizada |
Frecuencia normalizada acumulada |
> 5000 |
16 |
0,03 % |
0,03 % |
226.640,0 |
32,1 % |
32,1 % |
1000 < F ≤ 5000 |
44 |
0,08 % |
0,1 % |
87.107,0 |
12,34 % |
44,44 % |
500 < F ≤ 1000 |
54 |
0,09 % |
0,19 % |
37.658,0 |
5,33 % |
49,77 % |
100 < F ≤ 500 |
490 |
0,84 % |
1,03 % |
99.161,0 |
14,04 % |
63,82 % |
25 < F ≤ 100 |
1942 |
3,31 % |
4,34 % |
93.004,0 |
13,17 % |
76,99 % |
10 < F ≤ 25 |
3154 |
5,38 % |
9,72 % |
50.506,0 |
7,15 % |
84,14 % |
4 < F ≤ 10 |
5875 |
10,02 % |
19,75 % |
40.064,0 |
5,67 % |
89,82 % |
2 < F ≤4 |
6773 |
11,55 % |
31,3 % |
22.869,0 |
3,24 % |
93,06 % |
F=2 |
8745 |
14,92 % |
46,22 % |
17.490,0 |
2,48 % |
95,53 % |
F=1 |
31.529 |
53,78 % |
100,0 % |
31.529,0 |
4,47 % |
100,0 % |
Lustro |
|
Palabras ortográficas |
Documentos |
Frec. norm. (por millón) |
1975-1979 |
220 |
1 |
312 |
1980-1984 |
18.943 |
21 |
26.830 |
1985-1989 |
9386 |
6 |
13.294 |
1990-1994 |
80.470 |
54 |
113.976 |
1995-1999 |
139.086 |
316 |
196.998 |
2000-2004 |
118.789 |
369 |
168.250 |
2005-2009 |
225.958 |
867 |
320.041 |
2010-2014 |
23.841 |
39 |
33.768 |
Medio |
|
Palabras ortográficas |
Documentos |
Frec. norm. (por millón) |
Libro |
252.013 |
476 |
356.945 |
Revista |
35.093 |
28 |
49.705 |
Xornal |
329.587 |
1169 |
466.819 |
Orixe |
|
Palabras ortográficas |
Documentos |
Frec. norm. (por millón) |
Escrita |
616.693 |
1673 |
873.468 |
Bloque |
|
Palabras ortográficas |
Documentos |
Frec. norm. (por millón) |
Ficción |
252.013 |
476 |
356.945 |
Non ficción |
364.680 |
1197 |
516.523 |
Subtipo |
|
Palabras ortográficas |
Documentos |
Frec. norm. (por millón) |
Relato curto |
252.013 |
476 |
356.945 |
Revista |
35.093 |
28 |
49.705 |
Xornal |
329.587 |
1169 |
466.819 |
Xénero |
|
Palabras ortográficas |
Documentos |
Frec. norm. (por millón) |
Narrativo |
252.013 |
476 |
356.945 |
Xornalístico |
364.680 |
1197 |
516.523 |
Área temática |
|
Palabras ortográficas |
Documentos |
Frec. norm. (por millón) |
Economía e política |
295.369 |
936 |
418.353 |
Cultura e artes |
39.703 |
133 |
56.234 |
Ciencias sociais |
70.578 |
182 |
99.965 |
Ciencias e tecnoloxía |
29.801 |
102 |
42.209 |
Outros |
87.507 |
331 |
123.943 |
Sen clasificar |
252.013 |
476 |
356.945 |
Sexo-autor |
|
Palabras ortográficas |
Documentos |
Frec. norm. (por millón) |
Ambos |
616.693 |
1673 |
873.468 |
Sexo-interlocutor |
|
Palabras ortográficas |
Documentos |
Frec. norm. (por millón) |
Non aplica |
599.416 |
1673 |
848.997 |
Non pertinente |
17.277 |
23 |
24.471 |
Elementos gramaticais
Frecuencias |
Frecuencia |
Elementos gramaticais |
Frecuencia normalizada |
Frecuencia normalizada acumulada |
Frecuencia dos elementos |
Frecuencia normalizada |
Frecuencia normalizada acumulada |
> 5000 |
17 |
0,03 % |
0,03 % |
321.786,0 |
43,34 % |
43,34 % |
1000 < F ≤ 5000 |
35 |
0,07 % |
0,1 % |
61.375,0 |
8,27 % |
51,6 % |
500 < F ≤ 1000 |
51 |
0,1 % |
0,2 % |
34.752,0 |
4,68 % |
56,28 % |
100 < F ≤ 500 |
452 |
0,88 % |
1,08 % |
88.300,0 |
11,89 % |
68,18 % |
25 < F ≤ 100 |
1838 |
3,58 % |
4,66 % |
87.283,0 |
11,76 % |
79,93 % |
10 < F ≤ 25 |
3024 |
5,88 % |
10,54 % |
48.598,0 |
6,55 % |
86,48 % |
4 < F ≤ 10 |
5496 |
10,7 % |
21,24 % |
37.508,0 |
5,05 % |
91,53 % |
2 < F ≤4 |
6166 |
12,0 % |
33,24 % |
20.884,0 |
2,81 % |
94,34 % |
F=2 |
7708 |
15,0 % |
48,23 % |
15.416,0 |
2,08 % |
96,42 % |
F=1 |
26.601 |
51,77 % |
100,0 % |
26.601,0 |
3,58 % |
100,0 % |
Lustro |
|
Elementos gramaticais |
Documentos |
Frec. norm. (por millón) |
1975-1979 |
258 |
1 |
347 |
1980-1984 |
23.498 |
21 |
31.647 |
1985-1989 |
11.246 |
6 |
15.146 |
1990-1994 |
101.583 |
54 |
136.812 |
1995-1999 |
166.829 |
316 |
224.685 |
2000-2004 |
140.429 |
369 |
189.129 |
2005-2009 |
268.307 |
867 |
361.355 |
2010-2014 |
29.409 |
39 |
39.608 |
Medio |
|
Elementos gramaticais |
Documentos |
Frec. norm. (por millón) |
Libro |
315.521 |
476 |
424.942 |
Revista |
41.496 |
28 |
55.887 |
Xornal |
384.542 |
1169 |
517.900 |
Orixe |
|
Elementos gramaticais |
Documentos |
Frec. norm. (por millón) |
Escrita |
741.559 |
1673 |
998.729 |
Bloque |
|
Elementos gramaticais |
Documentos |
Frec. norm. (por millón) |
Ficción |
315.521 |
476 |
424.942 |
Non ficción |
426.038 |
1197 |
573.786 |
Subtipo |
|
Elementos gramaticais |
Documentos |
Frec. norm. (por millón) |
Relato curto |
315.521 |
476 |
424.942 |
Revista |
41.496 |
28 |
55.887 |
Xornal |
384.542 |
1169 |
517.900 |
Xénero |
|
Elementos gramaticais |
Documentos |
Frec. norm. (por millón) |
Narrativo |
315.521 |
476 |
424.942 |
Xornalístico |
426.038 |
1197 |
573.786 |
Área temática |
|
Elementos gramaticais |
Documentos |
Frec. norm. (por millón) |
Economía e política |
345.879 |
936 |
465.828 |
Cultura e artes |
45.512 |
133 |
61.295 |
Ciencias sociais |
82.338 |
182 |
110.892 |
Ciencias e tecnoloxía |
34.539 |
102 |
46.517 |
Outros |
101.637 |
331 |
136.884 |
Sen clasificar |
315.521 |
476 |
424.942 |
Sexo-autor |
|
Elementos gramaticais |
Documentos |
Frec. norm. (por millón) |
Ambos |
741.559 |
1673 |
998.729 |
Sexo-interlocutor |
|
Elementos gramaticais |
Documentos |
Frec. norm. (por millón) |
Non aplica |
720.854 |
1673 |
970.843 |
Non pertinente |
20.705 |
23 |
27.885 |