Listaxe de documentos contidos na base de datos
Na súa versión actual, 4.0, o corpus etiquetado manualmente dispoñible para consulta consta de 617.494 palabras ortográficas (742.045 elementos gramaticais), que se distribúen da seguinte forma:
Palabras ortográficas
Frecuencias |
Frecuencia |
Palabras ortográficas |
Frecuencia normalizada |
Frecuencia normalizada acumulada |
Frecuencia das palabras |
Frecuencia normalizada |
Frecuencia normalizada acumulada |
> 5000 |
16 |
0,03 % |
0,03 % |
226.110,0 |
32,06 % |
32,06 % |
1000 < F ≤ 5000 |
44 |
0,07 % |
0,1 % |
86.991,0 |
12,34 % |
44,4 % |
500 < F ≤ 1000 |
54 |
0,09 % |
0,19 % |
37.647,0 |
5,34 % |
49,74 % |
100 < F ≤ 500 |
489 |
0,83 % |
1,03 % |
99.004,0 |
14,04 % |
63,78 % |
25 < F ≤ 100 |
1938 |
3,3 % |
4,32 % |
92.847,0 |
13,17 % |
76,95 % |
10 < F ≤ 25 |
3148 |
5,36 % |
9,68 % |
50.391,0 |
7,15 % |
84,09 % |
4 < F ≤ 10 |
5875 |
9,99 % |
19,67 % |
40.067,0 |
5,68 % |
89,77 % |
2 < F ≤4 |
6784 |
11,54 % |
31,21 % |
22.905,0 |
3,25 % |
93,02 % |
F=2 |
8766 |
14,91 % |
46,12 % |
17.532,0 |
2,49 % |
95,51 % |
F=1 |
31.672 |
53,88 % |
100,0 % |
31.672,0 |
4,49 % |
100,0 % |
Lustro |
|
Palabras ortográficas |
Documentos |
Frec. norm. (por millón) |
1975-1979 |
219 |
1 |
311 |
1980-1984 |
18.966 |
21 |
26.896 |
1985-1989 |
9386 |
6 |
13.310 |
1990-1994 |
80.612 |
54 |
114.316 |
1995-1999 |
139.234 |
316 |
197.449 |
2000-2004 |
118.882 |
369 |
168.587 |
2005-2009 |
226.319 |
867 |
320.944 |
2010-2014 |
23.876 |
39 |
33.859 |
Medio |
|
Palabras ortográficas |
Documentos |
Frec. norm. (por millón) |
Libro |
252.545 |
476 |
358.136 |
Revista |
35.122 |
28 |
49.807 |
Xornal |
329.827 |
1169 |
467.730 |
Orixe |
|
Palabras ortográficas |
Documentos |
Frec. norm. (por millón) |
Escrita |
617.494 |
1673 |
875.672 |
Bloque |
|
Palabras ortográficas |
Documentos |
Frec. norm. (por millón) |
Ficción |
252.545 |
476 |
358.136 |
Non ficción |
364.949 |
1197 |
517.536 |
Subtipo |
|
Palabras ortográficas |
Documentos |
Frec. norm. (por millón) |
Relato curto |
252.545 |
476 |
358.136 |
Revista |
35.122 |
28 |
49.807 |
Xornal |
329.827 |
1169 |
467.730 |
Xénero |
|
Palabras ortográficas |
Documentos |
Frec. norm. (por millón) |
Narrativo |
252.545 |
476 |
358.136 |
Xornalístico |
364.949 |
1197 |
517.536 |
Sexo |
|
Palabras ortográficas |
Documentos |
Frec. norm. (por millón) |
Non aplica |
617.494 |
1673 |
875.672 |
Área temática |
|
Palabras ortográficas |
Documentos |
Frec. norm. (por millón) |
Economía e política |
295.566 |
936 |
419.144 |
Cultura e artes |
39.749 |
133 |
56.368 |
Ciencias sociais |
70.709 |
182 |
100.273 |
Ciencias e tecnoloxía |
29.824 |
102 |
42.294 |
Outros |
87.547 |
331 |
124.151 |
Sen clasificar |
252.545 |
476 |
358.136 |
Elementos gramaticais
Frecuencias |
Frecuencia |
Elementos gramaticais |
Frecuencia normalizada |
Frecuencia normalizada acumulada |
Frecuencia dos elementos |
Frecuencia normalizada |
Frecuencia normalizada acumulada |
> 5000 |
17 |
0,03 % |
0,03 % |
322.435,0 |
43,4 % |
43,4 % |
1000 < F ≤ 5000 |
36 |
0,07 % |
0,1 % |
62.463,0 |
8,41 % |
51,8 % |
500 < F ≤ 1000 |
50 |
0,1 % |
0,2 % |
33.430,0 |
4,5 % |
56,3 % |
100 < F ≤ 500 |
452 |
0,88 % |
1,07 % |
88.240,0 |
11,88 % |
68,18 % |
25 < F ≤ 100 |
1836 |
3,56 % |
4,63 % |
87.154,0 |
11,73 % |
79,91 % |
10 < F ≤ 25 |
3022 |
5,85 % |
10,48 % |
48.555,0 |
6,54 % |
86,45 % |
4 < F ≤ 10 |
5498 |
10,65 % |
21,13 % |
37.513,0 |
5,05 % |
91,49 % |
2 < F ≤4 |
6171 |
11,95 % |
33,08 % |
20.903,0 |
2,81 % |
94,31 % |
F=2 |
7738 |
14,98 % |
48,06 % |
15.476,0 |
2,08 % |
96,39 % |
F=1 |
26.820 |
51,94 % |
100,0 % |
26.820,0 |
3,61 % |
100,0 % |
Lustro |
|
Elementos gramaticais |
Documentos |
Frec. norm. (por millón) |
1975-1979 |
259 |
1 |
349 |
1980-1984 |
23.511 |
21 |
31.644 |
1985-1989 |
11.256 |
6 |
15.150 |
1990-1994 |
101.656 |
54 |
136.820 |
1995-1999 |
166.936 |
316 |
224.682 |
2000-2004 |
140.504 |
369 |
189.106 |
2005-2009 |
268.494 |
867 |
361.370 |
2010-2014 |
29.429 |
39 |
39.609 |
Medio |
|
Elementos gramaticais |
Documentos |
Frec. norm. (por millón) |
Libro |
315.763 |
476 |
424.990 |
Revista |
41.546 |
28 |
55.917 |
Xornal |
384.736 |
1169 |
517.822 |
Orixe |
|
Elementos gramaticais |
Documentos |
Frec. norm. (por millón) |
Escrita |
742.045 |
1673 |
998.729 |
Bloque |
|
Elementos gramaticais |
Documentos |
Frec. norm. (por millón) |
Ficción |
315.763 |
476 |
424.990 |
Non ficción |
426.282 |
1197 |
573.739 |
Subtipo |
|
Elementos gramaticais |
Documentos |
Frec. norm. (por millón) |
Relato curto |
315.763 |
476 |
424.990 |
Revista |
41.546 |
28 |
55.917 |
Xornal |
384.736 |
1169 |
517.822 |
Xénero |
|
Elementos gramaticais |
Documentos |
Frec. norm. (por millón) |
Narrativo |
315.763 |
476 |
424.990 |
Xornalístico |
426.282 |
1197 |
573.739 |
Sexo |
|
Elementos gramaticais |
Documentos |
Frec. norm. (por millón) |
Non aplica |
742.045 |
1673 |
998.729 |
Área temática |
|
Elementos gramaticais |
Documentos |
Frec. norm. (por millón) |
Economía e política |
346.073 |
936 |
465.785 |
Cultura e artes |
45.539 |
133 |
61.292 |
Ciencias sociais |
82.406 |
182 |
110.911 |
Ciencias e tecnoloxía |
34.567 |
102 |
46.524 |
Outros |
101.690 |
331 |
136.866 |
Sen clasificar |
315.763 |
476 |
424.990 |