Listaxe de documentos contidos na base de datos
Na súa versión actual, 4.1, o corpus etiquetado manualmente dispoñible para consulta consta de 616.693 palabras ortográficas (741.559 elementos gramaticais), que se distribúen da seguinte forma:
Palabras ortográficas
| Frecuencias | ||||||
|---|---|---|---|---|---|---|
| Frecuencia | Palabras ortográficas | Frecuencia normalizada | Frecuencia normalizada acumulada | Frecuencia das palabras | Frecuencia normalizada | Frecuencia normalizada acumulada |
| > 5000 | 16 | 0,03 % | 0,03 % | 226.640,0 | 32,1 % | 32,1 % |
| 1000 < F ≤ 5000 | 44 | 0,08 % | 0,1 % | 87.107,0 | 12,34 % | 44,44 % |
| 500 < F ≤ 1000 | 54 | 0,09 % | 0,19 % | 37.658,0 | 5,33 % | 49,77 % |
| 100 < F ≤ 500 | 490 | 0,84 % | 1,03 % | 99.161,0 | 14,04 % | 63,82 % |
| 25 < F ≤ 100 | 1942 | 3,31 % | 4,34 % | 93.004,0 | 13,17 % | 76,99 % |
| 10 < F ≤ 25 | 3154 | 5,38 % | 9,72 % | 50.506,0 | 7,15 % | 84,14 % |
| 4 < F ≤ 10 | 5875 | 10,02 % | 19,75 % | 40.064,0 | 5,67 % | 89,82 % |
| 2 < F ≤4 | 6773 | 11,55 % | 31,3 % | 22.869,0 | 3,24 % | 93,06 % |
| F=2 | 8745 | 14,92 % | 46,22 % | 17.490,0 | 2,48 % | 95,53 % |
| F=1 | 31.529 | 53,78 % | 100,0 % | 31.529,0 | 4,47 % | 100,0 % |
| Lustro | |||
|---|---|---|---|
| Palabras ortográficas | Documentos | Frec. norm. (por millón) | |
| 1975-1979 | 220 | 1 | 312 |
| 1980-1984 | 18.943 | 21 | 26.830 |
| 1985-1989 | 9386 | 6 | 13.294 |
| 1990-1994 | 80.470 | 54 | 113.976 |
| 1995-1999 | 139.086 | 316 | 196.998 |
| 2000-2004 | 118.789 | 369 | 168.250 |
| 2005-2009 | 225.958 | 867 | 320.041 |
| 2010-2014 | 23.841 | 39 | 33.768 |
| Medio | |||
|---|---|---|---|
| Palabras ortográficas | Documentos | Frec. norm. (por millón) | |
| Libro | 252.013 | 476 | 356.945 |
| Revista | 35.093 | 28 | 49.705 |
| Xornal | 329.587 | 1169 | 466.819 |
| Orixe | |||
|---|---|---|---|
| Palabras ortográficas | Documentos | Frec. norm. (por millón) | |
| Escrita | 616.693 | 1673 | 873.468 |
| Bloque | |||
|---|---|---|---|
| Palabras ortográficas | Documentos | Frec. norm. (por millón) | |
| Ficción | 252.013 | 476 | 356.945 |
| Non ficción | 364.680 | 1197 | 516.523 |
| Subtipo | |||
|---|---|---|---|
| Palabras ortográficas | Documentos | Frec. norm. (por millón) | |
| Relato curto | 252.013 | 476 | 356.945 |
| Revista | 35.093 | 28 | 49.705 |
| Xornal | 329.587 | 1169 | 466.819 |
| Xénero | |||
|---|---|---|---|
| Palabras ortográficas | Documentos | Frec. norm. (por millón) | |
| Narrativo | 252.013 | 476 | 356.945 |
| Xornalístico | 364.680 | 1197 | 516.523 |
| Área temática | |||
|---|---|---|---|
| Palabras ortográficas | Documentos | Frec. norm. (por millón) | |
| Economía e política | 295.369 | 936 | 418.353 |
| Cultura e artes | 39.703 | 133 | 56.234 |
| Ciencias sociais | 70.578 | 182 | 99.965 |
| Ciencias e tecnoloxía | 29.801 | 102 | 42.209 |
| Outros | 87.507 | 331 | 123.943 |
| Sen clasificar | 252.013 | 476 | 356.945 |
| Sexo-autor | |||
|---|---|---|---|
| Palabras ortográficas | Documentos | Frec. norm. (por millón) | |
| Ambos | 616.693 | 1673 | 873.468 |
| Sexo-interlocutor | |||
|---|---|---|---|
| Palabras ortográficas | Documentos | Frec. norm. (por millón) | |
| Non aplica | 599.416 | 1673 | 848.997 |
| Non pertinente | 17.277 | 23 | 24.471 |
Elementos gramaticais
| Frecuencias | ||||||
|---|---|---|---|---|---|---|
| Frecuencia | Elementos gramaticais | Frecuencia normalizada | Frecuencia normalizada acumulada | Frecuencia dos elementos | Frecuencia normalizada | Frecuencia normalizada acumulada |
| > 5000 | 17 | 0,03 % | 0,03 % | 321.786,0 | 43,34 % | 43,34 % |
| 1000 < F ≤ 5000 | 35 | 0,07 % | 0,1 % | 61.375,0 | 8,27 % | 51,6 % |
| 500 < F ≤ 1000 | 51 | 0,1 % | 0,2 % | 34.752,0 | 4,68 % | 56,28 % |
| 100 < F ≤ 500 | 452 | 0,88 % | 1,08 % | 88.300,0 | 11,89 % | 68,18 % |
| 25 < F ≤ 100 | 1838 | 3,58 % | 4,66 % | 87.283,0 | 11,76 % | 79,93 % |
| 10 < F ≤ 25 | 3024 | 5,88 % | 10,54 % | 48.598,0 | 6,55 % | 86,48 % |
| 4 < F ≤ 10 | 5496 | 10,7 % | 21,24 % | 37.508,0 | 5,05 % | 91,53 % |
| 2 < F ≤4 | 6166 | 12,0 % | 33,24 % | 20.884,0 | 2,81 % | 94,34 % |
| F=2 | 7708 | 15,0 % | 48,23 % | 15.416,0 | 2,08 % | 96,42 % |
| F=1 | 26.601 | 51,77 % | 100,0 % | 26.601,0 | 3,58 % | 100,0 % |
| Lustro | |||
|---|---|---|---|
| Elementos gramaticais | Documentos | Frec. norm. (por millón) | |
| 1975-1979 | 258 | 1 | 347 |
| 1980-1984 | 23.498 | 21 | 31.647 |
| 1985-1989 | 11.246 | 6 | 15.146 |
| 1990-1994 | 101.583 | 54 | 136.812 |
| 1995-1999 | 166.829 | 316 | 224.685 |
| 2000-2004 | 140.429 | 369 | 189.129 |
| 2005-2009 | 268.307 | 867 | 361.355 |
| 2010-2014 | 29.409 | 39 | 39.608 |
| Medio | |||
|---|---|---|---|
| Elementos gramaticais | Documentos | Frec. norm. (por millón) | |
| Libro | 315.521 | 476 | 424.942 |
| Revista | 41.496 | 28 | 55.887 |
| Xornal | 384.542 | 1169 | 517.900 |
| Orixe | |||
|---|---|---|---|
| Elementos gramaticais | Documentos | Frec. norm. (por millón) | |
| Escrita | 741.559 | 1673 | 998.729 |
| Bloque | |||
|---|---|---|---|
| Elementos gramaticais | Documentos | Frec. norm. (por millón) | |
| Ficción | 315.521 | 476 | 424.942 |
| Non ficción | 426.038 | 1197 | 573.786 |
| Subtipo | |||
|---|---|---|---|
| Elementos gramaticais | Documentos | Frec. norm. (por millón) | |
| Relato curto | 315.521 | 476 | 424.942 |
| Revista | 41.496 | 28 | 55.887 |
| Xornal | 384.542 | 1169 | 517.900 |
| Xénero | |||
|---|---|---|---|
| Elementos gramaticais | Documentos | Frec. norm. (por millón) | |
| Narrativo | 315.521 | 476 | 424.942 |
| Xornalístico | 426.038 | 1197 | 573.786 |
| Área temática | |||
|---|---|---|---|
| Elementos gramaticais | Documentos | Frec. norm. (por millón) | |
| Economía e política | 345.879 | 936 | 465.828 |
| Cultura e artes | 45.512 | 133 | 61.295 |
| Ciencias sociais | 82.338 | 182 | 110.892 |
| Ciencias e tecnoloxía | 34.539 | 102 | 46.517 |
| Outros | 101.637 | 331 | 136.884 |
| Sen clasificar | 315.521 | 476 | 424.942 |
| Sexo-autor | |||
|---|---|---|---|
| Elementos gramaticais | Documentos | Frec. norm. (por millón) | |
| Ambos | 741.559 | 1673 | 998.729 |
| Sexo-interlocutor | |||
|---|---|---|---|
| Elementos gramaticais | Documentos | Frec. norm. (por millón) | |
| Non aplica | 720.854 | 1673 | 970.843 |
| Non pertinente | 20.705 | 23 | 27.885 |
