El corpus
El corpus
El corpus sobre el que se ha formado el CorLexIn incluye en estos momentos casi 1.793.009 palabras transcritas procedentes de documentación notarial inédita de archivos tanto de España como de América.
Por lo que respecta a España, contamos con una amplia selección de imágenes digitalizadas de los archivos históricos provinciales de las nueve provincias de Castilla y León, las cinco de Castilla-La Mancha, las ocho de Andalucía, del País Vasco, Navarra, Aragón, Extremadura, Canarias, Madrid, Murcia, Cantabria, Asturias y La Rioja, así como de los archivos municipales de Tafalla (Navarra), Villena y Orihuela (Alicante) y Calatayud (Zaragoza).
En el caso de América, el corpus incluye documentación datada en México, Chile, Perú, Bolivia, Colombia, Guatemala, Panamá, Venezuela, Cuba, El Salvador, República Dominicana, Trinidad y Tobago y Puerto Rico, citados por orden de mayor a menor volumen de palabras en el corpus.
El corpus, realizado en colaboración con el equipo del Diccionario histórico de la lengua española (DHLE), está disponible para su consulta pública en los enlaces externos de la web de la Real Academia Española.