Corpus Hispánico y Americano en la Red: Textos Antiguos
CHARTA se concibe como un proyecto global para la edición y análisis lingüístico de textos archivísticos en español de los siglos XII al XIX.
Contendrá documentos de Europa, América y Asia, entendidos estos en sentido amplio, pues no solo acoge piezas oficiales de la cancillería, la administración civil, la de justicia, la Inquisición o contratos de compraventa, sino cartas particulares y aun billetes y notas sueltas. Por ahora se ofrece una selección amplia de arhivos españoles y una breve muestra de documentos americanos, que se ampliará en ediciones sucesivas del corpus.
Los documentos se presentan en edición digital fiable, comprobable y que se puede citar directamente tanto en estudios científicos como en trabajos divulgativos, o simplemente para satisfacer la curiosidad por el pasado, incluso local y familiar.
CHARTA integra en sus ediciones una sólida fundamentación filológica con los últimos desarrollos informáticos necesarios para la explotación del corpus. Para facilitar su consulta por diversos usuarios ofrece tres presentaciones de cada texto: facsimilar, paleográfica y crítica, esta última de fácil lectura.
Presentación en vídeo
Contenido de CHARTA
El corpus CHARTA pretende ofrecer una amplia representación del documento archivístico en español.
El volumen para esta primera fase es de 2076 documentos seleccionados de acuerdo con tres parámetros: geográfico, cronológico y tipológico.
A ellos se añade la posibilidad de introducir más adelante un parámetro de tipo discursivo o estilístico, que sirva para potenciales trabajos de tipo pragmalingüístico, ya que los usos de lengua que encierran los documentos, junto con la variación geolingüística y sociolingüística, proporcionan la clave para el estudio de la variación en la lengua española.
Frente a otro tipo de corpus textuales que abarcan un ámbito de registros relativamente estrecho, los documentos archivísticos ocupan un amplio espectro sociolingüístico y sociocultural de la escritura, de acuerdo con el concepto lato de documento asumido por la red CHARTA.
Criterios de CHARTA
Un objetivo fundamental de CHARTA era disponer de ediciones expresamente elaboradas para este corpus, y evitar así la disparidad de soluciones habitual en el mundo hispánico.
Esta exigencia era tanto mayor en cuanto que son varios los equipos que trabajan en el proyecto, y que se habían de abarcar etapas que van de los orígenes de la lengua española al siglo XIX inclusive
Los ámbitos geográficos también son muy amplios, pues van de las provincias que fueron la cuna del castellano a las tierras americanas en las que el español es tardío, así como piezas nacidas con intenciones muy dispares, pues no es lo mismo la carta de un embajador que la nota de abandono de un niño recién nacido.
Por todo ello, la primera tarea de CHARTA fue elaborar unos criterios de edición que sirvieran para todas las situaciones tan distintas en las que nacen los documentos incluidos en el corpus.
Grupos de CHARTA
La Red CHARTA, coordinada por Pedro Sánchez-Prieto Borja (Universidad de Alcalá), está constituida por grupos de investigación de diferentes centros y universidades en Europa, América y Asia.
Estos grupos vienen desarrollando su labor desde hace años en torno a la edición y estudio de fuentes documentales, con orientaciones amplias que abarcan la filología, la lingüística histórica, la historia de la lengua española, la romanística, la dialectología hispánica, la historia de la escritura, la sintaxis o la lexicología.
Los equipos de CHARTA que han trabajado en en este proyecto pertenecen a CSIC, King’S College London, Instituto Caro y Cuervo, y universidades de Alcalá, Complutense de Madrid, Deusto, Gotemburgo, Granada, Jaén, Islas Baleares, Las Palmas de Gran Canaria, Lausana, Los Andes, Málaga, Nacional Autónoma de México, Navarra, Neuchâtel, Padua, Querétaro, Salamanca, Santiago de Compostela, Sevilla, Valladolid, Tokio.
Leer
Leer
Enlaces a grupos CHARTA
Presentación del Corpus CHARTA en vídeo (Disponible próximamente)
Bienvenida a los usuarios de CHARTA
Los corpus en la investigación lingüística y filológica
Características del corpus CHARTA
Selección de documentos y representatividad de CHARTA
La triple edición de los documentos de CHARTA
Bienvenida a los usuarios de CHARTA
Los corpus en la investigación lingüística y filológica
Características del corpus CHARTA
Selección de documentos y representatividad de CHARTA
La triple edición de los documentos de CHARTA
Características del corpus de CHARTA
El corpus de CHARTA nace como consecuencia del interés común de varios grupos de investigación sobre las fuentes documentales de los archivos. Todos ellos con una gran sensibilidad, muy propia de este campo, a los problemas de autenticidad textual. El documento se concibe de manera global, y no solo como fuente de datos lingüísticos. En esta perspectiva, los elementos de validación (crismón, sello, rúbricas) cobran particular valor. Ello explica una primera característica: los textos se transcriben íntegramente. No es este, pues, un corpus de referencia.
Pero tan importante como el anterior es otro rasgo nacido de la concepción misma del corpus. Es muy frecuente entender los corpus solo como una vía para facilitar a los usuarios el acceso a los textos, y el acento se pone en el modo de extraer la información, mientras que es menos habitual insertar plenamente el corpus en los procedimientos de edición propiamente dicha. De ahí que lo corriente hasta ahora haya sido incorporar materiales textuales ajenos, procedentes de ediciones previas. Por el contrario, aquí ofrecemos ediciones propias, desarrolladas íntegramente; la edición forma así parte del proceso elaborativo del corpus de CHARTA, y no se concibe como una fase previa. Proponemos, en consecuencia, como clasificación básica de los corpus la distinción entre dos opciones:
Primarios (ofrecen ediciones propias)
Secundarios (incorporan ediciones ajenas)
Este carácter de corpus primario condiciona la selección de los documentos, según se verá. Por otro lado, al no escogerse los textos de entre colecciones previamente publicadas, el corpus es abierto, es decir, siempre susceptible de nuevas incorporaciones (el concepto clave es el de versión temporal siempre rehaciéndose, por tanto, no acabado, o "in fieri").
Los corpus en la investigación lingüística y filológica
No cabe duda de que el uso de corpus electrónicos se ha difundido entre los investigadores de las disciplinas humanísticas hasta extremos inimaginables hace poco. Hoy es inconcebible un estudio, por ejemplo, de sintaxis histórica, sin el recurso a los mismos. El hecho es la consecuencia natural del aprovechamiento de las posibilidades que ofrecen las nuevas tecnologías, pero, en una perspectiva más amplia, va parejo de un concepción empírica de las humanidades, y en particular de la lingüística, más firmemente anclada ahora en el texto, que se convierte en fundamento último de toda propuesta científica. Ello explica que se hayan desarrollado especialmente para textos de épocas históricas pasadas, con llamativa anticipación sobre otras parcelas. El recurso a los corpus amplía enormemente las perspetivas de la investigación, que ahora pueden abarcar con una intensidad mayor épocas y espacios más amplios, y acudir a una tipología textual más variada. El tratamiento estadístico de los datos, las búsquedas proporcionales aumentan el valor de este recurso.
Es sabido que igual que para la lengua actual, resulta imprescindible una cierta "competencia" sobre la lengua de épocas pasadas, y no puede suplirse con el rastreo en corpus. Claro que solo podrá aspirarse a una competencia parcial, pero solo esta familiaridad nos permite poner en duda aquello que nos parece raro y ahondar en su estudio, y hasta ahora no se ha encontrado otro modo para alcanzarla que la lectura íntegra de los textos. El método, entonces ha de ser circular o dialéctico: los textos alimentan nuestra idea de cómo era la lengua antigua; nuestra idea de la lengua obliga a cuestionarnos continuamente los datos que nos ofrecen los textos, y, a su vez, el corpus, al presentar el texto no aislado, sino envuelto en un marco intertextual, puede ayudar a responder a algunas de las cuestiones señaladas acerca del proceso de elaboración del mismo. Esta manera de entender las cosas ha estado presente desde el principio en la concepción de nuestra red, y explica alguna de las características del corpus que aquí se presenta.
Posibles orientaciones del corpus
Grafemática, fonética y fonología, morfología, sintaxis, léxico
Onomástica: toponimia y antroponimia
Diplomática
Historia general, historia de la vida privada e historia de las mentalidades
Fuente de información general sobre el pasado para usuarios de diferentes niveles
Información de la cabecera
En este sentido, la cabecera de cada pieza pretende dar la información básica de interés en diversos ámbitos, y podrá incrementarse con datos adicionales, lo que ya está previsto en el diseño actual, con campos obligatorios y opcionales (estos últimos se indican entre []):
Identificación de grupo, corpus y documento dentro del corpus
Identificación del documento: se señalan las siglas del archivo, signatura del archivo
Data y localización
Regesto
Escribano, seguido de la frase literal que expresa el tipo de intervención: Pero Gil (la fiz escrevir)
[Soporte], [Medidas], [Estado de conservación]
Transcriptores
Representatividad del corpus
Un problema que ha preocupado largamente a los investigadores es el de la representatividad de los corpus, entendida ahora no como el grado de credibilidad respecto de la lengua de uso que cabe otorgar a los documentos, sino referida al hecho de la igualdad proporcional en número de documentos y en extensión textual pareja (en número de palabras) respecto de los tres parámetros operativos de selección: (1) tiempo, (2) espacio geográfico y (3) tipología documental.
Dentro se la red CHARTA se ha planteado esta cuestión en el marco de los objetivos generales del corpus, latos, de su finalidad más específica en el ámbito de la historia de la lengua y dialectología histórica, y de las posibilidades prácticas de ofrecer materiales amplios en un plazo corto. Por otro lado, influyen condicionamientos que nacen de la naturaleza de la propia investigación:
La exigencia de partir de fuentes documentales directas obliga a un trabajo de selección (cuando no también de inventariado) en los propios archivos, que no siempre disponen de instrumentos descriptivos adecuados (así, en archivos tan importantes como el de la Catedral o el Municipal de Toledo, ahora ya en vías de mejora)
Falta de proporción de los fondos por:
El proceso histórico que afecta a la escrituración (el caso citado del español en América; el de Andalucía, con diferencias areales entre Jaén, el valle del Guadalquivir, el condado de Niebla y el reino nazarí; así, será más facil obtener abundante y más antigua documentación para la provincia de León que para Vizcaya o Cuenca)
El concepto de “densidad histórica” (pasaron más cosas en Toledo que en Ciudad en el s. XVI, lo que se refleja en las fuentes documentales; al respecto, carece de sentido ofrecer en el corpus el mismo número de documentos de estas dos provincias);
Conservación de los propios fondos (en el s. XIV el uso de un papel de mala calidad da lugar a una laguna relativa en muchos archivos)
Dificultades de acceso a los archivos privados (la mayoría eclesiásticos) y, en menor medida, públicos, pero sin protocolos generales en el mundo hispánico (y ni aun en España)
Operatividad funcional en relación con la utilización del corpus: es más probable que los usuarios del corpus busquen documentos, e información en general, sobre Toledo que sobre Ciudad Real
El proceso mismo de edición, que parte de las posibilidades reales de los grupos de CHARTA, de su trayectoria, experiencia previa e intereses investigadores, focalizados a veces en ciertos ámbitos
Comparabilidad científica
En consecuencia, la identidad proporcional es inalcanzable por las características propias de los fondos mismos, y tampoco reflejaría las exigencias intrínsecas de la propia investigación. De ello se deriva una caractrística negativa del corpus de CHARTA: la falta de exhaustividad geográfica para el dominio hispánico en una primera fase. El corpus estará disponible con lagunas importantes, que, sin embargo, se irán colmando en fases sucesivas. Nuestra experiencia previa nos indica que, de otro modo, seguramente el corpus quedaría en mero proyecto.
Con todo, el problema de la proporcionalidad de un corpus tiene otras dimensiones que no se nos escapan. Con vistas a la cuantificación de los resultados de una búsqueda lingüística (pero también en plano como el gráfico y aun paleográfico u otros), la comparabilidad es una exigencia científica imposible de cuadrar al cien por cien. El investigador puede exigirse, por ejemplo, confrontar segmentos textuales de la misma extensión igual o aproximado número de palabras) proporcionalidad de las búsquedas, o le interesará comparar el mismo número de documentos de las provincias de León y Zamora, con vistas a estudiar la zonificación del antiguo dialecto leonés, etc. La herramientas de búsqueda integradas en el corpus deben dar la posibilidad de acotar la muestra, limitarla y filtrarla respecto de diferentes parámetros.
Cronología y geografía
En cuanto al criterio cronológico, cabe señalar que ningún corpus del ámbito de la documentación archivística hispánica tiene un objetivo de tanto alcance, ya que pretende recorrer los siglos que median desde la etapa de orígenes de la lengua española hasta el siglo XIX inclusive. Esta amplitud temporal otorga especial valor histórico al proyecto, especialmente en lo que concierne al contacto de lenguas, pues permitirá secuenciar las diversas influencias lingüísticas en Europa y fuera de Europa a lo largo del tiempo.
En el plano geográfico, lógicamente, la fase más antigua, hasta 1492, afecta al espacio de la Península Ibérica y Europa. Desde el siglo XVI el espacio de los documentos se amplía a América, y posteriormente a Filipinas. Para América se pretende en una primera fase incluir documentos de las diversas demarcaciones administrativas de la época colonial (virreinatos) y de la independencia. Tomando a efectos prácticos como referencia estos últimos, en una fase próxima se incluirán documentos del Sur de los Estados Unidos. Se incluirá el área centroamericana, Venezuela y espacio andino y el espacio sur (Chile y Argentina). La inclusión de documentos filipinos constituye otra novedad del corpus: el Archivo Nacional de Filipinas cuenta con fondos de extraordinario valor, apenas conocidos por los investigadores europeos.
En el plano sociolingüístico, el objetivo es abarcar toda la variedad posible de registros, desde los más elevados, los propios del documento oficial (“documento público”) a los más humildes. Las declaraciones en juicio proporcionan un material lingüístico muy útil para el estudio de la transferencia entre oralidad y escritura.
Esta articulación interna de los materiales se justifica, a su vez, por los objetivos mismos del corpus de CHARTA. Mientras que la mayor parte de los corpus secundarios tienen un interés lingüístico, el nuestro va más allá, con ser la historia de la lengua y la dialectología histórica las parcelas en las que más se ha pensado al concebirlo. Se tienen en cuenta para la edición y recuperación de información las exigencias y requisitos de todas la áreas implicadas en el estudio del documento, de la diplomática a la historia general (según se ha dicho anteriormente). Tampoco se descarta al público no especialista como potencial usuario, que buscará tal vez información de carácter privado. Y, muy especialmente, se orienta a la enseñanza, que en realidad no separamos de la investigación.
Grupo de Investigación de Textos para la Historia del Español (GITHE), de la Universidad de Alcalá de Henares
Grupo de Estudios de Documentos Históricos y Textos Antiguos de la Universidad de Salamanca (GEDHYTAS)
Grupo Historical Perspectives on Text and Discourse (HIPERTEXT), de la Universitat de les Illes Balears
Grupo del Consejo Superior de Investigaciones Científicas (CSIC)
Seminario Alfonso Irigoien de la Universidad de Deusto (SAI)
Diachronica Hispánica. Grupo de estudios sobre la historia de los romances peninsulares, (DIAHISPA), Université de Neuchâtel
Grupo de Investigación de Documentos de Canarias (GIDC), Universidad de Las Palmas de Gran Canaria
Proyecto de Investigaciones Hispánicas de la Universidad de Gotemburgo (PIHUGS)
Grupo para el estudio de la historia lingüística iberoamericana (GEHLIB), Universidad de Valladolid
Grupo de Lingüística Hispánica (GLH-ULA), Universidad de los Andes, Venezuela
Archivo informático de textos de Andalucía (ARINTA), Universidad de Málaga
Grupo de Investigaciones Historicolingüísticas y Dialectales (GIHD), Universidad de Granada
Grupo de la Universidad Nacional Autónoma de México (UNAM)
Grupo de Tokio, Universidad de Tokio
Responsables de los grupos de CHARTA
Universidad de Alcalá GITHE: Prof. Pedro Sánchez-Prieto
Universidad de Los Andes, Venezuela GLH-ULA: Prof. Enrique Obediente
Instituto Caro y Cuervo: Prof. Néstor Fabián Ruiz Vásquez
Consejo Superior de Investigaciones Científicas CSIC: Profa. M. Jesús Torrens Álvarez
Universidad de Deusto: Profa. Carmen Isasi
Universidad de Granada GIHD: Prof. Miguel Calderón Campos
Universidad de Gotemburgo, Suecia GIDC: Prof. Ingmar Söhrman
Universidad de las Islas Baleares HIPERTEXT: Prof. Andrés Enrique-Arias
Universidad de Jaén: Profa. Águeda Moreno
King’s College London, Reino Unido: Prof. Paul Spence
Universidad de Lausana: Profa. Mónica Castillo Lluch
Universidad de Málaga ARINTA: Prof. Inés Carrasco Cantos
Universidad Nacional Autónoma de México (México) UNAM: Prof. Beatriz Arias Álvarez
Universidad de Navarra TeSUN: Profa. Cristina Tabernero Sala
Universidad de Neuchâtel, Suiza DIAHISPA: Prof. Juan Sánchez Méndez
Universidad de Padua, Italia: Profa. Rocío Caravedo
Universidad de las Palmas de Gran Canaria GIDC: Profa. Rosa González Monllor
Universidad de Querétaro: Prof. José Luis Ramírez Luengo
Universidad de Salamanca GEDHYTAS:Profa. M. Nieves Sánchez González de Herrero
Universidad de Sevilla: Profa. Lola Pons Rodríguez
Universidad de Valladolid GEHLIB: Profa. Micaela Carrera de la Red