Corpus Radiofónico Panhispánico (CO.RA.PAN) (Forschungsdaten)

Kurzbeschreibung

Una descripción en español sigue a continuación.

Beschreibung

CO.RA.PAN (Corpus Radiofónico Panhispánico) ist ein neues Korpus professioneller Rundfunksprache aus allen hispanophonen Ländern. Es ergänzt bestehende Forschungsressourcen um eine bislang wenig erschlossene Ebene: die registerkontrollierte, panhispanisch vergleichbare Dokumentation gesprochener Standardsprachverwendung. Auf dieser Basis lassen sich nationale Standardvarietäten empirisch beschreiben und plurizentrische Dynamiken — Prozesse informeller Standardisierung, Konvergenz und Divergenz zwischen nationalen Normen — systematisch untersuchen. Das Korpus umfasst rund 1,5 Millionen Wörter aus 20 Ländern, vollständig transkribiert, linguistisch annotiert (POS, Lemma, Dependenzstruktur) und auf Token- und Äußerungsebene zeitaligniert. Zwei Registerebenen — gelesene Nachrichtensprache und freies Sprechen — sind im Design systematisch getrennt und ermöglichen differenzierte
Analysen entlang des Nähe-Distanz-Kontinuums.

Der Zugang erfolgt über eine öffentliche Webapp (https://corapan.hispanistica.com/) mit BlackLab-Suchinfrastruktur: Konkordanzsuche nach Wortform, Lemma und morphosyntaktischer Kategorie, kombinierbar mit Filtern nach Land, Sprechertyp und Produktionsmodus, mit synchroner Audiowiedergabe. Aus urheberrechtlichen Gründen sind keine vollständigen Transkripte abrufbar; die Plattform bietet jedoch kontextualisierte Belegansicht mit direktem Zugriff auf das gesprochene Signal.

Das Projekt ist vollständig open source konzipiert. Der Quellcode der Webapp ist öffentlich zugänglich (https://github.com/FTacke/corapan-webapp, MIT License), eine ausführliche Projektdokumentation steht unter https://hispanistica.com bereit. Metadaten und ein vollständig annotiertes Beispielkorpus sind offen über Zenodo verfügbar; alle Komponenten sind mit persistenten DOIs versehen und zitierfähig dokumentiert. Zitierrichtlinien und Zugangsinformationen finden sich auf der Projektplattform (corapan.hispanistica.com).

Descripción

CO.RA.PAN (Corpus Radiofónico Panhispánico) es un nuevo corpus de habla profesional de radio que reúne material de todos los países hispanohablantes. Complementa los recursos de investigación existentes con un nivel hasta ahora poco explorado: la documentación, controlada por registro y comparable a escala panhispánica, del uso oral de la lengua estándar. Sobre esta base es posible describir empíricamente las variedades estándar nacionales y estudiar de forma sistemática las dinámicas pluricéntricas — procesos de estandarización informal, convergencia y divergencia entre las normas nacionales. El corpus comprende alrededor de 1,5 millones de palabras procedentes de 20 países, íntegramente transcritas, anotadas lingüísticamente (POS, lema, estructura de dependencias) y alineadas temporalmente a nivel de token y de enunciado. Dos niveles de registro —lengua informativa leída y habla espontánea— están sistemáticamente separados en el diseño y permiten análisis diferenciados a lo largo del continuo inmediatez–distancia.

El acceso se realiza a través de una webapp pública (https://corapan.hispanistica.com/) con infraestructura de búsqueda BlackLab: búsqueda en concordancias por forma, lema y categoría morfosintáctica, combinable con filtros por país, tipo de hablante y modo de producción, con reproducción de audio sincronizada. Por razones de derechos de autor no es posible acceder a transcripciones completas; la plataforma ofrece sin embargo una vista contextualizada de los ejemplos con acceso directo a la señal de voz.

El proyecto está concebido íntegramente como open source. El código fuente de la webapp es de acceso público (https://github.com/FTacke/corapan-webapp, MIT License) y la documentación completa del proyecto está disponible en https://hispanistica.com. Los metadatos y un corpus de muestra íntegramente anotado están disponibles abiertamente en Zenodo; todos los componentes cuentan con DOIs persistentes y están documentados de forma citable. Las directrices de cita e información de acceso se encuentran en la plataforma del proyecto (corapan.hispanistica.com).

Ressourcen / Recursos

CO.RA.PAN Full Corpus (Restricted) | https://doi.org/10.5281/zenodo.15360942
CO.RA.PAN Sample Corpus (Public) | https://doi.org/10.5281/zenodo.15378479
CO.RA.PAN Metadata (Public) | https://doi.org/10.5281/zenodo.17843469
CO.RA.PAN Web Application and Code (Open Source) | https://doi.org/10.5281/zenodo.17834023

Allgemeine Angaben

URL: https://corapan.hispanistica.com/
Veröffentlichung: bereits veröffentlicht
Zugänglichkeit: kostenlos
Medientyp: Audio, Text
Sprache(n): Spanisch
Disziplin(en): Sprachwissenschaft
Schlagwörter: Plurizentrik, Spanisch, Standardologie, Korpuslinguistik, Standardisierung, Varietätenlinguistik, Variation

Urheber(in) / Entwickler(in)

Felix Tacke

Ersteller des Eintrags: Felix Tacke

Erstellungsdatum: Sonntag, 01. März 2026, 14:34 Uhr
Letzte Änderung: Donnerstag, 05. März 2026, 08:02 Uhr

Noch nicht eingetragen?