TXM (Tool)

Kurzbeschreibung

TXM ist ein Tool zur Analyse strukturierter und annotierter Textsammmlungen und Korpora, das seit 2008 an der ENS Lyon entwickelt wird. Zielgruppe des Tools sind Wissenschaftler_innen aus den Sprach- und Literaturwissenschaften gleichermaßen. TXM wird kontinuierlich weiter entwickelt und liegt derzeit (Stand Januar 2017) in Version 0.7.8 vor.

TXM hat eine benutzerfreundliche graphische Nutzeroberfläche und bietet eine Reihe von Standard-Funktionen aus der Korpuslinguistik:

Import eigener Textsammlungen oder Korpora;
ein Index aller Types mit den jeweiligen Häufigkeiten;
eine leistungsfähige Syntax für Suchanfragen (CQP);
Kookkurrenz-Analyse und Abstandssuche;
eine “Key-Word in Context”-Ansicht für die gefundenen Textstellen;
die Möglichkeit, Textsammlungen in mehrere Partitionen aufzuteilen oder Subkorpora zu bilden;
die Möglichkeit, linguistische Annotationen zu nutzen;
Funktionen für die kontrastive Analysen mehrerer Partitionen.

Zu den Besonderheiten von TXM gehören die folgenden Funktionalitäten:

TXM kann in XML kodierte Texte einlesen und die hier vorhandene Strukturinformation für Abfragen berücksichtigen.
TXM kann eine separate Tabelle mit Metadaten über die Texte berücksichtigen und diese nutzen, um eine Textsammlung oder ein Korpus in mehrere Partitionen zu teilen, wodurch flexible vergleichende Analysen möglich werden.
TXM kann nicht nur selbst Texte linguistisch annotieren, sondern auch beliebige token-basierte Annotationen bei der Formulierung von Suchabfragen berücksichtigen, wobei die Suchanfragen als CQP-Anfragen formuliert werden.
Die Ergebnisse von Abfragen können entweder exportiert oder über eine Anbindung an die Statistik-Umgebung R weiter verarbeitet werden.

Einführende Handreichungen für TXM in deutscher Sprache liegen in Form einer Kurzreferenz und eines Foliensatzes vor.

Die Referenzpublikation zu TXM ist: Heiden, Serge. “The TXM Platform: Building Open-Source Textual Analysis Software Compatible with the TEI Encoding Scheme.” In 24th Pacific Asia Conference on Language, Information and Computation (PACLIC24). Sendai: Waseda University, 2010. https://halshs.archives-ouvertes.fr/halshs-00549764/en.

Allgemeine Angaben

URL: http://textometrie.ens-lyon.fr/
Zugänglichkeit: kostenlos
Quellcode Zugriff: Open Source
Betriebssystem: Windows, OSX / macOS, Linux, webbasiert
Sprache(n) des Tools: Englisch, Französisch, Russisch
Sprache(n): Französisch, Italienisch, Katalanisch, Okzitanisch, Portugiesisch, Rumänisch, Spanisch
Disziplin(en): Literaturwissenschaft, Sprachwissenschaft
Schlagwörter: Korpusanalyse, Textanalyse, Konkordanz, KWIC, Vergleich, annotation, CQP

Urheber(in) / Entwickler(in)

Serge Heiden

Weitere Beteiligte

Mathieu Decorde, Sébastien Jacquot, Alexei Lavrentiev, Bénédicte Pincemin

Verbundene Meldungen

27. Januar 2016, 20:34 Uhr: Workshop "Digitale Forschungsmethoden in der Romanistik" beim Forum Junge Romanistik

Ersteller des Eintrags: Redaktion romanistik.de

Erstellungsdatum: Freitag, 20. Januar 2017, 08:18 Uhr
Letzte Änderung: Samstag, 21. Januar 2017, 15:23 Uhr