TXM (Tool)


Kurzbeschreibung

TXM ist ein Tool zur Analyse strukturierter und annotierter Textsammmlungen und Korpora, das seit 2008 an der ENS Lyon entwickelt wird. Zielgruppe des Tools sind Wissenschaftler_innen aus den Sprach- und Literaturwissenschaften gleichermaßen. TXM wird kontinuierlich weiter entwickelt und liegt derzeit (Stand Januar 2017) in Version 0.7.8 vor.

TXM hat eine benutzerfreundliche graphische Nutzeroberfläche und bietet eine Reihe von Standard-Funktionen aus der Korpuslinguistik:

  • Import eigener Textsammlungen oder Korpora;
  • ein Index aller Types mit den jeweiligen Häufigkeiten;
  • eine leistungsfähige Syntax für Suchanfragen (CQP);
  • Kookkurrenz-Analyse und Abstandssuche;
  • eine “Key-Word in Context”-Ansicht für die gefundenen Textstellen;
  • die Möglichkeit, Textsammlungen in mehrere Partitionen aufzuteilen oder Subkorpora zu bilden;
  • die Möglichkeit, linguistische Annotationen zu nutzen;
  • Funktionen für die kontrastive Analysen mehrerer Partitionen.

Zu den Besonderheiten von TXM gehören die folgenden Funktionalitäten:

  • TXM kann in XML kodierte Texte einlesen und die hier vorhandene Strukturinformation für Abfragen berücksichtigen.
  • TXM kann eine separate Tabelle mit Metadaten über die Texte berücksichtigen und diese nutzen, um eine Textsammlung oder ein Korpus in mehrere Partitionen zu teilen, wodurch flexible vergleichende Analysen möglich werden.
  • TXM kann nicht nur selbst Texte linguistisch annotieren, sondern auch beliebige token-basierte Annotationen bei der Formulierung von Suchabfragen berücksichtigen, wobei die Suchanfragen als CQP-Anfragen formuliert werden.
  • Die Ergebnisse von Abfragen können entweder exportiert oder über eine Anbindung an die Statistik-Umgebung R weiter verarbeitet werden.

Einführende Handreichungen für TXM in deutscher Sprache liegen in Form einer Kurzreferenz und eines Foliensatzes vor.

Die Referenzpublikation zu TXM ist: Heiden, Serge. “The TXM Platform: Building Open-Source Textual Analysis Software Compatible with the TEI Encoding Scheme.” In 24th Pacific Asia Conference on Language, Information and Computation (PACLIC24). Sendai: Waseda University, 2010. https://halshs.archives-ouvertes.fr/halshs-00549764/en.

Allgemeine Angaben

URL
http://textometrie.ens-lyon.fr/
Zugänglichkeit
kostenlos
Quellcode Zugriff
Open Source
Betriebssystem
webbasiert, Linux, OSX / macOS, Windows
Sprache(n) des Tools
Russisch, Französisch, Englisch
Sprache(n)
Spanisch, Rumänisch, Portugiesisch, Okzitanisch, Katalanisch, Italienisch, Französisch
Disziplin(en)
Sprachwissenschaft, Literaturwissenschaft
Schlagwörter
CQP, annotation, Vergleich, KWIC, Konkordanz, Textanalyse, Korpusanalyse

Urheber(in) / Entwickler(in)

Serge Heiden

Weitere Beteiligte

Mathieu Decorde Alexei Lavrentiev Bénédicte Pincemin Sébastien Jacquot

Verbundene Meldungen

Ersteller des Eintrags
Redaktion romanistik.de
Erstellungsdatum
Freitag, 20. Januar 2017, 09:18 Uhr
Letzte Änderung
Samstag, 21. Januar 2017, 16:23 Uhr