Stadt: Würzburg

Frist: 2016-02-20

Beginn: 2016-03-15

Ende: 2016-03-16

Im Vorfeld des Forum Junge Romanistik 2016, das an der Universität Würzburg stattfindet, wird ein Workshop zum Thema “Digitale Forschungsmethoden in der Romanistk” angeboten.

Der Workshop richtet sich insbesondere an die Teilnehmer_innen des Forum Junge Romanistik, aber auch an andere Interessierte, die an einer Qualifikationsarbeit in den Sprach- oder Literatur-/Kulturwissenschaften arbeiten und herausfinden möchten, welchen Beitrag die Verwendung digitaler Texte, Werkzeuge und Methoden für ihr Forschungsvorhaben leisten könnten. Ziel ist es, praxisorientiert in die Nutzung digital vorliegender Daten für die sprach- und literaturwissenschaftliche Forschung einzuführen, ohne dabei die größeren methodischen Zusammenhänge aus den Augen zu verlieren.

Organisatorisches

Der Workshop wird am Dienstag, den 15. März um 16:15 beginnen und am Mittwoch, den 16. März um 16:00 enden. Veranstaltungsort ist das Zentrale Seminar- und Hörsaalgebäude (Z6) auf dem Campus Hubland Süd der Universität Würzburg. Um Anmeldung per Email an die Organisatoren wird bis zum 20. Februar gebeten; bitte geben Sie dabei an, ob Sie am linguistischen oder literaturwissenschaftlichen Parallelstrang teilnehmen möchten. Kontakt für Rückfragen vorab und die Anmeldung: christof.schoech@uni-wuerzburg.de und robert.hesselbach@uni-wuerzburg.de.

Programm

Dienstag, den 15. März

16:15-16:30 Begrüßung

16:30-17:30 Parallelstränge
A: Computerphilologie: Einführung und Überblick (Christof Schöch)
B: Computerlinguistik: Das Projekt Verba Alpina (Thomas Krefeld & Stephan Lücke)

17:30-18:00 Kaffeepause

18:00-19:30: Abendvortrag von Stefan Evert (Erlangen-Nürnberg): Multivariate Ansätze zur Modellierung von Sprachvariation
Abstract zum Vortrag: siehe Ende dieser Seite

ab 20:00 Gemeinsames Abendessen

Mittwoch, den 16. März

09:00-10:30 Parallelstränge
A: Computerphilologie: Einführung in die Textanalyse mit TXM (Ulrike Henny & Christof Schöch)
B: Computerlinguistik: Korpusannotation und -analyse (Thomas Krefeld & Stephan Lücke)

10:30-11:00 Kaffeepause

11:00-12:00 Literaturverwaltung mit Zotero (Christof Schöch)

12:00-13:00 Mittagspause

13:00-14:00 Parallelstränge
A: Computerphilologie: Thematische Analyse großer Textsammlungen mit Topic Modeling (Christof Schöch)
B: Computerlinguistik 3: Programmgestützte Auswertung sprachlicher Daten (Annette Gerstenberg, FU Berlin)

14:00-14:30 Kaffeepause

14:30-16:00 Parallelstränge
A: Computerphilologie: Projektberatung (Christof Schöch)
B: Computerlinguistik: Projektberatung (Annette Gerstenberg)

16:00 Ende des Workshops

Hintergrund

Der Workshop wird gemeinsam von der Nachwuchsgruppe Computergestützte literarische Gattungsstilistik, dem Forum Junge Romanistik 2016 und der Arbeitsgruppe “Digitale Romanistik” im DRV ausgerichtet, Organisatoren vor Ort sind Christof Schöch und Robert Hesselbach. Der Workshop wird möglich durch Mittel des Bundesministeriums für Bildung und Forschung (BMBF), Förderkennzeichen FKZ 01UG1508.

Abendvortrag von Stefan Evert (Erlangen-Nürnberg): Multivariate Ansätze zur Modellierung von Sprachvariation

Multivariate Ansätze zur Modellierung von Sprachvariation

Sprachvariation – über verschiedene Zeiträume, Sprachvarietäten, Regiolekte, Soziolekte, individuelle Sprecher, Textsorten usw. hinweg – bildet einen wichtigen Forschungsgegenstand für die Korpuslinguistik, Dialektologie, historische Sprachwissenschaft, Soziolinguistik und für viele andere Disziplinen. Sie äußert sich empirisch durch erhebliche Schwankungen in den Vorkommenshäufigkeiten sprachlicher Einheiten und Strukturen sowie in anderen quantitativen Eigenschaften (z.B. durchschnittliche Satzlänge oder Type-Token-Ratio).

Oft weisen dabei Gruppen von Merkmalen ähnliche Variationsmuster auf, d.h. sie sind mathematisch korreliert. Multivariate Verfahren werten solche solche Korrelationen aus um die zugrundeliegenden “Dimensionen” der Sprachvariation zu ermitteln. Ein bekanntes Beispiel ist die multidimensionale Registeranalyse von Doug Biber, die auf einer sogenannten Faktorenanalyse (FA) beruht. Sehr ähnliche Ansätze finden sich aber auch in anderen Forschungsgebieten (z.B. der Textometrie und der distributionellen Semantik), wobei verschiedene mit FA verwandte multivariate Techniken zum Einsatz kommen (z.B. Korrespondenzanalyse (CA) oder Hauptkomponentenanalyse (PCA)).

Mein Vortrag zeigt verschiedene methodologische Schwierigkeiten und Fallstricke der multivariaten Analyse von Sprachvariation auf. Anhand mehrerer Fallstudien gebe ich “best practice”-Empfehlungen und stelle einen neuen, minimal überwachten Ansatz vor, mit dem verschiedene Aspekte der Sprachvariation voneinander getrennt und auch feinere Muster untersucht werden können.

Beitrag von: Christof Schöch

Redaktion: Christof Schöch

Verbundene Projekte / Publikationen