Korpustutorium

DIE IDEE

Das Korpustutorium ist ein E-Learning-Projekt-Projekt zu drei wesentlichen Säulen empirischer Methodik in der Linguistik:

  • Teil I: Datenerhebung (mit CQP, Deutsch)
  • Teil II: Datenverarbeitung & -annotation (geplant)
  • Teil III: Datenanalyse (mit R, Englisch)

Dazu entstehen Lehrvideos, die die bisherigen CQP-Workshops der AG Stefanowitsch sowie die Gastworkshops in einzelnen Seminaren ersetzt haben. Die Videos werden vor allem in der ersten Phase eines Semesters im Flipped-Classroom-Modus eingesetzt. Genaueres erläutern die Dozent/innen der Seminare.

Das Tutorium ist unabhängig von einer Lehrveranstaltung und deshalb auch für das Selbststudium in Forschungskolloquien oder Offenen Modulen geeignet. Die Inhalte des Tutoriums werden aber als Methodenanteil in Aufbau-, Vertiefungs- und Masterseminaren vorausgesetzt bzw. praktisch angewandt und geübt (v.a. BA Englische Philologie & MA Sprachwissenschaft).

Ziel des Tutoriums ist die Befähigung der Studierenden zur eigenständigen Bearbeitung eines korpuslinguistischen Projekts, üblicherweise als Haus- oder Qualifikationsarbeit.

In den nächsten Jahren werden auch Tutorials zur Experimentellen Linguistik erstellt, die an praktischen Experiment-Übungen in die Verwendung von Software wie PsychoPy, OpenSesame oder SuperLab einführt.

Flach, Susanne. 2015–. Online-Tutorium „Korpuslinguistik mit CQP & Co“. Freie Universität Berlin. (CC-BY-SA-4.0)

 TEIL I: DATENERHEBUNG (mit CQP)

Der erste Teil führt systematisch in die Arbeit mit der Korpusabfragesprache CQP (Corpus Query Processor) ein und erfordert keine Vorkenntnisse. Voraussetzung für die Nutzung der Serverumgebung ist ein ZEDAT-Konto der Freien Universität Berlin, sowie ein Gerät, das eine SSH-Verbindung aufbauen kann (Laptops, Desktops, Tablets). Wenn Sie kein Mitglied der Freien Universität sind, müssten Sie sich CQP und Korpora selbst installieren.

TEIL II: DATENVERARBEITUNG

Im zweiten Teil geht es um die Frage, wie man mit den erhobenen Daten arbeitet. Es geht primär darum, ein Gefühl für grundlegende Aspekte des Annotierens von Korpusdaten zu entwickeln. Hierfür werden wir in kurzen Lehrvideos anhand von konkreten Fallstudien Strategien erkunden, wie man Korpusdaten in Tabellenkalkulationsprogrammen annotiert.

TEIL III: DATENANALYSE

Der dritte Teil befasst sich mit der Auswertung und Visualisierung der erhobenen und annotierten Daten (Teil I & II). Einfache statistische Auswertungen können meist schon mit Tabellenkalkulationsprogrammen vorgenommen werden. Für komplexere Auswertungen ist oft die Nutzung spezieller Statistiksoftware ratsam bzw. notwendig. Erste Teile sind zwei Einheiten: die erste Einheit erklärt die Grundlagen von R; die zweite Einheit stellt das Paket {collostructions} für die Kollostruktionsnalyse vor.