CQP

Ziel ist es, dass Sie das CheatSheet verstehen und CQP eigenständig nutzen können. Sie können das provisorische CQP-Tutorial „A practical guide“ nutzen, das Übungsaufgaben und Lösungsvorschläge enthält, das Online-Tutorium ist davon aber unabhängig. Bei Fragen schreiben Sie mir eine Mail.

Die einzelnen Clips einer Folge sind ca. 2–5min lang. Ohne Vorkenntnisse sollten Sie alle Clips in der vorgegebenen Reihenfolge durchgehen (insbesondere bei den Folgen 1 & 3–11). Folgen 12, 13 und 14 stellen einzelne Korpora und ihre Besonderheiten vor und werden nicht aufeinander aufbauen.

NEU: Was kommt nach der Datenerhebung? Working with linguistic data in Excel!

INHALTSVERZEICHNIS

Folge 0: Was machen wir hier?
Folge 1: Einführung
Folge 2: Verbindung zum Login-Server
Folge 3: Einstieg in CQP
Folge 4: Reguläre Ausdrücke
Folge 5: Mehrwortmuster
Folge 6: Das CQP-Prinzip
Folge 7: Zählen
Folge 8: Sortieren, Randomisieren, Stichproben
Folge 9: Metainformationen (Strukturattribute)
Folge 10: Einstellungen setzen
Folge 11: Export, Aufräumen, Download
Folge 12: Arbeiten mit historischen Korpora
Folge 13: Arbeiten mit Korpora anderer Sprachen
Folge 14: Arbeiten mit Spezialkorpora

Folge 0: Was soll das Korpustutorium insgesamt leisten?

Übersicht (Sorry, leider bescheidener Ton)

Folge 1: Einführung (Playlist, ca. 18 Minuten)

§1.1: Was ist ein Korpus?
§1.2: Abfragesysteme
§1.3: CQP-Datenmodell
§1.4: CQP für alle: cqp@fu

Folge 2: Verbindung zum Login-Server (Playlist)

Clips bauen nicht aufeinander auf, aber alle Nutzer/innen müssen das Skript ausführen, das in §2.4 besprochen wird. (Die Clips dieser Folge haben leider eine mindere Tonqualität.)

§2.1: PuTTY (Windows)
§2.2: Terminal (Mac/Linux)
§2.3: Tablets (Allgemeines & Demo)
§2.4: CQP-Einstellungen setzen
§2.x: Fehlermeldungen beim Verbindungsaufbau (X-Files)

(Anmerkung: wenn Ihr ZEDAT-Konto bereits länger als sieben Jahre existiert, kann es sein, dass Sie CQP nicht ohne weitere Einstellungen nutzen können. Bitten Sie die ZEDAT, für Ihren Userspace auf dem Login-Server standardmäßig die BASH-Shell einzustellen.)

Folge 3: Einstieg in CQP (Playlist, ca. 25min)

(Die Clips dieser Folge haben leider eine mindere Tonqualität.)

§3.1: Im CQP-Raum
§3.2: Erste Abfragen & Konkordanzansicht
§3.3: Abfragenverwaltung
§3.4: Very Basic Unix
§3.x: Tipparbeit sparen (X-Files)

Folge 4: Reguläre Ausdrücke (Playlist, ca. 30min)

§4.1: Wortformen I (Optionale Buchstaben) – ?
§4.2: Wortformen II (Mehr optionale Buchstaben)
§4.3: Klassen & Sequenzen gruppieren – [] & ()
§4.4: Wildcards – .
§4.5: Operatoren kombinieren
§4.6: Logisches ODER – Pipe |
§4.7: Wiederholungsoperatoren I ( + und * )
§4.8: Wiederholungsoperatoren II (+ und * in Aktion)
§4.9: Groß- & Kleinschreibung ( %c )
§4.x: Fehlermeldungen in CQP (X-Files)

Folge 5: Mehrwortmuster (Playlist, ca. 18min)

§5.1: Mehr als ein Wort finden I
§5.2: Mehr als ein Wort finden II
§5.3: Variable Strings
§5.4: Variable Strings begrenzen – {min,max}
§5.x: Token, Satzzeichen & Operatoren (X-Files)

Folge 6: Das CQP-Prinzip: Annotationen (Playlist, ca. 25min)

§6.1: Wortklassen
§6.2: Lemmas
§6.3: Das CQP-Prinzip revisited
§6.4: Übungsbeispiel: Phrasen
§6.5: Übungsbeispiel: Split Infinitives
§6.6: Übungsbeispiel: Progressive
§6.7: Infos finden

Folge 7: Zählen in CQP (Playlist, ca. 13min)

§7.1: Zählen: 1-Gramme
§7.2: Zählen: N-Gramme
§7.4: Übungsbeispiel: X-and-X-Koordination
§7.x: Zählen hilft! (X-Files)

Folge 8: Sortieren, Randomisieren, Stichproben (Playlist, ca. 9min)

§8.1: Sortieren
§8.2: Randomisieren
§8.3: Stichproben ziehen

Folge 9: Metainformationen nutzen (Playlist, ca. 13min)

§9.1: Nach Strukturattributen auszählen (group-Befehl)
§9.2: Nach Strukturattributen eingrenzen
§9.3: Strukturattribute & Besonderheiten
§9.4: Satzgrenzen & Satztags (within s)

Folge 10: Einstellungen ändern (Playlist, ca. 8min)

§10.1: Kontext vergrößern (set Context)
§10.2: Metainformationen anzeigen (set PrintStructures)
§10.3: Positionsattribute anzeigen (show +pos)

Folge 11: Exportieren, Aufräumen, Download (Playlist, 7min)

§11.1: Konkordanzen exportieren
§11.2: Konkordanzen aufräumen
§11.3: Frequenzlisten aufräumen
§11.4: Dateien runterladen

Folge 12: Arbeiten mit historischen Korpora

§12.1: Corpus of Late Modern English Texts (CLMET)
§12.2: Penn-Korpora (PPCME2, PPCEME, PPCEEC, PPCMBE)
§12.3: Dictionary of Old English (DOE)

Folge 13: Arbeiten mit Korpora anderer Sprachen

§13.1: LCC-Korpora (DE, EN, ES, FR, IT…)
§13.2: German-Manchester Corpus (GERMANC)
§13.3: Deutsches Textarchiv (DTA)

Folge 14: Arbeiten mit Spezialkorpora

§14.1: ICE-Korpora
§14.2: SWITCHBOARD

Folge 15: Fallstudie I
Folge 16: Fallstudie II