9 Digitale Verhaltensdaten und Webtracking
9.1 Folien
9.2 Studie zur heutigen Sitzung
9.3 Code und Ausgaben aus der Vorlesung
Pakete laden und Beispielsuchen anlegen
library(urltools)
library(tidyverse)── Attaching core tidyverse packages ──────────────────────── tidyverse 2.0.0 ──
✔ dplyr 1.1.4 ✔ readr 2.1.6
✔ forcats 1.0.1 ✔ stringr 1.6.0
✔ ggplot2 4.0.1 ✔ tibble 3.3.0
✔ lubridate 1.9.4 ✔ tidyr 1.3.1
✔ purrr 1.2.0
── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
✖ dplyr::filter() masks stats::filter()
✖ dplyr::lag() masks stats::lag()
ℹ Use the conflicted package (<http://conflicted.r-lib.org/>) to force all conflicts to become errors
urls <- c(
"https://userpage.fu-berlin.de/bachlm83/mame_public/",
"https://www.google.com/search?q=was+tun+bei+husten%3F&oq=was+tun+bei+husten%3F&gs_lcrp=EgZjaHJvbWUyBggAEEUYOTIHCAEQABiABDIHCAIQABiABDIHCAMQABiABDIHCAQQABiABDIICAUQABgWGB4yCAgGEAAYFhgeMggIBxAAGBYYHjIICAgQABgWGB4yCAgJEAAYFhge0gEIMzQzMGowajeoAgiwAgHxBaNDBeLUjhiT8QWjQwXi1I4Ykw&sourceid=chrome&ie=UTF-8",
"https://www.google.de/maps/place/Institut+f%C3%BCr+Publizistik-+und+Kommunikationswissenschaft/@52.4601017,13.305423,14.11z/data=!4m6!3m5!1s0x47a85a157dcfbc55:0xa914cbeb6886066c!8m2!3d52.4491161!4d13.2762011!16s%2Fg%2F11bytsmxsg?entry=ttu&g_ep=EgoyMDI2MDEwNi4wIKXMDSoASAFQAw%3D%3D",
"https://www.google.com/search?q=was+ist+das+ifpuk&oq=was+ist+das+ifpuk&gs_lcrp"
)
urls[1] "https://userpage.fu-berlin.de/bachlm83/mame_public/"
[2] "https://www.google.com/search?q=was+tun+bei+husten%3F&oq=was+tun+bei+husten%3F&gs_lcrp=EgZjaHJvbWUyBggAEEUYOTIHCAEQABiABDIHCAIQABiABDIHCAMQABiABDIHCAQQABiABDIICAUQABgWGB4yCAgGEAAYFhgeMggIBxAAGBYYHjIICAgQABgWGB4yCAgJEAAYFhge0gEIMzQzMGowajeoAgiwAgHxBaNDBeLUjhiT8QWjQwXi1I4Ykw&sourceid=chrome&ie=UTF-8"
[3] "https://www.google.de/maps/place/Institut+f%C3%BCr+Publizistik-+und+Kommunikationswissenschaft/@52.4601017,13.305423,14.11z/data=!4m6!3m5!1s0x47a85a157dcfbc55:0xa914cbeb6886066c!8m2!3d52.4491161!4d13.2762011!16s%2Fg%2F11bytsmxsg?entry=ttu&g_ep=EgoyMDI2MDEwNi4wIKXMDSoASAFQAw%3D%3D"
[4] "https://www.google.com/search?q=was+ist+das+ifpuk&oq=was+ist+das+ifpuk&gs_lcrp"
URLs, die “google.” enthalten
google_urls <- urls |>
str_subset(fixed("google."))
google_urls[1] "https://www.google.com/search?q=was+tun+bei+husten%3F&oq=was+tun+bei+husten%3F&gs_lcrp=EgZjaHJvbWUyBggAEEUYOTIHCAEQABiABDIHCAIQABiABDIHCAMQABiABDIHCAQQABiABDIICAUQABgWGB4yCAgGEAAYFhgeMggIBxAAGBYYHjIICAgQABgWGB4yCAgJEAAYFhge0gEIMzQzMGowajeoAgiwAgHxBaNDBeLUjhiT8QWjQwXi1I4Ykw&sourceid=chrome&ie=UTF-8"
[2] "https://www.google.de/maps/place/Institut+f%C3%BCr+Publizistik-+und+Kommunikationswissenschaft/@52.4601017,13.305423,14.11z/data=!4m6!3m5!1s0x47a85a157dcfbc55:0xa914cbeb6886066c!8m2!3d52.4491161!4d13.2762011!16s%2Fg%2F11bytsmxsg?entry=ttu&g_ep=EgoyMDI2MDEwNi4wIKXMDSoASAFQAw%3D%3D"
[3] "https://www.google.com/search?q=was+ist+das+ifpuk&oq=was+ist+das+ifpuk&gs_lcrp"
Suchen identifizieren und Suchanfragen extrahieren
google_search_urls <- google_urls |>
str_subset(fixed("search?"))
google_search_urls[1] "https://www.google.com/search?q=was+tun+bei+husten%3F&oq=was+tun+bei+husten%3F&gs_lcrp=EgZjaHJvbWUyBggAEEUYOTIHCAEQABiABDIHCAIQABiABDIHCAMQABiABDIHCAQQABiABDIICAUQABgWGB4yCAgGEAAYFhgeMggIBxAAGBYYHjIICAgQABgWGB4yCAgJEAAYFhge0gEIMzQzMGowajeoAgiwAgHxBaNDBeLUjhiT8QWjQwXi1I4Ykw&sourceid=chrome&ie=UTF-8"
[2] "https://www.google.com/search?q=was+ist+das+ifpuk&oq=was+ist+das+ifpuk&gs_lcrp"
Suchanfrage extrahieren
search_queries <- google_search_urls |>
str_extract(regex("(?<=q\\=).*?(?=&)"))
search_queries[1] "was+tun+bei+husten%3F" "was+ist+das+ifpuk"
Suchanfrage decodieren
search_queries_decoded <- search_queries |>
url_decode()
search_queries_decoded[1] "was tun bei husten?" "was ist das ifpuk"
9.4 Hausaufgabe
Lesen Sie diese beiden GESIS Guides to Digital Behavioral Data:
- What is Digital Behavioral Data? (Wagner et al., 2025)
- Overview of Working with Web Tracking Data (Mangold & Stier, 2025)
9.5 Transkript
Hinweise zum automatisiert erstellten Transkript
Das folgende Transkript wurde auf Basis der Aufzeichnung der Vorlesung erstellt. Die vollständige Aufzeichnungen inklusive der Bildschirminhalte sind in Blackboard🔒 verfügbar. Die Tonspur wurde mit VoiceAI transkribiert. Das Transkript wurde dann mit Sprachmodellen (v.a. Claude Sonnet 4.5) geglättet und formatiert. In diesem Prozess kann es an verschiedenen Stellen zu Fehlern kommen. Im Zweifel gilt das gesprochene Wort, und auch beim Vortrag mache ich Fehler.
Ich stelle das Transkript hier als experimentelles, ergänzendes Material zur Dokumentation der Vorlesung zur Verfügung. Noch bin ich mir unsicher, ob es eine sinnvolle Ergänzung ist und behalte mir vor, es weiter zu bearbeiten oder zu löschen.
