|
|
:toc:
|
|
|
:toclevels: 8
|
|
|
:toc-title: Table of contents (work in progress: this list is preliminary and will be updated continuously)
|
|
|
:sectnums:
|
|
|
:sectnumlevels: 8
|
|
|
|
|
|
= Digitale Methoden
|
|
|
|
|
|
== Automatisierte Datensammlung - (automated) data collection/extraction
|
|
|
|
|
|
=== data-scraping
|
|
|
|
|
|
==== web-scraping (minimal strukturiert)
|
|
|
Text(/Daten) aus Websiten extrahieren.
|
|
|
(Ignatow & Mihalcea, 2017, pp. 39–41)
|
|
|
|
|
|
===== statisch
|
|
|
Von statischen HTML-Websiten.
|
|
|
|
|
|
===== dynamisch
|
|
|
Durch HTML5/Javascript ausgelieferte dynamische Inhalte (=> erforderliche Nutzerinteraktion).
|
|
|
|
|
|
=== parsing (dokumentierte API)
|
|
|
Durch Schnittstellen bereitgestellte Daten.
|
|
|
|
|
|
=== device/software-driven (tracking)
|
|
|
Sammlung sowie Übermittlung durch eigene Hardware/Software (bereitgestelltes Gerät, Betriebssystem, Programm, App).
|
|
|
|
|
|
=== web-crawling
|
|
|
Erstellung einer Sammlung von Websiten ausgehend einer Auswahl von Links und der Verfolgung darin enthaltender Verlinkungen.
|
|
|
(Ignatow & Mihalcea, 2017, pp. 37–39)
|
|
|
|
|
|
== Datenaufbereitung - data wrangling
|
|
|
Daten in maschinenlesbare Form überführen. Beispiele: PDFs, Uneinheitliche Formate in Daten
|
|
|
|
|
|
Tips zur Durchführung in R
|
|
|
(Wickham & Grolemund, 2017, pp. 119–260)
|
|
|
|
|
|
== data mining/ knowledge extraction
|
|
|
"Data mining" ist eher zu verstehen als "knowledge extraction from data". Für "data mining" existiert kein kurzes deutsches Äquivalent.
|
|
|
|
|
|
=== text mining
|
|
|
Auf Text bezogene Strukturanalysen.
|
|
|
|
|
|
==== Suche
|
|
|
==== Frequenzanalysen
|
|
|
"counting things" als Methode
|
|
|
(Salganik, 2018, pp. 41–45)
|
|
|
|
|
|
===== Wortfrequenzanalyse - word frequency extraction
|
|
|
Häufigkeitsanalysen zu Wörtern Begriffen.
|
|
|
|
|
|
===== Diktionärsansatz - dictionary-extraction /analysis
|
|
|
Häufigkeitsanalysen bezüglich Wortgruppen.
|
|
|
|
|
|
==== Topic-Analysen
|
|
|
Einführung, Def. 157
|
|
|
(Ignatow & Mihalcea, 2017, pp. 156–163)
|
|
|
|
|
|
===== Kookurenzanalysen - co-occurence analysis
|
|
|
|
|
|
===== Latent Dirichelet Allocation (LDA)
|
|
|
Ausführliche Methodenbestimmung und Verfahrensweise
|
|
|
(Maier et al., 2018)
|
|
|
|
|
|
===== Structural Topic Model
|
|
|
Methodendarstellung; Mögliche Anwendung bei "Open-ended Questions in Survey Experiments"
|
|
|
(Roberts, Stewart, Tingley, Airoldi, & others, 2013)
|
|
|
|
|
|
===== sentiment analysis
|
|
|
Definition
|
|
|
"Subjectivity and sentiment analysis focuses on the automatic identification of private states, such as opinions, emotions, sentiments, evaluations, beliefs, and speculations in natural language. While subjectivity classification labels text as either subjective or objective, sentiment classification adds an additional level of granularity, by further classifying subjective text as either positive, negative, or neutral." (Ignatow & Mihalcea, 2017, pp. 148–155)
|
|
|
|
|
|
==== Annotation/Klassifikation
|
|
|
|
|
|
===== syntaktisch
|
|
|
|
|
|
===== semantisch
|
|
|
Zur überwachten automatischen Klassifikation
|
|
|
(Lemke & Wiedemann, 2016, pp. 52–54)
|
|
|
====== supervised learning
|
|
|
Einführung
|
|
|
(Ignatow & Mihalcea, 2017, pp. 62–72)
|
|
|
Supervised learning im Kontext der Text-Klassifikation
|
|
|
(Scharkow, 2013)
|
|
|
|
|
|
==== Enitätsanalyse
|
|
|
|
|
|
===== named-entity-extraction/recognition
|
|
|
|
|
|
===== Relationsmodellierung
|
|
|
|
|
|
====== Knowledge graph construction
|
|
|
|
|
|
==== automated (thematic, narrative or methapor) analysis
|
|
|
Einführung in die jeweiligen Bereiche(Thema, Narrativ und Metapher)
|
|
|
(Ignatow & Mihalcea, 2017, pp. 73–103)
|
|
|
|
|
|
==== Clusteranalysen
|
|
|
|
|
|
==== Blended Reading
|
|
|
Erschließung großer Textmengen durch Kombination verschiedener text-mining Methoden
|
|
|
(Lemke & Wiedemann, 2016, pp. 17–61)
|
|
|
|
|
|
==== Netzwerkanalyse (auf Texte bezogen)
|
|
|
|
|
|
=== meta-data mining
|
|
|
|
|
|
==== (geo-)spatial analysis
|
|
|
Einführung in Mining-Methoden mit räumlichen Metadaten.
|
|
|
(Sloan & Quan-Haase, 2017, 285ff.)
|
|
|
|
|
|
==== temporal analysis
|
|
|
|
|
|
====== interface methods
|
|
|
temporal co-occurence analysis
|
|
|
(Marres, 2017, pp. 106–112)
|
|
|
detaillierte Darstellung:
|
|
|
(Marres & Gerlitz, 2016)
|
|
|
|
|
|
===== volatility analysis
|
|
|
|
|
|
== digitale Datenerhebung (neue Möglichkeiten von Experimentalgestaltung) - digital research designs
|
|
|
|
|
|
==== ecological momentary assessments (EMA)/ Experience Sampling Method (ESM)
|
|
|
EMA und ESM unterscheiden sich nur geringfügig; EMA enthält eher medizinische Fragen und Messungen und ist auf natürliche Umgebung bezogen.
|
|
|
|
|
|
Enthält vier Charakteristika:
|
|
|
1) Datensammlung in natürlichen Umgebungen 2) Fokussierung auf zeitlich nahe Erfahrungen/ Verhaltensweisen 3) Fragen, welche Event-ausgelöst oder randomisiert gestellt werden 4) sowie mehrerer Fragen über einen bestimmten Zeitraum [Zitat nach Stone and Shiffmann 1994] (Salganik, 2018, p. 109)
|
|
|
|
|
|
==== wiki surveys
|
|
|
Weitere Eingrenzug von Antwortvorschlägen in Umfragen anhand Wiki-ähnlicher Umfragen.
|
|
|
Beispiel: http://www.allourideas.org (Salganik, 2018, pp. 111–115)
|
|
|
|
|
|
==== surveys linked to big data sources
|
|
|
Antwortmöglichkeiten bei Umfragen verbessern unter Rückgriff auf große Datenmengen.
|
|
|
(Salganik, 2018, pp. 117–130)
|
|
|
|
|
|
==== gamification in Umfragen
|
|
|
Strategie um Motivation von Probanden zu erhöhen.
|
|
|
(Salganik, 2018, pp. 115–117)
|
|
|
|
|
|
== statistische Modellierung
|
|
|
=== Regressionsanalyse
|
|
|
Einführung mit R;
|
|
|
(Singh & Allen, 2017, pp. 103–152)
|
|
|
|
|
|
=== Zeitreihenanalyse
|
|
|
Detaillierte Einführung in aktuelle Modelle(ARMA, GARCH, VaR).
|
|
|
(Singh & Allen, 2017, pp. 153–182)
|
|
|
|
|
|
==== Nowcasting
|
|
|
Using methods to predict the future for estimation of current values. (Ex. predict influenza epidemiology combining CDC Data and Google Trends.
|
|
|
(Salganik, 2018, pp. 46–50)
|
|
|
|
|
|
=== ökonometrische Modelle
|
|
|
|
|
|
==== dynamische Modelle
|
|
|
"Dynamische Modelle berücksichtigen verzögerte Variablen, so dass sie in Erweiterung von statischen Mollen erlauben, die zeitliche Dynamik von wirtschaftlichen Abläufen zu beschreiben."
|
|
|
(Hackl, 2013, p. 286)
|
|
|
|
|
|
==== Mehrgleichungsmodelle
|
|
|
"Mit Mehrgleichungs-Modellen können Systeme dargestellt werden, in denen die Entwicklungen und Wechselwirkungen von mehr als einer endogenen Variablen beschrieben werden können."
|
|
|
(Hackl, 2013, p. 286)
|
|
|
|
|
|
== Daten-Visualisierungen
|
|
|
Visualisierung mit R in der Ökonometrie
|
|
|
(Singh & Allen, 2017, pp. 75–102)
|
|
|
|
|
|
== digitale Wissenschaftskommunikation
|
|
|
=== webbasiert
|
|
|
=== app-basiert
|
|
|
=== audio-basiert (podcasts)
|
|
|
== kollaboratives Arbeiten
|
|
|
=== Dokumentenerstellung
|
|
|
=== Arbeitsaufteilung (open call projects)
|
|
|
=== Verteilte Datenerhebung
|
|
|
== Analyse sozialer Netzwerke - (social) network (structure) analysis
|
|
|
Einführung
|
|
|
(Cioffi-Revilla, 2014, pp. 89–117)
|
|
|
(Staab, Koltsova, & Ignatov, 2018)
|
|
|
(Sloan & Quan-Haase, 2017, 197ff. 365ff.)
|
|
|
|
|
|
=== link analysis
|
|
|
== complexity modeling/deep learning
|
|
|
=== social simulation models
|
|
|
|
|
|
= References
|
|
|
Cioffi-Revilla, C. (2014). Introduction to Computational Social Science: Principles and Applications. Texts in Computer Science. London, s.l.: Springer London. Retrieved from http://dx.doi.org/10.1007/978-1-4471-5661-1
|
|
|
Hackl, P. (2013). Einführung in die Ökonometrie (2., aktualisierte Aufl.). Wi - Wirtschaft. München: Pearson. Retrieved from http://lib.myilibrary.com/detail.asp?id=650988
|
|
|
|
|
|
Ignatow, G., & Mihalcea, R. F. (2017). Text mining: A guidebook for the social sciences. Los Angeles, London, New Delhi, Singapore, Washington DC, Melbourne: Sage.
|
|
|
|
|
|
Lemke, M., & Wiedemann, Gregor (Eds.). (2016). Text Mining in den Sozialwissenschaften: Grundlagen und Anwendungen zwischen qualitativer und quantitativer Diskursanalyse. Wiesbaden: Springer VS.
|
|
|
|
|
|
Maier, D., Waldherr, A., Miltner, P., Wiedemann, G., Niekler, A., Keinert, A., . . . Adam, S. (2018). Applying LDA Topic Modeling in Communication Research: Toward a Valid and Reliable Methodology. Communication Methods and Measures, 12, 93–118. https://doi.org/10.1080/19312458.2018.1430754
|
|
|
|
|
|
Marres, N. (2017). Digital sociology: The reinvention of social research. Cambridge, UK, Malden, MA, USA: Polity.
|
|
|
|
|
|
Marres, N., & Gerlitz, C. (2016). Interface Methods: Renegotiating Relations between Digital Social Research, STS and Sociology. The Sociological Review, 64, 21–46. https://doi.org/10.1111/1467-954X.12314
|
|
|
|
|
|
Roberts, M. E., Stewart, B. M., Tingley, D., Airoldi, E. M., & others (2013). The structural topic model and applied social science. In Advances in neural information processing systems workshop on topic models: computation, application, and evaluation (pp. 1–20).
|
|
|
|
|
|
Salganik, M. J. (2018). Bit by bit: Social research in the digital age.
|
|
|
|
|
|
Scharkow, M. (2013). Thematic content analysis using supervised machine learning: An empirical evaluation using German online news. Quality & Quantity, 47, 761–773. https://doi.org/10.1007/s11135-011-9545-7
|
|
|
|
|
|
Singh, A. K., & Allen, D. E. (2017). R in Finance and Economics: WORLD SCIENTIFIC.
|
|
|
|
|
|
Sloan, L., & Quan-Haase, A. (Eds.). (2017). The SAGE handbook of social media research methods. Los Angeles, London, New Delhi, Singapore, Washington DC, Melbourne: SAGE reference. Retrieved from https://ebookcentral.proquest.com/lib/gbv/detail.action?docID=4771733
|
|
|
|
|
|
Staab, S., Koltsova, O., & Ignatov, D. I. (Eds.). (2018). Information Systems and Applications, incl. Internet/Web, and HCI: Vol. 11185. Social Informatics: 10th International Conference, SocInfo 2018, St. Petersburg, Russia, September 25-28, 2018, Proceedings, Part I. Cham: Springer International Publishing. Retrieved from https://doi.org/10.1007/978-3-030-01129-1
|
|
|
|
|
|
Wickham, H., & Grolemund, G. (2017). R for Data Science: Import, tidy, transform, visualize, and model data. Beijing, Boston, Farnham, Sebastopol, Tokyo: O'Reilly UK Ltd.
|
|
|
|