Volltext herunterladen
(353.5 KB)
Zitationshinweis
Bitte beziehen Sie sich beim Zitieren dieses Dokumentes immer auf folgenden Persistent Identifier (PID):
https://doi.org/10.21241/ssoar.99217
Export für Ihre Literaturverwaltung
Text als Daten: Extraktion von Variablen mittels LSTM-Netzwerken
[Konferenzbeitrag]
Körperschaftlicher Herausgeber
Deutsche Gesellschaft für Soziologie (DGS)
Abstract Dieser Artikel stellt eine neue Methode vor, die Text direkt in quantitative Variablen umwandelt. Mithilfe von neuronalen Netzwerken des Typs "Long Short-Term Memory" (LSTM, Hochreiter und Schmidhuber 1997) nach Komninos und Manandhar (2016) kann sie latente Informationen aus Text in nominal-skalier... mehr
Dieser Artikel stellt eine neue Methode vor, die Text direkt in quantitative Variablen umwandelt. Mithilfe von neuronalen Netzwerken des Typs "Long Short-Term Memory" (LSTM, Hochreiter und Schmidhuber 1997) nach Komninos und Manandhar (2016) kann sie latente Informationen aus Text in nominal-skalierte Variablen überführen. Wir testen unsere Methode mit einer Fallstudie und untersuchen, ob weiblich gelesene Personen seltener handeln als männlich gelesene Personen (vgl. auch Garg et al. 2018). Wir können zeigen, dass weiblich gelesene Personen insgesamt seltener als Akteure in Erscheinung treten als männlich gelesene. Diese ersten Ergebnisse zeigen, dass es mit diesem Ansatz möglich ist, Text automatisiert in Daten umzuwandeln und somit neue Wege für die quantitative Sozialforschung zu eröffnen.... weniger
Thesaurusschlagwörter
Gender; künstliche Intelligenz; Textanalyse; quantitative Methode; Datengewinnung
Klassifikation
Erhebungstechniken und Analysetechniken der Sozialwissenschaften
Freie Schlagwörter
LSTM; Machine Learning; Natural Language Processing
Titel Sammelwerk, Herausgeber- oder Konferenzband
Polarisierte Welten: Verhandlungen des 41. Kongresses der Deutschen Gesellschaft für Soziologie 2022
Herausgeber
Villa, Paula-Irene
Konferenz
41. Kongress der Deutschen Gesellschaft für Soziologie "Polarisierte Welten". Bielefeld, 2022
Sprache Dokument
Deutsch
Publikationsjahr
2023
ISSN
2367-4504
Status
Veröffentlichungsversion; begutachtet