Download full text
(353.5Kb)
Citation Suggestion
Please use the following Persistent Identifier (PID) to cite this document:
https://doi.org/10.21241/ssoar.99217
Exports for your reference manager
Text als Daten: Extraktion von Variablen mittels LSTM-Netzwerken
[conference paper]
Corporate Editor
Deutsche Gesellschaft für Soziologie (DGS)
Abstract Dieser Artikel stellt eine neue Methode vor, die Text direkt in quantitative Variablen umwandelt. Mithilfe von neuronalen Netzwerken des Typs "Long Short-Term Memory" (LSTM, Hochreiter und Schmidhuber 1997) nach Komninos und Manandhar (2016) kann sie latente Informationen aus Text in nominal-skalier... view more
Dieser Artikel stellt eine neue Methode vor, die Text direkt in quantitative Variablen umwandelt. Mithilfe von neuronalen Netzwerken des Typs "Long Short-Term Memory" (LSTM, Hochreiter und Schmidhuber 1997) nach Komninos und Manandhar (2016) kann sie latente Informationen aus Text in nominal-skalierte Variablen überführen. Wir testen unsere Methode mit einer Fallstudie und untersuchen, ob weiblich gelesene Personen seltener handeln als männlich gelesene Personen (vgl. auch Garg et al. 2018). Wir können zeigen, dass weiblich gelesene Personen insgesamt seltener als Akteure in Erscheinung treten als männlich gelesene. Diese ersten Ergebnisse zeigen, dass es mit diesem Ansatz möglich ist, Text automatisiert in Daten umzuwandeln und somit neue Wege für die quantitative Sozialforschung zu eröffnen.... view less
Keywords
gender; artificial intelligence; text analysis; quantitative method; data capture
Classification
Methods and Techniques of Data Collection and Data Analysis, Statistical Methods, Computer Methods
Free Keywords
LSTM; Machine Learning; Natural Language Processing
Collection Title
Polarisierte Welten: Verhandlungen des 41. Kongresses der Deutschen Gesellschaft für Soziologie 2022
Editor
Villa, Paula-Irene
Conference
41. Kongress der Deutschen Gesellschaft für Soziologie "Polarisierte Welten". Bielefeld, 2022
Document language
German
Publication Year
2023
ISSN
2367-4504
Status
Published Version; reviewed