Gemeinsame Sentiment-Analyse von Text und Audio in Musik (de)
* Presenting author
Abstract:
Sentiment oder Mood können sich in der Musik auf verschiedenen Ebenen ausdrücken. Bei der automatischen Analyse werden meist die eigentlichen Audiodaten analysiert, der Text kann jedoch auch eine entscheidende Rolle bei der Wahrnehmung von Stimmungen spielen. Wir evaluieren verschiedene Modelle für die Sentiment-Analyse auf Text- und Audiobasis zunächst separat. Die entsprechenden Ansätze zeigen bereits zufrieden stellende Ergebnisse, weisen aber auch Schwächen auf, deren Ursachen wir genauer betrachten. Im weiteren werden verschiedene Herangehensweisen zur Kombination der Audio- und Textergebnisse vorgeschlagen und bewertet. Die Berücksichtigungen beider Modalitäten führt dabei im Allgemeinen zu einer Leistungssteigerung. Wir untersuchen Fehlklassifikationen sowie (auch gewollte) Widersprüche zwischen Audio- und Textsentiment genauer, und zeigen mögliche Ursachen auf. Abschließend beleuchten wir grundsätzliche Probleme in diesem Forschungsbereich, wie z.B. die hohe Subjektivität, fehlende Datengrundlagen und die Uneinheitlichkeit von Emotionstaxonomien.