Emoji sind voller Emotionen. Es kann den Ton und die Stimmung des Textes verbessern oder anpassen, gleichzeitig können die durch Emojis ausgedrückten Emotionen offensichtlicher sein als nur Worte.

Zum Beispiel dieses Emoji 👿 (wütendes Gesicht mit Hörnern). Es hat offensichtlich die Form eines Teufelscharakters, so dass es möglicherweise Gedanken gibt, die es für ein "schlechtes" Emoji halten, wie einige böse Gedanken im Kopf von jemandem.

Dennoch ist diese Art der Beschreibung sehr abstrakt. Können wir daher die Stimmungstypen und -stufen visualisieren, die durch diese Emojis ausgedrückt werden?


Die Antwort ist natürlich "Ja"! Wir haben Natural Language Processing (NLP) an öffentlichen Stichproben von nicht weniger als 50 Millionen Tweets durchgeführt und verwenden die Text-Sentiment-Analyse (auch Opinion Mining genannt), um das Emoji-Sentiment mit einer Reihe von Werten zu verknüpfen und zu visualisieren. Wir haben viel Zeit, Energie und Rechenleistung aufgewendet, um unsere Emoji-Sentiment-Analyse wissenschaftlicher und rigoroser zu gestalten, damit jeder den Charme spüren und Emoji besser verstehen kann.

Visuelle Diagramme für die Emoji-Sentimentanalyse

Daten wie der Emoji-Sentiment-Wert wurden nach der Text-Sentiment-Analyse berechnet, die zur Statistik und Wahrscheinlichkeitstheorie gehört. Nachdem wir das Problem der Algorithmen und Rechenleistung gelöst hatten, stießen wir auf neue Schwierigkeiten: Wie kann man Benutzern diese professionellen Daten verständlich machen?

Ein Gedanke geht uns durch den Kopf – – He! Wie wäre es, wenn wir Emoji-Sentimentwerte mit einigen coolen Designs visualisieren!

💡: Wir haben die berechneten und analysierten Daten (links) in ein für Benutzer besser verständliches Diagramm (rechts) umgewandelt, das die emotionale Aufteilung von Emojis intuitiver zeigen kann;

Lassen Sie mich das folgende Diagramm erklären, das die Ergebnisse der Sentiment-Tendenzanalyse von Emojis in der tatsächlichen Kommunikation darstellt.

💡: 2 Arten von Diagrammen für die Sentimentanalyse von Emoji ,, hier analysieren wir nur das obige Diagramm.

Der Halbkreisbogen im Bild ist in drei Farben unterteilt, die unterschiedliche emotionale Tendenzen von Emoji darstellen . Wie wir sehen, sind die Proportionen dieser drei Emotionen etwa 4:1:5, Grün und Orange haben ähnliche Proportionen, was bedeutet, dass dieses Emoji eher neutral ist (Überraschung!!).

  • Der graue Cursor ist das Vertrauensniveau , ein statistisches Konzept. Seine Position und Breite zeigen an: Expected Value ± Confidence .
  • Erwarteter Wert : Es ist der gewichtete Durchschnitt dispersiver Zufallsvariablen des Emoji-Sentimentwerts, der verwendet wird, um die Wahrscheinlichkeit auszudrücken, c ∈ [−1, 0, +1] .
  • Vertrauen : Es ist der Parametersatz der Emoji-Sentimentwertverteilung, der einen angemessenen Fehlerbereich in Form von positiven und negativen Intervallen zeigt. Und je größer die Anzahl der Korpusproben ist, desto kleiner ist der Fehler.

Einfach gesagt, je näher der Cursor links ist, desto negativer ist die Emotion dieses Emojis. Im Gegenteil, je näher der Cursor rechts ist, desto mehr positive Emotionen drückt dieses Emoji aus. Und je schmaler der Cursor ist, desto genauer ist die Beurteilung der Emotion.


Können Sie nun unser Diagramm zur Emoji-Sentimentanalyse verstehen?

Was ist eine Sentimentanalyse?

Ich glaube, dass Sie das Datendiagramm der Emoji-Sentimentanalyse verstanden haben, also lassen Sie uns über die Sentimentanalyse sprechen.

Die Stimmungsanalyse wird auch als Opinion Mining bezeichnet. Technisch gesehen ist die Sentimentanalyse Teil der Natural Language Processing (NLP)-Forschung. Die Methoden der Stimmungsanalyse werden in zwei Typen unterteilt: maschinelles Lernen und wörterbuchbasierte Methoden . Aber mit der Entwicklung der Deep-Learning-Technologie ist der Einsatz dieser Technologie für die Sentiment-Analyse zum Mainstream geworden.

Der Sentiment-Analyseprozess umfasst Datenvorverarbeitung, Feature-Engineering und Modelltraining. Im Allgemeinen unterteilt die Datenvorverarbeitungsphase den Text hauptsächlich in Wörter und entfernt Stoppwörter und Satzzeichen. Unsere Sentimentanalyse behält jedoch Satzzeichen und Stoppwörter bei. In der Feature-Engineering-Phase haben wir uns für die vom Google-Team im Jahr 2013 vorgeschlagene Wort-Einbettungsdarstellung (Word2Vec) entschieden, die in das CBOW-Modell (Continuous Bag of Words) und das Skip-Gram- Modell unterteilt ist. Die Modellergebnisse sind wie folgt:

💡:Links das CBOW-Modell, rechts das Skip-Gram-Modell

CBOW basiert auf dem Kontext, um das zu trainierende Zielwort vorherzusagen, um den Wortvektor zu erhalten. Wie in der Figur gezeigt, wird W(t) basierend auf vier Wörtern W(t-2), W(t-1), W(t+1), W(t+2) vorhergesagt; Und Skip-Gramm soll die umgebenden Wörter gemäß dem Zielwort vorhersagen, um zu trainieren, um den Wortvektor zu erhalten. Wie in der Figur gezeigt ist, W(t-2),W(t-1),W(t+1),W(t+2) gemäß W(t) vorherzusagen.

In der Modellvorhersagephase teilen wir die Daten in zwei Teile auf: Der Trainingssatz wird im Verhältnis 5:1 geteilt und der Testsatz und der Trainingssatz werden ungeordnet verarbeitet.

Anwendung der Stimmungsanalyse in Emoji

Die Stimmungsanalyse ist eine umfassende Analysemethode, die Deep Learning und Statistik kombiniert. Wir haben den Sentiment-Wert von Emojis nach einer komplexen Analyse und Berechnung von riesigen Datenmengen erhalten, und der vollständige Emoji-Sentiment-Analyseprozess ist wie folgt:

Der Prozess der Emoji-Sentiment-Analyse

  • Social-Networking-Korpus beschriften
  • Datenvorverarbeitung
  • Teilen Sie den Datensatz auf: Trainingssatz (80%), Testsatz (20%)
  • Verwenden Sie das neuronale Netzwerk LSTM, um ein Modell zu erstellen
  • Passen Sie die Hyperparameter entsprechend der Leistung des Modells im Testsatz an, um die Generalisierungsfähigkeit des Modells zu verbessern
  • Führen Sie dieselbe Datenvorverarbeitungsaktion für nicht gekennzeichnete Daten durch
  • Verwenden Sie das trainierte Stimmungsvorhersagemodell, um die Stimmungstendenz für nicht gekennzeichnete Daten vorherzusagen

Wir führen eine Sentimentanalyse für Emojis durch und verwenden Deep-Learning-Technologie, um zu trainieren, um einen Emoji-Text-Sentimentklassifizierer zu erhalten. Für die Ausgabeschicht des Klassifikators wählen wir die zu aktivierende Sigmoid-Funktion und projizieren die Ergebnisse der Ausgabeschicht in das Intervall von 0-1. Je näher der Text bei 0 liegt, desto negativer ist er, und je näher er bei 1 liegt, desto positiver ist er.

Die Formel der Sigmoidfunktion lautet: F(x)=1/(1+ex)

Wir verwenden eine große Stichprobe von 50 Millionen Tweets, die Emojis enthalten, als Analysekorpus und stellen dann den zu analysierenden Korpus in den trainierten Sentiment-Klassifikator für die Sentiment-Vorhersage. Schließlich werden die Ergebnisse der Stimmungsvorhersage durch den Klassifikator in drei Typen unterteilt: negativ, neutral und positiv. Die Klassifizierungskriterien sind:

Wie auch immer, es ist schwierig, aber wir haben es geschafft!!

Die Verwendung und Aussicht der Emoji-Sentiment-Analyse

Die Stimmungsanalyse wird häufig in Marketing, Werbung, Psychologie, Medizin und anderen Bereichen eingesetzt. Wir beschließen, eine Emoji-Sentiment-Analyse durchzuführen, um den Menschen zu helfen, Emoji in der tatsächlichen sozialen Interaktion besser zu verstehen, Mehrdeutigkeiten und Missverständnisse von Emoji effektiver zu beseitigen.

Wenn du zum Beispiel mit deinem Freund (oder deinem Schwarm) online chattest, sendet dir die andere Person manchmal Emojis, die du nicht ganz verstehst. Tatsächlich gibt es viele Situationen wie diese, wie zum Beispiel:

Wie wir wissen, können Sie nicht ein Emoji die genaue Bedeutung sagen, aber durch unser Sentiment - Analyse, können Sie diese Emojis psychologisch analysieren können, wie „sie mich gesandt hat ein 💞, es ist ein positives Zeichen, vielleicht sollte ich sie aus fragen“ oder " Warum schickt mir mein Freund ein 😒? Es ist irgendwie negativ, ist er sauer auf mich?" , etwas wie das. Ich glaube, dass Sie mit unserer Emoji-Sentiment-Analyse Emoji besser verstehen können.


Alles in allem haben wir viel für dieses Emoji-Sentiment-Analyseprojekt bezahlt. Auch wenn es schwierig ist, wollen wir es dennoch vertiefen. Wir analysieren jetzt Emoji in verschiedenen Sprachen, den emotionalen Gewinneffekt von Emoji auf reinen Text und mehrere andere fortgeschrittene Studien wurden ebenfalls in Betracht gezogen. All dies dient dazu, die Verwendung von Emojis besser zu erkunden und zu hoffen, dass Sie Emojis interessant und informativ finden.