Jedes Emoji ist etwas Besonderes. Solange Sie es richtig analysieren, können Sie auf einen Blick viele Informationen wie Bedeutungen, Kategorie, verwandtes Thema und sogar eine einzigartige Verwendung eines Emojis herausfinden👀. Nachdem wir für jedes Emoji eine große Menge an Berechnungen und Analysen durchgeführt haben, erhalten wir schließlich Emoji Tag Cloud , Schlüsselwörter und Phrasen, die sich auf ein bestimmtes Emoji beziehen, und stellen es auf eine neuartige visuelle Weise dar.

🔺Die Schlagwortwolke von Emoji [Einhorn🦄]

Wie bekommen wir Tags?

Wie wir alle wissen, ist Twitter ein weltweit bekannter sozialer Netzwerkdienst, und die Leute twittern gerne Texte mit Emojis, um ihre Emotionen auszudrücken oder einfach nur als Dekoration. Die meisten unserer Tags stammen aus Tweets auf der ganzen Welt. Wir analysieren Tweets von 2018.01 bis 2021.11 und extrahieren die Tags aus 812 Millionen Tweets, die Emojis enthalten. Dann verwenden wir Statistiken und Algorithmen, um die Texte auszuwählen, die für ein bestimmtes Emoji höchst relevant sind, und unterscheiden die Sprache. Dadurch können wir sogar wissen, wie ein Emoji in verschiedenen Ländern verwendet wird.

Hier verwenden wir eine englische Site als Beispiel. Diese 2 Emojis auf unserer englischen Seite: 😎 (lächelndes Gesicht mit Sonnenbrille) und 🦄 (Einhorn). Wir führen eine Tag-Extraktion für sie durch und erhalten Wörter wie [cool] oder [nicki] .

Hier zeigt sich ein neues Problem❓: Natürlich gibt es viele Texte zu einem Emoji, wie wählen wir dann das am besten geeignete Tag aus und wie ordnen wir sie an?

In dieser Situation beinhalten sie weitere Algorithmen.

Die professionelle Technologie-Erklärung zur Tag-Extraktion

Es gibt viele Arten von Tag-Extraktionstechnologien mit unterschiedlichen Auswirkungen, wie beispielsweise die abstrakte Extraktion für Artikel und Keyword-Tagging-Algorithmen für kurze Texte. Unsere "Emoji Tag Cloud-Twitter Tag Extraction" basiert auf dem TF-IDF Algorithmus . Es wird mit einem modifizierten Verfahren durchgeführt, das auf den Eigenschaften der Twitter-Daten basiert, bei dem es sich um einen unbeaufsichtigten Algorithmus zur Extraktion von Kurztext-Label handelt.

Um das Verständnis zu erleichtern, fassen wir hier das Verfahren zum Extrahieren von Tags in 3 Schritte zusammen.

  • Zuerst führen wir Emoji-Extraktion und Textbereinigung für jeden Tweet mit einem Monat als Einheit durch, entfernen Themen und Spitznamen wie [@xx], [#xx] und löschen die Tweet-URL. Während der Textbereinigung filtern wir auch Stoppwörter in verschiedenen Sprachen (zum Beispiel entfernen Sie einige Modalpartikel wie ah, oh usw.), Abkürzungen, Wortformen, Großschreibung und andere Faktoren und erhalten schließlich Worthäufigkeitsdaten entsprechend jedem Emoji .
  • Zweitens verwenden wir den Textdarstellungsalgorithmus TF-IDF (Term Frequency-Inverse Document Frequency), um eine anfängliche Etikettentextgewichtung basierend auf den im vorherigen Schritt erhaltenen Ergebnissen zu berechnen.
  • Die Berechnungsformel lautet: TF-IDF = TF * IDF

    TF (Begriffshäufigkeit) wird erhalten, indem die Anzahl des Vorkommens eines Wortes, das einem Emoji entspricht, durch die Gesamtzahl der Wörter, die dem Emoji entsprechen, geteilt wird. IDF ist die inverse Dokumentenhäufigkeit, IDF = log( N / N(w) ) , während [N] die Gesamtzahl der Emojis darstellt, [N(w)] die Anzahl der Emojis darstellt, die das Wort [w] enthalten.

    🔺Wenn ein Wort sowohl in EmojiA als auch in EmojiB vorkommt, bedeutet dies, dass das Wort nicht repräsentativ genug ist und die Gewichtung dieses Wortes reduziert werden sollte. Aus der Formel IDF = log( N / N(w) ) ist ersichtlich, dass der Bereich von IDF zwischen 0 und positiv unendlich mit der Zunahme von N(w) abnimmt.

    Wenn ein Begriff mehrmals in einem Artikel vorkommt, bedeutet dies, dass das Gewicht des Begriffs höher ist. Die am häufigsten vorkommenden Wörter sind jedoch Wörter, die einen Ton ausdrücken oder keine tatsächliche Bedeutung haben, wie z. B. [aww], [oh] oder [RT]. Es ist schwierig, das Filtern solcher Wörter zu vermeiden, wenn nur nach dem TF-Wert sortiert und gefiltert wird. Daher wird die inverse IDF-Dokumentnummer als Einschränkung eingeführt, um einen genaueren Wert zu berechnen, der das Gewicht des Etikettentextes darstellt.

    Am Ende von Schritt 2 filtern wir die Einträge, die mehr als 15% der Gesamtzahl der Emojis enthalten.

  • Die in den ersten beiden Schritten berechneten Einheiten sind Monatsdaten, die Gesamtdaten betragen vier Jahre. Im letzten Schritt führen wir eine weitere Runde konsolidierter statistischer Berechnungen für alle monatlichen Daten durch.
  • Konvertieren Sie die berechneten vierjährigen Tweet-Daten in die Form [(sum(tfidf_m) / M) * log(M)] und berechnen Sie weiter das Gewicht jedes Tag-Eintrags. [sum(tfidf_m)] stellt die Summe der TF-IDF-Werte des Begriffs in jedem Monat dar, und [M] stellt die Anzahl der Monate dar, in denen der Begriff vorkommt.

Dies ist dann die ungefähre Berechnungsmethode für Emoji-Tag-Daten. Nachdem die endgültigen Daten zusammengefasst sind, prüfen und filtern wir auch manuell nach der Sprache, um genauere Tag-Ergebnisse zu erhalten.


Darüber hinaus verwenden die Tags auch CLDR-Kurznamen und CLDR-Schlüsselwörter als Referenz. Sie sind der einfachste Tag-Text, was bedeutet, dass Sie immer einige dieser Wörter in der Emoji-Tag-Cloud sehen werden.

🔺 Wenn ein Emoji an das Unicode-Konsortium gesendet wird, müssen CLDR-Kurznamen und CLDR-Schlüsselwörter in seinem Vorschlag enthalten sein, sodass diese Wörter bei der Auswahl der Tags berücksichtigt werden müssen. Die Informationen von Emoji [unicorn🦄], wir haben seinen Kurznamen und einige Schlüsselwörter in seine Tag-Cloud geschrieben.

Wie verwende ich unsere Emoji-Tag-Cloud?

Es ist eine ganze Weile her, dass wir die Emoji Tag Cloud veröffentlicht haben. Ich persönlich halte es für ein sehr lustiges und nützliches Werkzeug, ein bestimmtes Emoji zu beobachten, manchmal kann man sogar wissen, welche Gruppe oder welches Trendthema dieses Emoji bevorzugt verwendet. Lassen Sie mich Ihnen zeigen, wie Sie unsere Emoji-Tag-Cloud verwenden!

Wie oben erwähnt, ist das Gewicht jedes Tag-Textes unterschiedlich. Sie können die Korrelation zwischen Tags und Emoji einfach anhand der Kreisgröße beurteilen (je größer, desto relevanter). Oder Sie können Ihre Maus auf den Kreis bewegen, es wird ein kleines Quadrat mit [Zahl, Tag-Text] angezeigt. In dieser Situation ist das Tag in diesem Kreis umso relevanter für das Emoji, je kleiner die Zahl ist. Sie können auch auf diese Tags klicken, um nach anderen verwandten Emojis zu suchen!

Trotzdem verwenden wir Einhorn als Beispiel. die Tag Cloud von Emoji [Einhorn 🦄 ] sieht wie folgt aus:

Wie Sie sehen können, sind die Top-5-Tags von 🦄 [unicorn], [nicki], [unicorns], [plt] und [barbz] .

Wort [unicorn] ist der CLDR-Kurzname dieses Emojis, und die restlichen 4 Tags werden alle aus Twitter extrahiert. [nicki] und [barbz] sind mit Nicki Minaj und ihrer Fangruppe verwandt , und das Wort [plt] bezieht sich auf [Pretty Little Thing] , einen in Großbritannien ansässigen Modehändler oder nur diesen Ausdruck. 🦄 ist ein beliebtes Emoji in SNS und ein sehr repräsentatives Emoji für Nicki Minaj-Fans. Wenn du Nicki liebst, solltest du dieses Emoji unbedingt verwenden!


Alles in allem können Sie mit unserer Emoji Tag Cloud ganz einfach die zugehörigen Inhalte eines bestimmten Emojis herausfinden, vielleicht sogar mehr über die Popkultur erfahren und sich nicht peinlich fühlen, die grundlegende und erweiterte Bedeutung eines Emojis nicht zu kennen. Manchmal kann die Verwendung eines Emojis zu einem sozialen Phänomen werden, wie dieses Emoji 🥺 in Japan. Als Emoji, um Betteln, Kummer oder Lieblichkeit auszudrücken, gewann dieses Wort 'ぴえん🥺' den "JC&JK Buzzword Award 2019", den "2019 Gal Buzzword Award" den 2. 2020" und wurde zu einem Trend-Emoji in ganz Japan! In diesem Fall ist Emoji Tag Cloud für manche Leute auch ein großartiges Werkzeug, um die Internetkultur kennenzulernen, alles hängt davon ab, wie Sie es verwenden.

All dies dient dazu, die Verwendung von Emojis besser zu erkunden, und ich hoffe, Sie finden Emoji interessant und informativ. Um Ihnen genaue Emoji-bezogene Inhalte bereitzustellen, werden die Daten auch ständig aktualisiert. Wenn Sie weitere Ratschläge zur Emoji Tag Cloud haben, teilen Sie uns dies bitte in den Kommentaren unten mit👇!


Suche Aktuelles Letzte Kein kürzlich verwendetes Emoji Emojifie... Emojify-Erfolg