Une fonction Menu

Catégories

couleur de la peau

coiffure

sex

Sentiment

Version

De nos jours, de plus en plus d'utilisations d'emoji pratiques et intéressantes sont créées, par exemple, différentes catégories d'emoji seront combinées pour devenir un Meme, ou des emoji apparemment sans rapport peuvent en fait être utilisés pour décrire le même sens, ce qui fait que les emoji créent progressivement un lien entre eux. Nous voulons montrer visuellement cette relation entre les emoji et permettre aux utilisateurs de mieux comprendre l'utilisation des emoji. Nous utilisons donc des algorithmes d'apprentissage automatique pour calculer la relation entre les emoji et dessiner le résultat dans une image facile à comprendre, qui est la relation Emoji. Graphique .

Qu'est-ce que le graphique de relation Emoji?

Il est bien connu que les emojis sont généralement présentés sous forme d'images, mais il est impossible de comprendre la relation entre les emoji et les images, car l'utilisation principale des emoji est de transmettre des informations et des émotions, ils ressemblent plus à un langage, donc ce sera plus précis pour explorer leur relation à travers la signification et l'utilisation des emoji. Par conséquent, nous avons obtenu tous les tweets contenant des emoji de 2018 à 2021, pour un total de 812 millions de tweets . Considérant que l'utilisation des emoji sera différente dans différents environnements linguistiques, nous avons classé les tweets par langue, puis calculé la similarité du texte entre les emoji dans chaque langue par algorithme d'apprentissage automatique, afin d'obtenir le graphique de relation Emoji correspondant pour chaque langue.

Comment comprendre le graphique relationnel Emoji ?

C'est le graphique des relations Emoji de 👉 pour l'espagnol. La case rouge montre les 9 emoji les plus proches, la longueur du rayon représente le degré de relation, plus le rayon est court, plus la relation est étroite. En outre, le graphique montre également une partie du graphique de relation d'autres emoji. Dans la boîte noire est le graphique de la relation de 👆 , et dans la boîte orange est le graphique de la relation de .

Les résultats reflétés dans le graphique des relations nous permettent d'avoir une meilleure compréhension de l'utilisation des emoji. Par exemple, ces deux emojis 👈 🥺 sont souvent utilisés en combinaison avec 👉 ces dernières années pour exprimer des sentiments lésés, timides ou suppliants, ils apparaissent donc dans ce graphique de relations :

Ces deux emojis sont souvent utilisés pour indiquer des liens, ce qui signifie qu'ils ont des similitudes d'utilisation, ils sont donc proches l'un de l'autre dans le graphique des relations :

Si vous plongez dans le tableau des relations emoji, vous pouvez rafraîchir votre perception de certains emojis.

Comment calculer la relation entre les emoji ?

Ensuite, nous vous donnerons une description détaillée du processus de calcul. Il peut être grossièrement divisé en trois étapes :

  • Tout d'abord, nous utilisons l' algorithme TF-IDF pour extraire les tags de chaque emoji des tweets et le poids correspondant à chaque tag. Les balises font référence aux mots les plus étroitement liés aux emoji, qui sont équivalents aux caractéristiques d'un emoji ; et les poids font référence à la proximité de la relation entre les balises et les emoji, plus le poids est élevé, plus la relation est étroite. A propos de l'algorithme et du processus de calcul d'obtention des tags, nous avons écrit un article pour le présenter en détail, vous pouvez cliquer sur le lien droit pour le lire : ☁️Emoji Tag Cloud : vous aider à mieux connaître les Emoji !
  • Après l'obtention des labels, un nouveau problème se pose. En ce qui concerne les calculs, nous savons tous qu'en général, seules les valeurs numériques peuvent être calculées, mais les balises sont présentées sous forme de texte, alors comment peuvent-elles être calculées de manière algorithmique ? Par conséquent, notre deuxième étape consiste à convertir le texte en valeurs numériques pouvant être calculées —— Vector . Ce processus est appelé Word Embedding . Nous devons d'abord lire une grande quantité de données de tweet en utilisant l' algorithme word2vec (une des méthodes d'intégration de mots) pour transformer chaque mot du texte en un vecteur, puis nous pouvons obtenir une matrice d'intégration de mots composée de tous les vecteurs de grande dimension de mots, et plus tard mapper chaque mot correspondant à chaque étiquette que nous avons obtenue dans la première étape dans un vecteur de grande dimension via la matrice d'intégration de mots. Ainsi, nous avons terminé la conversion de texte en vecteur. Ces vecteurs de grande dimension sont calculés en analysant le contexte du texte, ce qui permet de bien préserver l'information sémantique de chaque mot et ainsi d'assurer l'exactitude de la similitude du texte. L'algorithme word2vec est également expliqué en détail dans notre blog, si vous voulez plus de détails vous pouvez le lire : 🔍Emoji Sentiment Analysis
  • La dernière étape consiste à calculer la similitude de texte entre les emojis. L'algorithme couramment utilisé pour calculer la similarité du texte est VSM (Vector Space Model) . C'est l'un des modèles de calcul de similarité les plus largement utilisés, mais il obtient des résultats en calculant des mots co-occurrents (mots apparaissant dans les deux textes) de deux textes, ce qui n'est pas précis face à des textes de même sens mais de formulation différente. pour éviter cette situation, nous avons choisi un autre algorithme—— SCM (Soft Cosine Measure) . Il peut mesurer la similitude entre les mots, donc même si deux textes n'ont pas de mots en commun, cet algorithme peut calculer la similitude de deux textes en évaluant la similitude des mots. Après avoir utilisé SCM pour mesurer le vecteur, plus la valeur que nous obtenons est élevée, plus la similitude de texte entre les emojis est élevée, et plus la similitude de texte est élevée, plus leur relation est étroite.

Conclusion

Grâce au graphique des relations, nous pouvons comprendre les habitudes et les préférences des gens en matière d'utilisation des emoji et explorer la tendance des utilisations des emoji. Vous serez peut-être surpris de découvrir que certains emojis que vous ne voudriez pas associer les uns aux autres sont en fait très étroitement liés, et cela peut être une nouvelle utilisation à la mode des emoji que vous ne connaissez pas encore ! De plus, si vous avez des suggestions, n'hésitez pas à nous le dire en commentaire !