Hoy en día se están creando usos cada vez más útiles e interesantes de los emojis, como usar diferentes categorías de emojis para crear combinaciones de emoji o usar unos emojis sin ninguna similitud para transmitir el mismo significado, lo que está creando gradualmente una relación entre los emojis. Queríamos mostrar esta relación entre los emojis de forma visual para ofrecer a los usuarios una comprensión más profunda del uso de los emojis, así que utilizamos el algoritmos de aprendizaje automático para calcular la relación entre los emojis y presentamos el resultado en una imagen fácil de entender, que es el Diagrama de Relaciones entre Emojis .

¿Qué es el Diagrama de Relaciones entre Emojis?

Es sabido de todos que los emojis suelen presentarse como imágenes, pero es imposible calcular la relación entre los emojis con las imágenes, porque los emojis son más como un lenguaje, que se usan principalmente para transmitir información y emociones, por lo que será mejor explorar las relaciones entre emojis a través de sus significados y usos. Por lo tanto, aprovechamos las redes sociales para saber cómo está usando los emojis la gente. Obtuvimos todos los tuits que contienen emoji de 2018 a 2021, por un total de 812 millones de tuits y los clasificamos por idiomas porque el uso de emojis varía según los diferentes entornos de idioma, y luego calculamos la similitud entre textos entre emojis en cada idioma mediante un algoritmo de aprendizaje automático, para obtener el diagrama de relaciones entre emojis correspondiente para cada idioma.

¿Cómo entender el Diagrama de Relaciones entre Emojis?

Este es el Diagrama de Relaciones entre Emojis de 👉basado en los tuits españoles. El recuadro rojo muestra los 9 emojis más cercanos a él, la longitud del rayo representa el grado de relación, cuanto más corto es el rayo, más cercana es la relación. Además, este disgrama también muestra una pequeña parte del diagrama de relaciones de otros emojis. En el recuadro negro está el diagrama de relaciones entre emojis de 👆, y en el recuadro naranja está el de .

Los resultados reflejados en el diagrama de relaciones nos permiten tener una mejor comprensión del uso de emoji. Por ejemplo, estos dos emojis 👈 🥺 se suelen usar junto con 👉 como una combinación de emoji en los últimos años para expresar timidez o suplica, por lo que esos dos emojis aparecen en este diagrama:

Estos dos emojis se usan a menudo para indicar enlaces, lo que significa que tienen similitudes en el uso, por lo que están cerca uno del otro en el diagrama:

Si profundizas en el diagrama de relaciones entre emojis, quizá cambie tu percepción de algunos emojis.

¿Cómo calcular la relación entre emoji?

A continuación te explicaremos el proceso del cálculo detalladamente. Se puede dividir aproximadamente en los siguientes tres pasos:

  • Primero, usamos el algoritmo TF-IDF para extraer las etiquetas de cada emoji de los tuits y el peso correspondiente a cada etiqueta. Las etiquetas se refieren a aquellas palabras que están más estrechamente relacionadas con un emoji, que son equivalentes a las características de un emoji; y los pesos se refieren a la cercanía de la relación entre las etiquetas y el emoji, cuanto mayor es el peso, más estrecha es la relación. Sobre el algoritmo y el proceso de cálculo para obtener etiquetas, hemos escrito un artículo para presentarlo en detalle, puedes hacer clic en el enlace a la derecha para leerlo: ☁️Emoji Tag Cloud: ¡Te ayuda a entender mejor los emojis!
  • Después de obtener las etiquetas, surge un nuevo problema. Cuando se trata de cálculos, sólo los números se pueden calcular, pero las etiquetas se presentan como palabras, ¿cómo se pueden calcular las palabras? Entonces, nuestro segundo paso es convertir las palabras en números que se pueden calcular——Vectores. Este proceso se llama Word embedding. Para realizarlo, primero leímos una gran cantidad de datos de tuits usando el algoritmo word2vec (uno de los métodos de word embedding) para transformar cada palabra en un vector. Luego obtuvemos un word embedding matrix que consta de todas las palabras y sus vectores de alta dimensión correspondientes. Por último, mapeamos cada etiqueta que obtuvimos en el primer paso en un vector de alta dimensión a través del word embedding matrix. De esta manera, hemos completado la transformación de palabra a vector. Estos vectores de alta dimensión se calculan a través de analizar el contexto del texto, que puede preservar bien la información semántica de cada palabra y así asegurar la precisión de la similitud del texto calculada. El algoritmo word2vec también se explica en detalle en nuestro blog, si quieres más detalles puedes leerlo: 🔍Análisis de Sentimientos de Emoji
  • El último paso es calcular la similitud de texto entre emojis. El algoritmo comúnmente utilizado para calcular la similitud de texto es VSM (Vector Space Model). Es uno de los modelos de cálculo de similitudes más utilizados, pero obtiene resultados a través de calcular las palabras concurrentes (palabras que aparecen en ambos textos) de dos textos, por lo que este algoritmo no es adecuado para los textos con el mismo significado pero redacción diferente. Por eso elegimos otro algoritmo——SCM (Soft Cosine Measure). Puede medir la similitud entre palabras, por lo que incluso si dos textos no tienen palabras en común, este algoritmo puede calcular la similitud de dos textos por medio de evaluar la similitud de palabras. Los resultados del cálculo finales se presentan en números, cuanto mayor sea el número que obtengamos, mayor será la similitud de texto entre emojis, y cuanto mayor sea la similitud de texto, más estrecha será su relación.

Conclusión

A través del diagrama de relaciones entre emojis, puedes comprender los hábitos y preferencias de las personas sobre el uso de emoji y explorar la tendencia de los usos de emoji. Es posible que te sorprendas al descubrir que algunos emojis sin ninguna similitud sí están en realidad muy relacionados, ¡y ese puede ser un nuevo uso popular de emoji que aún no has conocido! Si tienes alguna sugerencia, ¡díganos en el comentario!


Buscar recientes Recientes Ningún emoji de uso reciente emojify... Éxito Emojify