Hoje em dia, utilizações de emojis cada vez mais práticas e interessantes são criadas, por exemplo, diferentes categorias de emojis serão combinadas para se tornarem um Meme, ou emojis aparentemente não relacionados podem ser usados para descrever o mesmo significado, o que faz com que o emoji gradualmente crie uma conexão entre eles. Queremos mostrar essa relação entre emoji visualmente e permitir que os usuários têm uma mais profunda compreensão do uso do emoji, por isso usamos máquina de algoritmos de aprendizagem para calcular a relação entre o emoji e desenhar o resultado em uma imagem fácil de entender, que é o Emoji Relacionamento Gráfico .

O que é o gráfico de relacionamento de Emoji?

É bem sabido que os emojis costumam ser apresentados como imagens, mas é impossível descobrir a relação entre emojis e imagens, pois o principal uso dos emojis é transmitir informações e emoções, eles são mais parecidos com uma linguagem, então será mais preciso para explorar seu relacionamento por meio do significado e do uso de emoji. Portanto, obtivemos todos os tweets contendo emoji de 2018 a 2021, totalizando 812 milhões de tweets . Considerando que o uso de emoji será diferente em diferentes ambientes de linguagem, classificamos os tweets por idioma, e então calculamos a Similaridade de Texto entre emoji em cada idioma por algoritmo de aprendizado de máquina, de forma a obter o Gráfico de Relacionamento de Emoji correspondente para cada idioma.

Como entender o Gráfico de Relacionamento Emoji?

Este é o gráfico de relacionamento de Emoji de 👉 para o espanhol. A caixa vermelha mostra os 9 emojis mais próximos a ele, o comprimento do raio representa o grau de relacionamento, quanto mais curto o raio, mais próxima é a relação. Além disso, o gráfico também mostra uma parte do gráfico de relacionamento de outros emojis. Na caixa preta está o gráfico de relacionamento de 👆, e na caixa laranja está o gráfico de relacionamento de .

Os resultados refletidos no gráfico de relacionamento nos permitem ter uma compreensão mais rica do uso de emoji. Por exemplo, esses dois emojis 👈 🥺 são frequentemente usados como uma combinação com 👉 nos últimos anos para expressar ofendido, tímido ou suplicante, então eles aparecem neste gráfico de relacionamento:

Esses dois emojis são frequentemente usados para indicar links, o que significa que eles têm semelhanças no uso, então eles estão próximos um do outro no gráfico de relacionamento:

Se você se aprofundar no gráfico de relacionamento dos emojis, poderá atualizar sua percepção de alguns emojis.

Como calcular a relação entre emoji?

A seguir, forneceremos uma descrição detalhada do processo de cálculo. Pode ser dividido basicamente nas três etapas a seguir:

  • Primeiro, usamos o algoritmo TF-IDF para extrair as tags de cada emoji dos tweets e o peso correspondente a cada tag. Marcas referem-se às palavras que estão mais intimamente relacionadas a emoji, que são equivalentes às características de um emoji; e os pesos referem-se à proximidade da relação entre tags e emoji, quanto maior o peso, mais próxima é a relação. Sobre o algoritmo e o processo de cálculo de obtenção de tags, escrevemos um artigo para apresentá-lo em detalhes, você pode clicar no link certo para lê-lo: ☁️Emoji Tag Cloud: Ajude você a obter mais conhecimento sobre Emoji!
  • Depois de obter as etiquetas, surge um novo problema. Quando se trata de cálculos, todos sabemos que geralmente apenas valores numéricos podem ser calculados, mas as tags são apresentadas como texto, então como podem ser calculadas algoritmicamente? Portanto, nossa segunda etapa é converter o texto nos valores numéricos que podem ser calculados— Vector . Este processo é denominado Word Embedding . Precisamos primeiro ler uma grande quantidade de dados de tweet usando o algoritmo word2vec (um dos métodos de incorporação de palavras) para transformar cada palavra do texto em um vetor, então podemos obter uma matriz de incorporação de palavras consistindo de todos os vetores de alta dimensão de palavras e, posteriormente, mapear cada palavra correspondente a cada tag que obtivemos na primeira etapa em um vetor de alta dimensão por meio da matriz de incorporação de palavras. Portanto, concluímos a conversão de texto em vetor. Esses vetores de alta dimensão são calculados analisando o contexto do texto, o que pode muito bem preservar a informação semântica de cada palavra e, assim, garantir a precisão da semelhança do texto. O algoritmo word2vec também é explicado em detalhes em nosso blog, se você quiser mais detalhes, pode lê-lo: 🔍 Análise de sentimento de Emoji
  • A última etapa é calcular a semelhança de texto entre os emojis. O algoritmo comumente usado para calcular a similaridade de texto é VSM (Vector Space Model) . Este é um dos modelos de cálculo de similaridade mais usados, mas obtém resultados calculando palavras co-ocorrentes (palavras que aparecem em ambos os textos) de dois textos, o que não é preciso quando se deparam com textos com o mesmo significado, mas com redação diferente. para evitar essa situação, escolhemos outro algoritmo - SCM (Soft Cosine Measure) . Ele pode medir a semelhança entre palavras, então mesmo que dois textos não tenham palavras em comum, esse algoritmo pode calcular a semelhança de dois textos avaliando a semelhança da palavra. Depois de usarmos SCM para medir o vetor, quanto maior o valor obtido significa, maior será a similaridade do texto entre os emojis, e quanto maior a similaridade do texto, mais próximo será o relacionamento deles.

Conclusão

Por meio do gráfico de relacionamento, podemos entender os hábitos e preferências das pessoas no uso de emojis e explorar a tendência de uso de emojis. Você pode se surpreender ao descobrir que alguns emojis que não associariam uns aos outros são, na verdade, intimamente relacionados, e esse pode ser um novo uso de emojis que você ainda não conhece! Além disso, se você tiver alguma sugestão, diga-nos no comentário!


Pesquisar recentes Recentes Nenhum emoji de uso recente Emojify... Emojify Sucesso