Al giorno d'oggi vengono creati usi sempre più pratici e interessanti di emoji, ad esempio, diverse categorie di emoji verranno combinate insieme per diventare un Meme, o emoji apparentemente non correlati possono effettivamente essere usati per descrivere lo stesso significato, il che fa sì che le emoji creino gradualmente una connessione tra loro. Vogliamo mostrare visivamente questa relazione tra emoji e consentire agli utenti di comprendere più a fondo l'utilizzo delle emoji, quindi utilizziamo algoritmi di apprendimento automatico per calcolare la relazione tra emoji e disegnare il risultato in un'immagine di facile comprensione, che è la relazione Emoji Grafico .
Che cos'è il grafico delle relazioni Emoji?
È risaputo che gli emoji vengono solitamente presentati come immagini, ma è impossibile capire la relazione tra emoji con immagini, perché l'uso principale delle emoji è trasmettere informazioni ed emozioni, sono più simili a un linguaggio, quindi sarà più accurato per esplorare la loro relazione attraverso il significato e l'uso delle emoji. Pertanto, abbiamo ottenuto tutti i tweet contenenti emoji dal 2018 al 2021, per un totale di 812 milioni di tweet . Considerando che l'utilizzo delle emoji sarà diverso in ambienti linguistici diversi, abbiamo classificato i tweet per lingua e quindi calcolato la somiglianza del testo tra le emoji in ciascuna lingua tramite l'algoritmo di apprendimento automatico, in modo da ottenere il grafico delle relazioni Emoji corrispondente per ciascuna lingua.
Come capire il grafico delle relazioni Emoji?
Questo è il rapporto Emoji grafico di 👉 per lo spagnolo. Il riquadro rosso mostra le 9 emoji più vicine, la lunghezza del raggio rappresenta il grado di relazione, più corto è il raggio, più stretta è la relazione. Inoltre, il grafico mostra anche una parte del grafico delle relazioni di altre emoji. Nella casella nera c'è il grafico delle relazioni di 👆 ,e nella casella arancione c'è il grafico delle relazioni di ⤵ .
I risultati riflessi nel grafico delle relazioni ci consentono di avere una comprensione più ricca dell'uso delle emoji. Ad esempio, questi due emoji 👈 🥺 sono spesso usati in combinazione con 👉 negli ultimi anni per esprimere dolore, timidezza o implorazione, quindi appaiono in questo grafico di relazione:
Questi due emoji sono spesso usati per indicare i collegamenti, il che significa che hanno somiglianze nell'uso, quindi sono vicini l'uno all'altro nel grafico delle relazioni:
Se approfondisci la tabella delle relazioni emoji, potresti rinfrescare la tua percezione di alcuni emoji.
Come calcolare la relazione tra emoji?
Successivamente ti forniremo una descrizione dettagliata del processo di calcolo. Si può grossolanamente suddividere nei seguenti tre passaggi:
- Innanzitutto, utilizziamo l' algoritmo TF-IDF per estrarre i tag di ogni emoji dai tweet e il peso corrispondente a ciascun tag. I tag si riferiscono a quelle parole che sono più strettamente legate alle emoji, che sono equivalenti alle caratteristiche di un'emoji; e i pesi si riferiscono alla vicinanza della relazione tra tag ed emoji, maggiore è il peso, più stretta è la relazione. Per quanto riguarda l'algoritmo e il processo di calcolo per ottenere i tag, abbiamo scritto un articolo per introdurlo in dettaglio, puoi fare clic sul collegamento giusto per leggerlo: ☁️Emoji Tag Cloud: ti aiuta a conoscere meglio gli Emoji!
- Dopo aver ottenuto le etichette, sorge un nuovo problema. Quando si tratta di calcoli, sappiamo tutti che generalmente possono essere calcolati solo valori numerici, ma i tag sono presentati come testo, quindi come possono essere calcolati algoritmicamente? Pertanto, il nostro secondo passaggio consiste nel convertire il testo nei valori numerici che possono essere calcolati—— Vector . Questo processo è chiamato Word Embedding . Dobbiamo prima leggere una grande quantità di dati tweet utilizzando l' algoritmo word2vec (uno dei metodi di word embedding) per trasformare ogni parola nel testo in un vettore, quindi possiamo ottenere una matrice di word embedding composta da tutti i vettori ad alta dimensione di parole e successivamente mappare ogni parola corrispondente a ciascun tag ottenuto nel primo passaggio in un vettore ad alta dimensione attraverso la matrice di incorporamento delle parole. Pertanto, abbiamo completato la conversione da testo a vettore. Questi vettori ad alta dimensionalità vengono calcolati analizzando il contesto del testo, che può ben preservare l'informazione semantica di ogni parola e quindi garantire l'accuratezza della somiglianza del testo. L'algoritmo word2vec è spiegato in dettaglio anche nel nostro blog, se vuoi maggiori dettagli puoi leggerlo: 🔍Emoji Sentiment Analysis
- L'ultimo passaggio consiste nel calcolare la somiglianza del testo tra gli emoji. L'algoritmo comunemente usato per calcolare la somiglianza del testo è VSM (Vector Space Model) . Questo è uno dei modelli di calcolo della somiglianza più utilizzati, ma ottiene risultati calcolando le parole co-occorrenti (parole che compaiono in entrambi i testi) di due testi, il che non è accurato quando si affrontano testi con lo stesso significato ma parole diverse. per evitare questa situazione, abbiamo scelto un altro algoritmo—— SCM(Soft Cose Measure) . Può misurare la somiglianza tra le parole, quindi anche se due testi non hanno parole in comune, questo algoritmo può calcolare la somiglianza di due testi valutando la somiglianza delle parole. Dopo aver utilizzato SCM per misurare il vettore, maggiore è il valore che otteniamo significa maggiore è la somiglianza del testo tra gli emoji e maggiore è la somiglianza del testo, più stretta è la loro relazione.
Conclusione
Attraverso il grafico delle relazioni, possiamo comprendere le abitudini e le preferenze delle persone nell'uso delle emoji ed esplorare la tendenza dell'uso delle emoji. Potresti essere sorpreso di scoprire che alcuni emoji che non assoceresti tra loro sono in realtà strettamente correlati e questo potrebbe essere un nuovo uso alla moda di emoji che non conosci ancora! Inoltre, se hai qualche suggerimento, ti preghiamo di dircelo nel commento!