Emoji-urile sunt pline de emoție. Poate îmbunătăți sau regla tonul și starea de spirit a textului, în același timp, emoțiile exprimate de emoji pot fi mai evidente decât numai cuvintele.

De exemplu, acest emoji 👿 (față furioasă cu coarne). Este evident sub forma unui personaj diavol, deci este posibil să existe gânduri considerate că este un emoji „rău”, ca niște gânduri rele în capul cuiva.

Dar totuși, acest tip de descriere este foarte abstract. Prin urmare, putem vizualiza tipurile și nivelurile de sentiment exprimate de aceste emoji?


Răspunsul este „Da”, desigur! Am efectuat Procesarea limbajului natural (NLP) pe eșantioane publice de cel puțin 50 de milioane de tweets și folosim Analiza sentimentului textului (numită și opinie mining) pentru a asocia sentimentul emoji cu un set de valori și a-l vizualiza. Am petrecut mult timp, energie și putere de calcul pentru a face analiza sentimentului emoji mai științifică și mai riguroasă, astfel încât toată lumea să poată simți farmecul și să înțeleagă mai bine emoji-urile.

Diagramele vizuale pentru analiza sentimentului emoji

Date precum valoarea sentimentului emoji au fost calculate în funcție de analiza sentimentului textului, care aparține statisticilor și teoriei probabilităților. După ce am rezolvat problema algoritmului și puterii de calcul, am întâmpinat noi dificultăți: cum să îi fac pe utilizatori să înțeleagă aceste date profesionale?

Un gând ne trece prin minte—— Hei! Ce zici să vizualizăm valorile sentimentului emoji cu câteva modele interesante!

💡: Am convertit datele calculate și analizate (stânga) într-o diagramă care poate fi mai bine înțeleasă de utilizatori (dreapta), care poate arăta mai intuitiv diviziunea emoțională a emoji-urilor;

Așadar, permiteți-mi să explic următoarea diagramă, care descrie rezultatele analizei tendinței sentimentului emoji în comunicarea reală.

💡: 2 tipuri de diagrame pentru analiza sentimentului emoji 👿, aici analizăm doar graficul de mai sus.

Arcul semicercului din imagine este împărțit în trei culori, reprezentând diferite tendințe emoționale ale emoji 👿 . După cum putem vedea, proporțiile acestor trei emoții sunt de aproximativ 4: 1: 5, verde și portocaliu au proporții similare, ceea ce înseamnă că acest emoji este mai mult unul neutru (surpriză !!).

  • Cursorul gri este Nivelul de încredere , un concept statistic. Poziția și lățimea acestuia indică: Expected Value ± Confidence .
  • Valoarea așteptată : este media ponderată a variabilelor dispersive aleatorii ale valorii sentimentului emoji, utilizată pentru a exprima probabilitatea, c ∈ [−1, 0, +1] .
  • Încredere : este setul de parametri ai distribuției valorii sentimentului emoji, prezintă un interval rezonabil de erori sub forma unui interval pozitiv și negativ. Și cu cât este mai mare numărul de probe de corpus, cu atât este mai mică eroarea.

Pur și simplu vorbind, cu cât cursorul este mai aproape de stânga, emoția acestui emoji este mai negativă. Dimpotrivă, cu cât cursorul este mai aproape de dreapta, cu atât emoția este mai pozitivă exprimată de acest emoji. Și cu cât este mai îngust cursorul, judecata emoției este mai precisă.


Acum, poți să înțelegi graficul nostru de analiză a sentimentelor emoji?

Ce este analiza sentimentelor?

Cred că ați înțeles graficul de date al analizei sentimentului emoji, așa că hai să vorbim despre ceea ce este analiza sentimentului.

Analiza sentimentelor se mai numește și mineritul opiniei. Din punct de vedere tehnic, analiza sentimentelor face parte din cercetarea procesării limbajului natural (NLP). Metodele de analiză a sentimentelor sunt împărțite în două tipuri: învățare automată și metode bazate pe dicționar . Dar odată cu dezvoltarea tehnologiei de învățare profundă, utilizarea acestei tehnologii pentru analiza sentimentelor a devenit principala curentă.

Procesul de analiză a sentimentelor include preprocesarea datelor, ingineria caracteristicilor și instruirea modelelor. În general, etapa de preprocesare a datelor împarte în principal textul în cuvinte și elimină cuvintele de oprire și punctuația. Cu toate acestea, analiza noastră de sentiment păstrează semne de punctuație și cuvinte de oprire. În etapa de inginerie a caracteristicilor, am ales cuvântul reprezentare de încorporare (Word2Vec) propus de echipa Google în 2013, care este împărțit în modelul CBOW (sacul continuu de cuvinte) și modelul Skip-gram . Rezultatele modelului sunt următoarele:

💡 : În stânga este modelul CBOW, în dreapta este modelul Skip-gram

CBOW se bazează pe contextul pentru a prezice cuvântul țintă pe care trebuie să îl antrenezi pentru a obține vectorul cuvânt. Așa cum se arată în figură, W (t) este prezis pe baza a patru cuvinte W(t-2), W(t-1), W(t+1), W(t+2) ; Și skip-gram este de a prezice cuvintele înconjurătoare în funcție de cuvântul țintă pentru a antrena pentru a obține vectorul cuvânt. Așa cum se arată în figură este de a prezice W(t-2),W(t-1),W(t+1),W(t+2) conform W (t) .

În etapa de predicție a modelului, împărțim datele în două părți: setul de antrenament împărțit la un raport de 5: 1 și setul de testare și setul de antrenament sunt procesate în afara ordinii.

Aplicarea analizei sentimentelor în emoji

Analiza sentimentelor este o metodă de analiză cuprinzătoare care combină învățarea profundă și statisticile. Am obținut valoarea sentimentului emoji-urilor după o analiză complexă și calculul reamurilor de date, iar procesul complet de analiză a sentimentelor emoji este după cum urmează:

Procesul de analiză a sentimentelor Emoji

  • Etichetați corpusul de rețele sociale
  • Preprocesarea datelor
  • Împărțiți setul de date: Set de antrenament (80%), Set de testare (20%)
  • Utilizați rețeaua neuronală LSTM pentru a construi un model
  • În funcție de performanța modelului pe setul de testare, reglați hiperparametrele pentru a îmbunătăți capacitatea de generalizare a modelului
  • Efectuați aceeași acțiune de preprocesare a datelor asupra datelor neetichetate
  • Utilizați modelul de predicție a sentimentului instruit pentru a prezice tendința sentimentului pe datele neetichetate

Efectuăm analize de sentiment pe emoji și folosim tehnologia de învățare profundă pentru a ne antrena pentru a obține un clasificator de sentimente de text emoji. Pentru stratul de ieșire al clasificatorului, alegem funcția sigmoidă pentru activare și proiectăm rezultatele stratului de ieșire în intervalul 0-1. Cu cât textul este mai aproape de 0, cu atât este mai negativ și cu cât este mai aproape de 1, cu atât este mai pozitiv.

Formula funcției sigmoide este: F(x)=1/(1+ex)

Folosim un eșantion mare de date de 50 de milioane de tweets care conțin emoji ca corpus de analiză, apoi punem corpul care trebuie analizat în clasificatorul de sentimente instruit pentru predicția sentimentului. În cele din urmă, rezultatele predicției sentimentului de către clasificator sunt împărțite în trei tipuri: negativ, neutru și pozitiv. Criteriile de clasificare sunt:

Oricum, este dificil, dar am reușit !!

Utilizarea și perspectiva analizei sentimentului Emoji

Analiza sentimentelor este utilizată pe scară largă în marketing, publicitate, psihologie, medicină și alte domenii. Decidăm să facem analiza sentimentului emoji pentru a ajuta oamenii să înțeleagă mai profund emoji în interacțiunea socială reală, să elimine ambiguitatea și neînțelegerea emoji mai eficient.

De exemplu, atunci când vorbești online cu prietenul tău (sau zdrobitul tău) online, cealaltă persoană îți poate trimite uneori emojii pe care nu prea le înțelegi. De fapt, există multe astfel de situații, cum ar fi:

  • Ce înseamnă 🤒 dacă cineva răspunde la fotografia mea?
  • Ce înseamnă când o fată îmi trimite 😊?
  • Dacă zdrobirea mea îmi trimite , este un semn bun?

După cum știm, nu puteți spune semnificația exactă a unui emoji, totuși, prin analiza noastră de sentiment, puteți analiza psihologic aceste emoji, cum ar fi „ea mi-a trimis un 💞, este un semn pozitiv, poate că ar trebui să o cer afară” sau „ de ce iubitul meu îmi trimite un 😒? Este un fel de negativ, este supărat pe mine? " , ceva de genul. Cu analiza sentimentului nostru Emoji, cred că puteți înțelege emoji mai profund.


Una peste alta, am plătit mult pentru acest proiect de analiză a sentimentului emoji. Chiar dacă este dificil, totuși vrem să-l adâncim. Acum analizăm emoji în diferite limbi, efectul emoțional al câștigului emoji asupra textului pur și au fost luate în considerare și alte câteva studii avansate. Toate acestea sunt pentru a explora mai multe utilizări ale emoji-urilor și sperăm că veți găsi emoji-uri interesante și informative.

Funcţie Meniu

Categorii

piele-ton

păr stil

sex

Sentiment

Versiune