Emoji zijn vol emotie. Het kan de toon en sfeer van de tekst verbeteren of aanpassen, terwijl de emoties die door emoji worden uitgedrukt, duidelijker kunnen zijn dan alleen woorden.

Bijvoorbeeld deze emoji 👿 (boos gezicht met hoorns). Het is duidelijk in de vorm van een duivelskarakter, dus er kunnen gedachten zijn dat het een "slechte" emoji is, zoals sommige slechte gedachten in iemands hoofd.

Maar toch is dit soort beschrijving erg abstract. Kunnen we daarom de sentimenttypen en -niveaus visualiseren die door deze emoji's worden uitgedrukt?


Het antwoord is natuurlijk "Ja"! We hebben Natural Language Processing (NLP) uitgevoerd op openbare samples van maar liefst 50 miljoen tweets, en we gebruiken Text Sentiment Analysis (ook wel opinion mining genoemd) om het emoji-sentiment te associëren met een reeks waarden en dit te visualiseren. We hebben veel tijd, energie en rekenkracht gestoken in het wetenschappelijker en nauwkeuriger maken van onze emoji-sentimentanalyse, zodat iedereen de charme kan voelen en een beter begrip van emoji kan krijgen.

Visuele grafieken voor emoji-sentimentanalyse

Gegevens zoals emoji-sentimentwaarde werden berekend op basis van tekstsentimentanalyse, die behoort tot statistieken en kansrekening. Nadat we het probleem van algoritme en rekenkracht hadden opgelost, kwamen we nieuwe problemen tegen: hoe kunnen gebruikers deze professionele gegevens begrijpen?

Er komt een gedachte bij ons op - Hé! Hoe zit het met het visualiseren van emoji-sentimentwaarden met een aantal coole ontwerpen!

💡: We hebben de berekende en geanalyseerde gegevens (links) omgezet in een grafiek die beter kan worden begrepen door gebruikers (rechts), die intuïtiever de emotionele verdeling van emoji kan weergeven;

Dus laat me de volgende grafiek uitleggen, die de resultaten weergeeft van emoji's sentimenttendensanalyse in daadwerkelijke communicatie.

💡: 2 soorten grafieken voor de sentimentanalyse van emoji 👿, hier analyseren we alleen de bovenstaande grafiek.

De halve cirkelboog in de afbeelding is verdeeld in drie kleuren, die verschillende emotionele tendensen van emoji vertegenwoordigen 👿 . Zoals we kunnen zien, zijn de verhoudingen van deze drie emoties ongeveer 4: 1: 5, groen en oranje hebben vergelijkbare verhoudingen, wat betekent dat deze emoji meer neutraal is (verrassing!!).

  • De grijze cursor is het Betrouwbaarheidsniveau , een statistisch begrip. De positie en breedte geven aan: Expected Value ± Confidence .
  • Verwachte waarde : het is het gewogen gemiddelde van verspreide willekeurige variabelen van emoji-sentimentwaarde, gebruikt om waarschijnlijkheid uit te drukken, c ∈ [−1, 0, +1] .
  • Vertrouwen : het is de parameterset van emoji-sentimentwaardeverdeling, toont een redelijk foutenbereik in de vorm van een positief en negatief interval. En hoe groter het aantal corpusmonsters, hoe kleiner de fout.

Simpel gezegd, hoe dichter de cursor naar links is, de emotie van deze emoji is negatiever. Integendeel, hoe dichter de cursor naar rechts staat, hoe positiever de emotie wordt uitgedrukt door deze emoji. En hoe smaller de cursor is, hoe nauwkeuriger het oordeel over de emotie is.


Kun je nu onze grafiek van emoji-sentimentanalyse begrijpen?

Wat is sentimentanalyse?

Ik geloof dat je de gegevensgrafiek van emoji-sentimentanalyse hebt begrepen, dus laten we het hebben over wat sentimentanalyse is.

Sentimentanalyse wordt ook wel opiniemining genoemd. Technisch gezien maakt sentimentanalyse deel uit van onderzoek naar natuurlijke taalverwerking (NLP). Methoden voor sentimentanalyse zijn onderverdeeld in twee typen: machinaal leren en op woordenboeken gebaseerde methoden . Maar met de ontwikkeling van deep learning-technologie is het gebruik van deze technologie voor sentimentanalyse de mainstream geworden.

Het sentimentanalyseproces omvat gegevensvoorverwerking, feature-engineering en modeltraining. Over het algemeen verdeelt de fase van gegevensvoorverwerking de tekst voornamelijk in woorden en verwijdert stopwoorden en interpunctie. Onze sentimentanalyse behoudt echter leestekens en stopwoorden. In de feature-engineeringfase hebben we gekozen voor de woord embedding representatie (Word2Vec) voorgesteld door het Google-team in 2013, die is onderverdeeld in het CBOW-model (continuous bag of words) en het Skip-gram- model. De modelresultaten zijn als volgt:

💡:Links staat het CBOW-model, rechts het Skip-gram-model

CBOW is gebaseerd op de context om het doelwoord te voorspellen dat moet worden getraind om de woordvector te verkrijgen. Zoals weergegeven in de figuur, wordt W(t) voorspeld op basis van vier woorden W(t-2), W(t-1), W(t+1), W(t+2) ; En skip-gram is om de omringende woorden te voorspellen volgens het doelwoord dat moet worden getraind om de woordvector te verkrijgen. Zoals weergegeven in de figuur is om W(t-2),W(t-1),W(t+1),W(t+2) te voorspellen volgens W(t) .

In de modelvoorspellingsfase verdelen we de gegevens in twee delen: de trainingsset verdeeld in een verhouding van 5:1 en de testset en de trainingsset worden buiten de juiste volgorde verwerkt.

Toepassing van sentimentanalyse in emoji

Sentimentanalyse is een uitgebreide analysemethode die deep learning en statistiek combineert. We hebben de sentimentwaarde van emoji verkregen na complexe analyse en berekening van stapels gegevens, en het volledige emoji-sentimentanalyseproces is als volgt:

Het proces van Emoji-sentimentanalyse

  • Label sociale netwerken corpus
  • Voorverwerking van gegevens
  • Verdeel de dataset: Trainingsset (80%), Testset (20%)
  • Gebruik het LSTM-neuraal netwerk om een model te bouwen
  • Pas de hyperparameters aan op basis van de prestaties van het model op de testset om het generalisatievermogen van het model te verbeteren
  • Voer dezelfde gegevensvoorbewerkingsactie uit op niet-gelabelde gegevens
  • Gebruik het getrainde sentimentvoorspellingsmodel om de sentimenttendens op niet-gelabelde gegevens te voorspellen

We voeren sentimentanalyse uit op emoji en gebruiken deep learning-technologie om te trainen om een emoji-tekstsentimentclassificatie te krijgen. Voor de uitvoerlaag van de classificatie kiezen we de sigmoid-functie om te activeren en projecteren we de resultaten van de uitvoerlaag in het interval van 0-1. Hoe dichter de tekst bij 0 ligt, hoe negatiever hij is, en hoe dichter hij bij 1 is, hoe positiever hij is.

De formule van de sigmoïde functie is: F(x)=1/(1+ex)

We gebruiken grote voorbeeldgegevens van 50 miljoen tweets met emoji als analysecorpus, en plaatsen de corpus die moet worden geanalyseerd in de getrainde sentimentclassifier voor sentimentvoorspelling. Ten slotte zijn de resultaten van sentimentvoorspelling door de classifier onderverdeeld in drie typen: negatief, neutraal en positief. De classificatiecriteria zijn:

Hoe dan ook, het is moeilijk, maar we hebben het gehaald!!

Het gebruik en de vooruitzichten van Emoji-sentimentanalyse

Sentimentanalyse wordt veel gebruikt in marketing, reclame, psychologie, medische en andere gebieden. We besluiten om emoji-sentimentanalyse uit te voeren om mensen te helpen een dieper inzicht te krijgen in emoji in daadwerkelijke sociale interactie, om dubbelzinnigheid en misverstanden over emoji effectiever te elimineren.

Als je bijvoorbeeld online met je vriend (of je geliefde) aan het chatten bent, kan de andere persoon je soms emoji's sturen die je niet helemaal begrijpt. Eigenlijk zijn er veel van dit soort situaties, zoals:

  • Wat betekent 🤒 als iemand op mijn foto reageert?
  • Wat betekent het als een meisje 😊 naar mij stuurt?
  • Als mijn crush me stuurt, is dat dan een goed teken?

Zoals we weten, kun je de juiste betekenis van een emoji niet bepalen, maar door onze sentimentanalyse kun je deze emoji's psychologisch analyseren, zoals "ze stuurde me een 💞, het is een positief teken, misschien moet ik haar mee uit vragen" of " waarom stuurt mijn vriend me een 😒? Het is nogal negatief, is hij boos op me?" , iets zoals dit. Met onze Emoji-sentimentanalyse geloof ik dat je emoji beter kunt begrijpen.


Al met al hebben we veel betaald voor dit emoji-sentimentanalyseproject. Ook al is het moeilijk, we willen het toch verdiepen. We analyseren nu emoji in verschillende talen, het emotionele winsteffect van emoji op pure tekst en er zijn ook verschillende andere geavanceerde onderzoeken overwogen. Al deze zijn bedoeld om meer gebruik van emoji te verkennen, en ik hoop dat je emoji interessant en informatief vindt.

Zoeken recent Recente Geen recent gebruik emoji Emojify... Emojify-succes