Emoji er fulde af følelser. Det kan forbedre eller justere tonen og stemningen i teksten, samtidig kan de følelser, der udtrykkes af emoji, være mere indlysende end kun ord.

For eksempel denne emoji 👿 (vredt ansigt med horn). Det er i form af en djævelskarakter åbenlyst, så der kan have tanker anset for, at det er en "dårlig" emoji, som nogle onde tanker i nogens hoved.

Men stadig er denne type beskrivelse meget abstrakt. Kan vi derfor visualisere de følelsestyper og niveauer, der udtrykkes af disse emojier?


Svaret er "ja" selvfølgelig! Vi udførte Natural Language Processing (NLP) på offentlige prøver på ikke mindre end 50 millioner tweets, og vi bruger Text Sentiment Analysis (også kaldet opinion mining) til at forbinde emoji-sentimentet med et sæt værdier og visualisere det. Vi brugte en masse tid, energi og computerkraft for at gøre vores emoji-sentimentanalyse mere videnskabelig og streng, så alle kan føle charmen og få bedre forståelse af emoji.

Visuelle diagrammer til emoji-sentimentanalyse

Data såsom emoji-sentimentværdi blev beregnet i henhold til tekst-sentimentanalyse, som hører til statistik og sandsynlighedsteori. Efter at vi løste problemet med algoritme og computerkraft, stødte vi på nye vanskeligheder: hvordan får brugerne til at forstå disse professionelle data?

En tanke krydser vores sind - - Hej! Hvad med at vi visualiserer emoji-sentimentværdier med nogle seje designs!

💡: Vi konverterede de beregnede og analyserede data (til venstre) til et diagram, der bedre kan forstås af brugerne (højre), hvilket mere intuitivt kan vise den følelsesmæssige opdeling af emoji;

Så lad mig forklare følgende diagram, der viser resultaterne af emojis sentiment tendensanalyse i egentlig kommunikation.

💡: 2 typer diagrammer til emoji 👿 s sentimentanalyse, her analyserer vi kun diagrammet ovenfor.

Halvcirkelbuen i billedet er opdelt i tre farver, der repræsenterer forskellige følelsesmæssige tendenser af emoji 👿 . Som vi kan se, er proportionerne af disse tre følelser omkring 4: 1: 5, grøn og orange har lignende proportioner, hvilket betyder, at denne emoji er mere neutral (overraskelse !!).

  • Den grå markør er tillidsniveauet , et statistisk koncept. Dens position og bredde angiver: Expected Value ± Confidence .
  • Forventet værdi : Det er det vægtede gennemsnit af dispersive tilfældige variabler af emoji-sentimentværdi, der bruges til at udtrykke sandsynlighed, c ∈ [−1, 0, +1] .
  • Tillid : Det er parametersættet for emoji-sentimentværdifordeling, viser et rimeligt fejlinterval i form af positivt og negativt interval. Og jo større antallet af korpusprøver er, jo mindre er fejlen.

Kort sagt, jo tættere markøren er til venstre, følelsen af denne emoji er mere negativ. Tværtimod, jo tættere markøren er til højre, jo mere positive følelser udtrykt af denne emoji. Og jo smallere markøren er, følelsens vurdering er mere præcis.


Kan du nu forstå vores diagram over emoji-sentimentanalyse?

Hvad er sentimentanalyse?

Jeg tror, at du har forstået datakortet over emoji-sentimentanalyse, så lad os tale om, hvad der er sentimentanalyse.

Sentimentanalyse kaldes også opinion mining. Teknisk set er følelsesanalyse en del af NLP-forskning (Natural Language Processing). Sentimentanalysemetoder er opdelt i to typer: Machine learning og Dictionary-baserede metoder . Men med udviklingen af dyb læringsteknologi er brugen af denne teknologi til sentimentanalyse blevet mainstream.

Sentimentanalyseprocessen inkluderer forbehandling af data, funktionsteknik og modeluddannelse. Generelt opdeler dataforbehandlingsfasen hovedsageligt teksten i ord og fjerner stopord og tegnsætning. Imidlertid bevarer vores sentimentanalyse tegnsætningstegn og stopord. I funktionsingeniørfasen valgte vi det ordindlejringsrepræsentation (Word2Vec), der blev foreslået af Google-teamet i 2013, som er opdelt i CBOW-modellen (kontinuerlig pose med ord) og Skip-gram- modellen. Modelresultaterne er som følger:

💡 : Til venstre er CBOW-modellen, til højre er Skip-gram-modellen

CBOW er baseret på konteksten for at forudsige det målord, der skal trænes for at opnå ordvektoren. Som vist i figuren forudsiges W (t) baseret på fire ord W(t-2), W(t-1), W(t+1), W(t+2) ; Og skip-gram er at forudsige de omgivende ord i henhold til målordet for at træne for at opnå ordvektoren. Som vist i figuren er det at forudsige W(t-2),W(t-1),W(t+1),W(t+2) henhold til W (t) .

I modelforudsigelsesfasen deler vi dataene i to dele: Træningssættet opdelt i forholdet 5: 1, og testsættet og træningssættet behandles uden for rækkefølge.

Anvendelse af sentimentanalyse i emoji

Sentimentanalyse er en omfattende analysemetode, der kombinerer dyb læring og statistik. Vi har opnået følelsesværdien af emoji efter kompleks analyse og beregning af reams af data, og den komplette emoji-sentimentanalyseproces er som følger:

Processen med Emoji Sentiment Analyse

  • Mærk socialt netværk korpus
  • Forbehandling af data
  • Del datasættet: Training Set (80%), Testing Set (20%)
  • Brug LSTM neurale netværk til at opbygge en model
  • I henhold til præstationen af modellen på testsættet skal du justere hyperparametrene for at forbedre modelens generaliseringsevne
  • Udfør den samme databehandlingshandling på umærkede data
  • Brug den trænede følelsesmodel til forudsigelse til at forudsige følelsestendensen på umærket data

Vi udfører sentimentanalyse på emoji og bruger dyb læringsteknologi til at træne for at få en emoji-tekstfølsom klassifikator. For klassifikatorens outputlag vælger vi den sigmoid-funktion, der skal aktiveres, og projicerer outputlagresultaterne i intervallet 0-1. Jo tættere teksten er på 0, jo mere negativ er den, og jo tættere den er på 1, jo mere positiv er den.

Formlen for sigmoidfunktionen er: F(x)=1/(1+ex)

Vi bruger en stor stikprøvedata på 50 millioner tweets indeholdende emoji som et analysekorpus, hvorefter korpusbehovet skal analyseres i den uddannede sentimentklassificering til forudsigelse af sentiment. Endelig er resultaterne af klassificeringens forudsigelse af inddeling opdelt i tre typer: negativ, neutral og positiv. Klassificeringskriterierne er:

Alligevel er det svært, men vi klarede det !!

Brugen og udsigten til Emoji Sentiment Analyse

Sentimentanalyse bruges i vid udstrækning inden for markedsføring, reklame, psykologi, medicinsk og andre områder. Vi beslutter at lave emoji-sentimentanalyse er at hjælpe folk med at få dybere forståelse af emoji i faktisk social interaktion, eliminere tvetydighed og misforståelse af emoji mere effektivt.

For eksempel, når du chatter med din ven (eller din crush) online, kan den anden person undertiden sende dig emojier, som du ikke helt forstår. Faktisk er der mange situationer som denne, såsom:

  • Hvad betyder 🤒 hvis nogen svarer på mit foto?
  • Hvad betyder det, når en pige sender 😊 til mig?
  • Hvis min crush sender mig , er det da et godt tegn?

Som vi ved, kan du ikke fortælle en emoji's nøjagtige betydning, men gennem vores sentimentanalyse kan du måske analysere disse emojier psykologisk, som "hun sendte mig en 💞, det er et positivt tegn, måske skulle jeg spørge hende ud" eller " hvorfor min kæreste sender mig en 😒? Det er lidt negativt, er han sur på mig? " , noget som dette. Med vores Emoji Sentiment-analyse tror jeg, du kan forstå emoji dybere.


Alt i alt har vi betalt meget for dette emoji-sentimentanalyseprojekt. Selvom det er svært, vil vi stadig gøre det dybere. Vi analyserer nu emoji på forskellige sprog, den følelsesmæssige gevinsteffekt af emoji på ren tekst, og flere andre avancerede studier er også blevet overvejet. Alt dette er for at udforske mere brug af emoji, og håber du finder emoji er interessant og informativt.

Søg seneste Seneste Ingen nylig brug af emoji Emojify... Emojify succes