Emodžiji so polni čustev. Lahko izboljša ali prilagodi ton in razpoloženje besedila, hkrati pa so čustva, ki jih izražajo emoji, bolj očitna kot samo besede.

Na primer ta emoji 👿 (jezen obraz z rogovi). Očitno je v obliki hudičevega lika, zato morda misli, da gre za "slab" emoji, kot so nekatere zle misli v glavi nekoga.

A vseeno je takšen opis zelo abstrakten. Ali si lahko torej predstavljamo vrste in ravni občutkov, ki jih izražajo ti emojiji?


Odgovor je seveda "da"! Izvedli smo obdelavo naravnega jezika (NLP) na javnih vzorcih z najmanj 50 milijoni tweetov, z analizo besedilnih sentimentov (imenovano tudi pridobivanje mnenj) pa uporabimo emocije z nizom vrednot in jih vizualiziramo. Veliko časa, energije in računalniške moči smo porabili za to, da je bila naša analiza občutkov čustvenih simbolov bolj znanstvena in stroga, tako da lahko vsi začutijo čar in bolje razumejo čustvene simbole.

Vizualni grafikoni za analizo razpoloženja emojijev

Podatki, kot je vrednost čustvenih simbolov, so bili izračunani v skladu z analizo sentimenta besedila, ki spada v statistiko in teorijo verjetnosti. Ko smo rešili problem algoritma in računalniške moči, smo nato naleteli na nove težave: kako uporabnike razumeti te strokovne podatke?

Misel se nam prekriža --— Hej! Kaj pa, da vizualiziramo vrednosti čustev čustvenih simbolov z nekaj kul dizajni!

💡: Izračunane in analizirane podatke (levo) smo pretvorili v grafikon, ki ga lahko uporabniki bolje razumejo (desno), ki lahko bolj intuitivno prikazuje čustveno delitev čustvenih simbolov;

Torej naj pojasnim naslednji grafikon, ki prikazuje rezultate analize tendenc čustev čustvenih simbolov v dejanski komunikaciji.

💡: 2 vrsti grafikonov za analizo sentimenta emo, tukaj analiziramo samo zgornji grafikon.

Polkrožni lok na sliki je razdeljen na tri barve, ki predstavljajo različne čustvene težnje čustvenih simbolov 👿 . Kot lahko vidimo, so razmerja teh treh čustev približno 4: 1: 5, zelena in oranžna imata podobna razmerja, kar pomeni, da je ta emoji bolj nevtralen (presenečenje !!).

  • Sivi kazalec je stopnja zaupanja , statistični koncept. Njegov položaj in širina kažeta: Expected Value ± Confidence .
  • Pričakovana vrednost : To je tehtano povprečje disperzivnih naključnih spremenljivk vrednosti čustvenega čustva, uporabljeno za izražanje verjetnosti, c ∈ [−1, 0, +1] .
  • Zaupanje : Je nabor parametrov porazdelitve vrednosti čustvenih simbolov, prikazuje razumno območje napak v obliki pozitivnega in negativnega intervala. In večje je število vzorcev korpusa, manjša je napaka.

Preprosto povedano, bližje kot je kazalec levo, čustva tega čustvenega simbola so bolj negativna. Nasprotno, bližje kot je kazalec na desni, bolj pozitivno čustvo izraža ta čustveni simbol. In ožji je kazalec, presoja čustev je natančnejša.


Zdaj, ali lahko razumete našo kartografsko analizo čustev?

Kaj je analiza sentimenta?

Verjamem, da ste razumeli podatkovno tabelo z analizo sentimenta emoji, zato se pogovorimo o tem, kaj je analiza sentimenta.

Analizi sentimenta pravimo tudi pridobivanje mnenj. Tehnično gledano je analiza razpoloženja del raziskav naravnega jezika (NLP). Metode analize sentimenta so razdeljene na dve vrsti: strojno učenje in metode, ki temeljijo na slovarju . Toda z razvojem tehnologije poglobljenega učenja je uporaba te tehnologije za analizo sentimenta postala glavna stvar.

Postopek analize sentimenta vključuje predobdelavo podatkov, inženiring funkcij in usposabljanje modelov. Na splošno stopnja predhodne obdelave podatkov večinoma deli besedilo na besede in odstranjuje zaustavitvene besede in ločila. Vendar naša analiza razpoloženja ohranja ločila in stop besede. V fazi inženiringa funkcij smo izbrali predstavitev vdelave besed (Word2Vec), ki jo je leta 2013 predlagala Googlova ekipa, ki je razdeljena na model CBOW (neprekinjena vreča besed) in model Skip-gram . Rezultati modela so naslednji:

💡: Na levi je model CBOW, na desni je model Skip-gram

CBOW temelji na kontekstu za napovedovanje ciljne besede, ki se trenira za pridobitev besednega vektorja. Kot je prikazano na sliki, je W (t) napovedan na podlagi štirih besed W(t-2), W(t-1), W(t+1), W(t+2) ; Skip-gram je napovedovanje okoliških besed glede na ciljno besedo, ki se trenira za pridobitev besednega vektorja. Kot je prikazano na sliki, je napoved W(t-2),W(t-1),W(t+1),W(t+2) glede na W (t) .

V fazi napovedovanja podatkov podatke razdelimo na dva dela: Nabor vadb, razdeljen v razmerju 5: 1, in nabor preizkusov in vadbeni komplet se obdelata v napačnem vrstnem redu.

Uporaba analize sentimenta v emojijih

Analiza sentimenta je celovita metoda analize, ki združuje poglobljeno učenje in statistiko. Vrednost čustvenih simbolov smo dobili po kompleksni analizi in izračunu množice podatkov, celoten postopek analize razpoloženja pa je naslednji:

Postopek analize občutkov emojija

  • Označite korpus socialnih mrež
  • Predobdelava podatkov
  • Razdelite nabor podatkov: Nabor za usposabljanje (80%), Nabor za testiranje (20%)
  • Za izdelavo modela uporabite nevronsko mrežo LSTM
  • Glede na zmogljivost modela na testnem nizu prilagodite hiperparametre, da izboljšate sposobnost posploševanja modela
  • Izvedite enako dejanje predhodne obdelave podatkov za neoznačene podatke
  • Uporabite izurjeni model napovedovanja razpoloženja za napovedovanje tendence razpoloženja na neoznačenih podatkih

Izvajamo analizo sentimenta na emojijih in s pomočjo tehnologije globokega učenja treniramo, da dobimo klasifikator sentimenta besedila emoji. Za izhodno plast klasifikatorja izberemo sigmoidno funkcijo, ki jo želimo aktivirati, in rezultate izhodne plasti projiciramo v interval 0-1. Bolj ko je besedilo bližje 0, bolj negativno je in bližje 1, bolj pozitivno je.

Formula sigmoidne funkcije je: F(x)=1/(1+ex)

Kot analizni korpus uporabimo velik vzorec podatkov o 50 milijonih tvitov, ki vsebujejo čustvene simbole, nato pa korpus analiziramo v usposobljeni klasifikator sentimenta za napovedovanje sentimenta. Na koncu so rezultati napovedovanja razpoloženja s strani klasifikatorja razdeljeni na tri vrste: negativni, nevtralni in pozitivni. Merila za razvrstitev so:

Kakorkoli, težko je, ampak uspelo nam je !!

Uporaba in možnosti analize občutkov emoji

Analiza sentimenta se pogosto uporablja v trženju, oglaševanju, psihologiji, medicini in na drugih področjih. Odločili smo se, da bomo analizirali čustvene simbole, da bi ljudem pomagali globlje razumeti čustvene simbole v dejanski družbeni interakciji, učinkoviteje odpravili dvoumnost in nerazumevanje čustvenih simbolov.

Na primer, ko klepetate s prijateljem (ali zaljubljenostjo) v spletu, vam lahko druga oseba včasih pošlje emodžije, ki jih ne razumete povsem. Pravzaprav obstaja veliko takšnih situacij, kot so:

  • Kaj pomeni 🤒, če nekdo odgovori na mojo fotografijo?
  • Kaj pomeni, ko mi dekle pošlje 😊?
  • Če me pošlje moja simpatija , je to dober znak?

Kot vemo, ne morete povedati natančnega pomena čustvenih simbolov, lahko pa jih z našo analizo sentimenta psihološko analizirate, na primer "poslala mi je 💞, je pozitiven znak, morda bi jo moral prositi" ali " zakaj mi fant pošlje 😒? Je nekako negativno, je jezen name? " , nekaj podobnega. Z našo analizo razpoloženja čustvenih simbolov verjamem, da lahko čustvene simbole razumete globlje.


Vse skupaj smo veliko plačali za ta projekt analize občutkov čustvenih simbolov. Čeprav je težko, ga še vedno želimo poglobiti. Zdaj analiziramo čustvene simbole v različnih jezikih, vpliv čustvenega dobička čustvenega simbola na čisto besedilo in obravnavane so bile tudi številne druge napredne študije. Vse to je, da raziščete več uporabe čustvenih simbolov in upam, da se vam zdijo emodžiji zanimivi in poučni.

Išči nedavni Nedavne Brez nedavne uporabe emoji Emojify... Emojify uspeh