Emocijas ir emociju pilnas. Tas var uzlabot vai pielāgot teksta toni un noskaņu, tajā pašā laikā emocijzīmes, ko izsaka emocijzīmes, var būt acīmredzamākas nekā tikai vārdi.

Piemēram, šī emocijzīme angry (dusmīga seja ar ragiem). Tas acīmredzami ir velna rakstura formā, tāpēc, iespējams, ir domas, kas tiek uzskatītas par "sliktu" emocijzīmi, piemēram, dažas ļaunas domas kāda cilvēka galvā.

Bet tomēr šāda veida apraksts ir ļoti abstrakts. Tāpēc, vai mēs varam vizualizēt šo emocijzīmju izteiktos noskaņojumu veidus un līmeņus?


Protams, atbilde ir "jā"! Mēs veicām dabiskās valodas apstrādi (NLP) publiskiem paraugiem, kuros bija ne mazāk kā 50 miljoni tvītu, un mēs izmantojam teksta noskaņojuma analīzi (sauktu arī par viedokļu iegūšanu), lai saistītu emocijzīmju noskaņu ar vērtību kopumu un to vizualizētu. Mēs pavadījām daudz laika, enerģijas un skaitļošanas jaudu, lai mūsu emocijzīmju analīze būtu zinātniskāka un precīzāka, lai ikviens varētu sajust emociju šarmu un labāk izprast to.

Vizuālās diagrammas emocijzīmju analīzei

Tādi dati kā emocijzīmes noskaņojuma vērtība tika aprēķināta pēc teksta noskaņojuma analīzes, kas pieder statistikai un varbūtības teorijai. Pēc tam, kad mēs atrisinājām algoritma un skaitļošanas jaudas problēmu, mēs saskaramies ar jaunām grūtībām: kā likt lietotājiem saprast šos profesionālos datus?

Mums prātā ienāk doma - Hei! Kā būtu, ja mēs vizualizētu emocijzīmju noskaņu vērtības ar dažiem atdzistiem dizainiem!

💡: aprēķinātos un analizētos datus (pa kreisi) pārveidojām par lietotājiem labāk saprotamu diagrammu (pa labi), kas intuitīvāk var parādīt emocijzīmju emocionālo dalījumu;

Tāpēc ļaujiet man paskaidrot šo diagrammu, kurā attēloti emocijzīmju noskaņojuma tendenču analīzes rezultāti faktiskajā komunikācijā.

💡: divu veidu diagrammas emocijzīmju 👿 noskaņojuma analīzei, šeit mēs analizējam tikai iepriekš redzamo diagrammu.

Attēlā redzamais pusloka loks ir sadalīts trīs krāsās, attēlojot dažādas emocijzīmes emocijzīmes 👿 . Kā redzam, šo trīs emociju proporcijas ir aptuveni 4: 1: 5, zaļajām un oranžajām proporcijām ir līdzīgas, kas nozīmē, ka šī emocijzīme ir vairāk neitrāla (pārsteigums !!).

  • Pelēkais kursors ir statistikas jēdziens Confidence Level. Tās novietojums un platums norāda: Expected Value ± Confidence .
  • Paredzamā vērtība : tā ir emocijzīmju noskaņojuma vērtības izkliedējošo nejaušo mainīgo svērtais vidējais lielums, ko izmanto, lai izteiktu varbūtību, c ∈ [−1, 0, +1] .
  • Uzticamība : tā ir emocijzīmju noskaņojuma vērtību sadalījuma parametru kopa, kas parāda saprātīgu kļūdu diapazonu pozitīvu un negatīvu intervālu veidā. Un lielāks ir korpusa paraugu skaits, jo mazāka kļūda.

Vienkārši runājot, jo tuvāk kursors atrodas pa kreisi, šīs emocijzīmes emocijas ir negatīvākas. Gluži pretēji, jo tuvāk kursors atrodas pa labi, jo pozitīvākas emocijas pauž šī emocijzīme. Un jo šaurāks ir kursors, emociju vērtējums ir precīzāks.


Vai jūs varat saprast mūsu emocijzīmju analīzes diagrammu?

Kas ir noskaņojuma analīze?

Es uzskatu, ka jūs esat sapratis emocijzīmju analīzes datu diagrammu, tāpēc parunāsim par to, kas ir noskaņojuma analīze.

Noskaņojuma analīzi sauc arī par viedokļu iegūšanu. Tehniski runājot, sentimenta analīze ir daļa no dabiskās valodas apstrādes (NLP) pētījumiem. Sentimenta analīzes metodes ir sadalītas divos veidos: mašīnmācīšanās un uz vārdnīcu balstītas metodes . Bet, attīstoties dziļo mācību tehnoloģijai, šīs tehnoloģijas izmantošana sentimentu analīzē ir kļuvusi par galveno.

Noskaņojuma analīzes process ietver datu pirmapstrādi, funkciju inženieriju un modeļu apmācību. Vispārīgi runājot, datu priekšapstrādes stadijā teksts galvenokārt tiek sadalīts vārdos un tiek noņemti pieturas vārdi un pieturzīmes. Tomēr mūsu noskaņojuma analīzē tiek saglabātas pieturzīmes un pieturas vārdi. Funkciju inženierijas posmā mēs izvēlējāmies Google komandas 2013. gadā piedāvāto vārdu iegulšanas attēlojums (Word2Vec), kas ir sadalīts CBOW (nepārtraukta vārdu maisa) modelī un Skip-gram modelī. Modeļa rezultāti ir šādi:

💡 : Kreisajā pusē ir CBOW modelis, labajā pusē - Skip-gram modelis

CBOW ir balstīts uz kontekstu, lai prognozētu mērķa vārdu, kas jāapmāca, lai iegūtu vārdu vektoru. Kā parādīts attēlā, W (t) tiek prognozēts, pamatojoties uz četriem vārdiem W(t-2), W(t-1), W(t+1), W(t+2) ; Skip-gram ir paredzēt apkārtējos vārdus atbilstoši mērķa vārdam, kas jāapmāca, lai iegūtu vārdu vektoru. Kā parādīts attēlā, ir paredzēt W(t-2),W(t-1),W(t+1),W(t+2) saskaņā ar W (t) .

Modeļa prognozēšanas posmā mēs datus sadalām divās daļās: Apmācību komplekts, kas sadalīts proporcijā 5: 1, un testa komplekts un apmācības komplekts tiek apstrādāti ārpus kārtas.

Noskaņojuma analīzes izmantošana emocijzīmēs

Sentimenta analīze ir visaptveroša analīzes metode, kas apvieno dziļu mācīšanos un statistiku. Emocijzīmju noskaņojuma vērtību esam ieguvuši pēc sarežģītas analīzes un datu kopas aprēķināšanas, un pilnīgs emocijzīmju noskaņojuma analīzes process ir šāds:

Emociju noskaņojuma analīzes process

  • Iezīmēt sociālo tīklu korpusu
  • Datu pirmapstrāde
  • Sadaliet datu kopu: apmācības komplekts (80%), testēšanas komplekts (20%)
  • Lai izveidotu modeli, izmantojiet LSTM neironu tīklu
  • Saskaņā ar modeļa veiktspēju testa komplektā, pielāgojiet hiperparametrus, lai uzlabotu modeļa vispārināšanas spēju
  • Veiciet to pašu datu pirmapstrādes darbību ar iezīmēm nesaturošiem datiem
  • Izmantojiet apmācīto noskaņojuma prognozēšanas modeli, lai prognozētu noskaņojuma tendenci uz nemarķētiem datiem

Mēs veicam emocijzīmju analīzi emocijzīmēs un izmantojam dziļo mācību tehnoloģiju, lai apmācītu, lai iegūtu emocijzīmju teksta noskaņojuma klasifikatoru. Klasifikatora izejas slānim mēs izvēlamies sigmoīdu funkciju, lai aktivizētu, un izejas slāņa rezultātus projicējam 0-1 intervālā. Jo tuvāk teksts ir 0, jo negatīvāks tas ir, un jo tuvāk tas ir 1, jo pozitīvāks tas ir.

Sigmoīdās funkcijas formula ir: F(x)=1/(1+ex)

Kā analīzes korpusu mēs izmantojam lielu 50 miljonu tvītu paraugu, kas satur emocijzīmes, un pēc tam nosakāmo korpusu analizē apmācītajā noskaņojumu klasifikatorā. Visbeidzot, klasifikatora noskaņojuma prognozēšanas rezultāti ir sadalīti trīs veidos: negatīvs, neitrāls un pozitīvs. Klasifikācijas kritēriji ir:

Jebkurā gadījumā tas ir grūti, bet mēs to paveicām !!

Emociju noskaņojuma analīzes izmantošana un perspektīvas

Noskaņojuma analīze tiek plaši izmantota mārketingā, reklāmā, psiholoģijā, medicīnā un citās jomās. Mēs nolemjam veikt emocijzīmju analīzi, lai palīdzētu cilvēkiem dziļāk izprast emocijzīmes faktiskajā sociālajā mijiedarbībā, efektīvāk novērstu emociju neskaidrības un pārpratumus.

Piemēram, kad tērzējat ar savu draugu (vai savu simpātiju) tiešsaistē, otra persona dažreiz var nosūtīt jums emocijzīmes, kuras jūs līdz galam nesaprotat. Patiesībā ir daudz šādu situāciju, piemēram:

  • Ko nozīmē if, ja kāds atbild uz manu fotoattēlu?
  • Ko tas nozīmē, kad meitene man sūta 😊?
  • Ja mana simpātija mani sūta , vai tā ir laba zīme?

Kā mēs zinām, jūs nevarat pateikt emocijzīmes precīzu nozīmi, tomēr, izmantojot mūsu noskaņojuma analīzi, jūs varat analizēt šos emocijzīmes psiholoģiski, piemēram, "viņa man nosūtīja sent, tā ir pozitīva zīme, varbūt man vajadzētu viņu lūgt" vai " kāpēc mans draugs sūta man 😒? Tas ir kaut kā negatīvs, vai viņš ir dusmīgs uz mani? " , kaut kas tamlīdzīgs. Izmantojot mūsu emocijzīmju analīzi , es uzskatu, ka jūs varat dziļāk izprast emocijzīmes.


Kopumā mēs esam daudz samaksājuši par šo emocijzīmju noskaņojuma analīzes projektu. Lai arī tas ir grūti, mēs tomēr vēlamies to padarīt dziļāku. Tagad mēs analizējam emocijzīmes dažādās valodās, emocijzīmju emocionālā ieguvuma efektu uz tīru tekstu, un ir apsvērti arī vairāki citi padziļināti pētījumi. To visu mērķis ir izpētīt vairāk emocijzīmju izmantošanu, un ceru, ka emocijzīmes ir interesantas un informatīvas.

Meklēt nesenie Nesen Nesen nav izmantotas emocijzīmes Emoji... Emocijējiet panākumus