Emoji on tÀynnÀ tunteita. Se voi parantaa tai sÀÀtÀÀ tekstin sÀvyÀ ja mielialaa, samaan aikaan emojien ilmaisemat tunteet voivat olla selvempiÀ kuin vain sanat.

Esimerkiksi tĂ€mĂ€ emoji 👿 (vihaiset kasvot sarvilla). Se on ilmeisesti paholainen hahmo, joten ajatuksia saattaa olla "huono" emoji, kuten jotkut pahat ajatukset jonkun pÀÀssĂ€.

Mutta silti tÀllainen kuvaus on hyvin abstrakti. Voimmeko siis visualisoida nÀiden hymiöiden ilmaisemat mielipidetyypit ja tasot?


Vastaus on tietysti "kyllÀ"! Teimme luonnollisen kielenkÀsittelyn (NLP) julkisille nÀytteille, joissa oli vÀhintÀÀn 50 miljoonaa twiittiÀ, ja yhdistÀmme emoji-tunnelman arvosarjaan ja visualisoimme sen tekstin sentimenttianalyysillÀ (jota kutsutaan myös mielipiteenmuokkaukseksi). Vietimme paljon aikaa, energiaa ja laskentatehoa emoji-tunteiden analyysimme tekemiseksi tieteellisemmÀksi ja tarkemmaksi, jotta jokainen voi tuntea viehÀtyksen ja saada paremman kÀsityksen emojista.

Visuaaliset kaaviot emoji-mielipiteiden analysointia varten

Tiedot, kuten emoji-tunteen arvo, laskettiin tekstimittausanalyysin mukaan, joka kuuluu tilastoihin ja todennÀköisyysteoriaan. Kun olemme ratkaisseet algoritmin ja laskentatehon ongelman, kohdattiin sitten uusia vaikeuksia: miten saada kÀyttÀjÀt ymmÀrtÀmÀÀn nÀmÀ ammattitiedot?

Ajatus kulkee mielessÀmme - Hei! EntÀ visualisoimme emoji-tunteen arvot hienoilla malleilla!

💡: Muunnimme lasketut ja analysoidut tiedot (vasemmalla) kaavioon, jonka kĂ€yttĂ€jĂ€t voivat paremmin ymmĂ€rtÀÀ (oikealla), mikĂ€ voi intuitiivisemmin nĂ€yttÀÀ emojien emotionaalisen jakautumisen;

Joten anna minun selittÀÀ seuraava kaavio, joka kuvaa emojin tunteen taipumuksen analyysin tuloksia todellisessa viestinnÀssÀ.

💡: 2 tyyppistĂ€ kaaviota emoji 👿: n mielipiteiden analysointiin, tĂ€ssĂ€ analysoimme vain yllĂ€ olevaa kaaviota.

Kuvassa oleva puoliympyrÀkaari on jaettu kolmeen vÀreihin, jotka edustavat emoji different: n eri emotionaalisia taipumuksia. Kuten voimme nÀhdÀ, nÀiden kolmen tunteen osuudet ovat noin 4: 1: 5, vihreÀllÀ ja oranssilla on samanlaiset mittasuhteet, mikÀ tarkoittaa, ettÀ tÀmÀ emoji on enemmÀn neutraali (yllÀtys !!).

  • Harmaa kohdistin on luottamustaso , tilastollinen kĂ€site. Sen sijainti ja leveys osoittavat: Expected Value ± Confidence .
  • Odotettu arvo : Se on emoji-tunteen arvon dispersiivisten satunnaismuuttujien painotettu keskiarvo, jota kĂ€ytetÀÀn ilmaisemaan todennĂ€köisyyttĂ€, c ∈ [−1 0 +1] .
  • Luottamus : Se on emoji-tunteen arvojakauman parametrijoukko, joka nĂ€yttÀÀ kohtuullisen virhealueen positiivisen ja negatiivisen aikavĂ€lin muodossa. Ja mitĂ€ enemmĂ€n corpus-nĂ€ytteitĂ€ on, sitĂ€ pienempi virhe.

Yksinkertaisesti sanottuna, mitÀ lÀhempÀnÀ kohdistinta on vasemmalla, tÀmÀn emojin tunne on negatiivisempi. PÀinvastoin, mitÀ lÀhempÀnÀ kohdistinta on oikea, sitÀ positiivisempi tunne tuntee tÀmÀn emojin. Ja mitÀ kapeampi kohdistin on, tunteen arviointi on tarkempi.


Voitko nyt ymmÀrtÀÀ emoji-mielipiteiden analyysin kaavion?

MikÀ on mielipiteen analyysi?

Uskon, ettÀ olet ymmÀrtÀnyt emoji-mielipiteiden analyysin datakaavion, joten puhutaanpa sentimenttianalyysiÀ.

SentimenttianalyysiÀ kutsutaan myös mielipiteen louhinnaksi. Teknisesti katsottuna mielipiteiden analyysi on osa luonnollisen kielenkÀsittelyn (NLP) tutkimusta. SentimenttianalyysimenetelmÀt on jaettu kahteen tyyppiin: koneoppiminen ja sanakirjaan perustuvat menetelmÀt . Mutta syvÀn oppimisteknologian kehittyessÀ tÀmÀn tekniikan kÀytöstÀ tunteen analysoinnissa on tullut valtavirtaa.

Tunnelman analysointiprosessi sisÀltÀÀ tietojen esikÀsittelyn, ominaisuuksien suunnittelun ja mallikoulutuksen. Yleisesti ottaen tietojen esikÀsittelyvaihe jakaa tekstin pÀÀasiassa sanoiksi ja poistaa lopetussanat ja vÀlimerkit. TunnelmaanalyysissÀmme on kuitenkin vÀlimerkit ja lopetussanat. Ominaisuuksien suunnitteluvaiheessa valitsimme Google-tiimin vuonna 2013 ehdottaman sanan upottamisen esitys (Word2Vec), joka on jaettu CBOW-malliin (jatkuva sanapussi) ja Skip-gram- malliin. Mallin tulokset ovat seuraavat:

💡  Vasemmalla on CBOW-malli, oikealla Skip-gram-malli

CBOW perustuu kontekstiin ennustamaan kohdesana, joka kouluttaa sanavektorin saamiseksi. Kuten kuvassa on esitetty, W (t) ennustetaan neljÀn sanan W(t-2), W(t-1), W(t+1), W(t+2) ; Ja ohita-gramma on ennustaa ympÀröivÀt sanat kohdesanan mukaan kouluttaakseen sanavektorin saamiseksi. Kuten kuvassa on esitetty, on ennustettava W(t-2),W(t-1),W(t+1),W(t+2) W (t): n mukaan .

Mallien ennustusvaiheessa tiedot jaetaan kahteen osaan: Harjoitussarja jaettuna suhteella 5: 1 ja testijoukko ja harjoitusjoukko kÀsitellÀÀn jÀrjestyksessÀ.

Tunneleanalyysin kÀyttö emojissa

Sentimenttianalyysi on kattava analyysimenetelmÀ, joka yhdistÀÀ syvÀllisen oppimisen ja tilastot. Olemme saaneet emojin tunteen arvon monimutkaisen analyysin ja tietojen laskemisen jÀlkeen, ja tÀydellinen emoji-tunnelman analysointi on seuraava:

Emoji-tunteen analyysin prosessi

  • Merkitse sosiaalisen verkostoitumisen korpus
  • Tietojen esikĂ€sittely
  • Jaa tietojoukko: Harjoittelusarja (80%), Testisarja (20%)
  • KĂ€ytĂ€ mallin rakentamiseen LSTM-hermoverkkoa
  • SÀÀdĂ€ hyperparametreja mallin suorituskyvyn mukaan testisarjassa mallin yleistyskyvyn parantamiseksi
  • Suorita sama tietojen esikĂ€sittelytoiminto leimaamattomille tiedoille
  • KĂ€ytĂ€ koulutettua mielipiteen ennustusmallia ennustamaan tuntemattomuus tietojen merkitsemĂ€ttömistĂ€ tiedoista

Suoritamme mielipiteiden analyysin emojilla ja kÀytÀmme syvÀoppimistekniikkaa kouluttaaksemme emoji-tekstin tunteen luokittelijan. Luokittelijan lÀhtötasolle valitaan aktivoitava sigmoidifunktio ja heijastetaan ulostulotason tulokset vÀliin 0-1. MitÀ lÀhempÀnÀ teksti on nollaa, sitÀ negatiivisempi se on ja mitÀ lÀhempÀnÀ se on 1, sitÀ positiivisempi se on.

Sigmoidifunktion kaava on: F(x)=1/(1+ex)

KÀytÀmme analyysikorpusina suurta otosdataa, joka sisÀltÀÀ 50 miljoonaa twiittiÀ, jotka sisÀltÀvÀt emojia, ja laitamme sitten korpus analysoitavaksi koulutettuun tunteiden luokittelijaan mielipiteen ennustamiseksi. Lopuksi luokittelijan mielipiteen ennustamisen tulokset on jaettu kolmeen tyyppiin: negatiivinen, neutraali ja positiivinen. Luokitteluperusteet ovat:

Joka tapauksessa, se on vaikeaa, mutta onnistuimme !!

Emoji Sentiment Analysis -sovelluksen kÀyttö ja nÀkymÀt

SentimenttianalyysiÀ kÀytetÀÀn laajalti markkinoinnissa, mainonnassa, psykologiassa, lÀÀketieteessÀ ja muilla aloilla. PÀÀtÀmme tehdÀ emoji-mielipiteiden analyysin tarkoituksena on auttaa ihmisiÀ ymmÀrtÀmÀÀn paremmin emojia todellisessa sosiaalisessa vuorovaikutuksessa, poistamaan epÀselvyys ja vÀÀrinkÀsitys emojista tehokkaammin.

Esimerkiksi, kun keskustelet ystÀvÀsi (tai ihastuksesi) kanssa verkossa, toinen henkilö voi joskus lÀhettÀÀ sinulle emojeja, joita et oikein ymmÀrrÀ. Itse asiassa on monia tÀllaisia tilanteita, kuten:

  • MitĂ€ đŸ€’ tarkoittaa jos joku vastaa kuvani?
  • MitĂ€ tarkoittaa, kun tyttö lĂ€hettÀÀ 😊 minulle?
  • Jos murskaukseni lĂ€hettÀÀ minut ❀ , onko se hyvĂ€ merkki?

Kuten tiedĂ€mme, et voi kertoa emojin tarkkaa merkitystĂ€, mutta tunteiden analyysin avulla voit analysoida nĂ€mĂ€ emojit psykologisesti, kuten "hĂ€n lĂ€hetti minulle 💞, se on positiivinen merkki, ehkĂ€ minun pitĂ€isi pyytÀÀ hĂ€ntĂ€ ulos" tai " miksi poikaystĂ€vĂ€ni lĂ€hettÀÀ minulle 😒? Se on tavallaan negatiivinen, onko hĂ€n vihainen minulle? " , jotain tĂ€llaista. Emoji Sentiment Analysis -sovelluksen avulla uskon, ettĂ€ ymmĂ€rrĂ€t emojin syvemmĂ€lle.


Kaiken kaikkiaan olemme maksaneet paljon tÀstÀ emoji-tunnelman analysointiprojektista. Vaikka se on vaikeaa, haluamme silti syventÀÀ sitÀ. Analysoimme nyt emojia eri kielillÀ, emojien emotionaalista vahvistumisvaikutusta puhtaaseen tekstiin, ja myös useita muita syventÀviÀ tutkimuksia on harkittu. Kaikkien nÀiden tarkoituksena on tutkia emojien kÀyttöÀ lisÀÀ, ja toivon, ettÀ emojit ovat mielenkiintoisia ja informatiivisia.

Etsi viimeaikaiset Viimeaikaiset Ei viime aikoina kÀytetty emoji Emojifioida... Emojifioi menestys