Emoji ay puno ng damdamin. Maaari nitong mapahusay o ayusin ang tono at kalooban ng teksto, sa parehong oras, ang mga emosyong ipinahiwatig ng emoji ay maaaring maging halata kaysa sa mga salita lamang.

Halimbawa ang emoji na ito 👿 (galit na mukha na may sungay). Ito ay sa anyo ng isang diablo na character na malinaw naman, kaya maaaring may mga saloobin na isinasaalang-alang ito ay isang "masamang" emoji, tulad ng ilang masasamang saloobin sa ulo ng isang tao.

Ngunit gayon pa man, ang ganitong uri ng paglalarawan ay napaka abstract. Samakatuwid, maaari ba nating mailarawan ang mga uri ng sentiment at antas na ipinahayag ng mga emojis na ito?


Ang sagot ay "Oo" syempre! Ginanap namin ang Likas na Pagproseso ng Wika (NLP) sa mga pampublikong sample ng hindi kukulangin sa 50 milyong mga tweet, at ginagamit namin ang Pagsusuri sa Sentimento ng Teksto (tinatawag ding pagmimina ng opinyon) upang maiugnay ang damdaming emoji sa isang hanay ng mga halaga at mailarawan ito. Gumugol kami ng maraming oras, lakas at kapangyarihan sa computing upang gawing mas pang-agham at mahigpit ang aming pag-aaral ng damdamin ng emoji, upang madama ng lahat ang alindog at makakuha ng mas mahusay na pag-unawa sa emoji.

Mga visual na tsart para sa pagsusuri ng damdaming emoji

Ang data tulad ng halaga ng damdaming emoji ay kinakalkula ayon sa pagtatasa ng sentimento ng teksto, na kabilang sa istatistika at teorya ng posibilidad. Matapos naming malutas ang problema ng algorithm at kapangyarihan sa pag-compute, pagkatapos ay makaranas ng mga bagong paghihirap: kung paano ipapaunawa sa mga gumagamit ang propesyonal na data na ito?

Isang pag-iisip ang tumatawid sa ating isipan—— Hoy! Paano natin masasalamin ang mga halagang sentido ng emoji na may ilang mga cool na disenyo!

💡: Na-convert namin ang kinakalkula at nasuri na data (kaliwa) sa isang tsart na maaaring mas maintindihan ng mga gumagamit (kanan), na maaaring higit na maipakita ang emosyonal na paghahati ng emoji;

Kaya hayaan mong ipaliwanag ko ang sumusunod na tsart, na naglalarawan ng mga resulta ng pagsusuri ng tendensiyang damdamin ng emoji sa aktwal na komunikasyon.

💡: 2 uri ng mga tsart para sa pagsusuri ng damdamin ng emoji 👿, narito lamang namin pinag-aaralan ang tsart sa itaas.

Ang arc ng kalahating bilog sa larawan ay nahahati sa tatlong mga kulay, na kumakatawan sa iba't ibang mga kaugaliang emosyonal ng emoji 👿 . Tulad ng nakikita natin, ang mga proporsyon ng tatlong emosyon na ito ay tungkol sa 4: 1: 5, berde at kahel ay may magkatulad na sukat, na nangangahulugang ang emoji na ito ay higit na walang kinikilingan (sorpresa !!).

  • Ang grey cursor ay ang Confidence Level , isang konseptong pang-istatistika. Ipinapahiwatig ng posisyon at lapad nito: Expected Value ± Confidence .
  • Inaasahang Halaga : Ito ay ang average na may timbang na dispersive random variable ng halaga ng damdaming emoji, ginamit upang ipahayag ang posibilidad, c ∈ [−1, 0, +1] .
  • Kumpiyansa : Ito ay ang hanay ng parameter ng pamamahagi ng halaga ng damdaming emoji, nagpapakita ng isang makatuwirang saklaw ng error sa anyo ng positibo at negatibong agwat. At mas malaki ang bilang ng mga sample ng corpus ay, mas maliit ang error.

Sa simpleng pagsasalita, ang mas malapit na cursor ay sa kaliwa, ang emosyon ng emoji na ito ay mas negatibo. Sa kabaligtaran, ang mas malapit na cursor ay nasa kanan, mas positibong emosyon na ipinahayag ng emoji na ito. At ang mas makitid na cursor ay, ang paghuhusga ng damdamin ay mas tumpak.


Ngayon, naiintindihan mo ba ang aming tsart ng pagsusuri ng damdaming emoji?

Ano ang Pagsusuri sa Saloobin?

Naniniwala ako na naintindihan mo ang tsart ng data ng pagsusuri ng damdaming emoji, kaya pag-usapan natin ang tungkol sa kung ano ang pagsusuri sa damdamin.

Ang pagtatasa ng damdamin ay tinatawag ding opinion mining. Sa teknikal na pagsasalita, ang pagtatasa ng damdamin ay bahagi ng pagsasaliksik sa natural na pagproseso ng wika (NLP). Ang mga pamamaraan ng pagsusuri sa damdamin ay nahahati sa dalawang uri: Pag- aaral ng makina at mga pamamaraan na batay sa Diksyonaryo . Ngunit sa pag-unlad ng malalim na teknolohiya ng pag-aaral, ang paggamit ng teknolohiyang ito para sa pagsusuri ng damdamin ay naging pangunahing.

Kasama sa proseso ng pagsusuri ng damdamin ang preprocessing ng data, tampok na engineering at pagsasanay sa modelo. Karaniwan na pagsasalita, ang yugto ng preprocessing ng data higit sa lahat ay hinahati ang teksto sa mga salita at inaalis ang mga salitang hihinto at bantas. Gayunpaman, pinapanatili ng aming pagsusuri sa damdamin ang mga marka ng bantas at ititigil ang mga salita. Sa yugto ng tampok na engineering, pinili namin ang salitang pag-embed ng salitang (Word2Vec) na iminungkahi ng koponan ng Google noong 2013, na nahahati sa modelo ng CBOW (tuloy-tuloy na bag ng mga salita) at modelo ng Skip-gram . Ang mga resulta ng modelo ay ang mga sumusunod:

💡 : Sa kaliwa ay ang modelo ng CBOW, sa kanan ay modelo ng Skip-gram

Ang CBOW ay batay sa konteksto upang mahulaan ang target na salita upang sanayin upang makuha ang salitang vector. Tulad ng ipinakita sa pigura, hinulaan ang W (t) batay sa apat na salitang W(t-2), W(t-1), W(t+1), W(t+2) ; At ang skip-gram ay upang hulaan ang mga nakapalibot na salita ayon sa target na salita upang sanayin upang makuha ang salitang vector. Tulad ng ipinakita sa pigura ay upang hulaan ang W(t-2),W(t-1),W(t+1),W(t+2) ayon sa W (t) .

Sa yugto ng hula ng modelo, hinahati namin ang data sa dalawang bahagi: Ang hanay ng pagsasanay na hinati sa isang ratio na 5: 1 at ang hanay ng pagsubok at ang hanay ng pagsasanay ay naproseso nang hindi maayos.

Paglalapat ng pagsusuri ng damdamin sa emoji

Ang pagsusuri sa damdamin ay isang komprehensibong pamamaraan ng pagtatasa na pinagsasama ang malalim na pag-aaral at mga istatistika. Nakuha namin ang halaga ng damdamin ng emoji pagkatapos ng kumplikadong pag-aaral at pagkalkula ng mga reams ng data, at ang kumpletong proseso ng pagsusuri ng damdaming emoji ay ang mga sumusunod:

Ang proseso ng Emoji Sentiment Analysis

  • Lagyan ng label ang social networking corpus
  • Pag-preprocess ng data
  • Hatiin ang dataset: Set ng Pagsasanay (80%), hanay ng Pagsubok (20%)
  • Gumamit ng LSTM neural network upang makabuo ng isang modelo
  • Ayon sa pagganap ng modelo sa hanay ng pagsubok, ayusin ang mga hyperparameter upang mapabuti ang kakayahang paglalahat ng modelo
  • Gawin ang parehong pagkilos na preprocessing ng data sa hindi naka-label na data
  • Gumamit ng sinanay na modelo ng hula ng damdamin upang mahulaan ang ugali ng damdamin sa hindi naka-label na data

Nagsasagawa kami ng pagsusuri sa damdamin sa emoji, at gumagamit ng malalim na teknolohiya ng pag-aaral upang sanayin upang makakuha ng isang klasipikasyon ng sentimo ng teksto ng emoji. Para sa output layer ng classifier, pipiliin namin ang pagpapaandar ng sigmoid upang buhayin, at i-project ang mga resulta ng layer ng output sa agwat ng 0-1. Kung mas malapit ang teksto sa 0, mas negatibo ito, at mas malapit ito sa 1, mas positibo ito.

Ang formula ng pag-andar ng sigmoid ay: F(x)=1/(1+ex)

Gumagamit kami ng isang malaking sample na data ng 50 milyong mga tweet na naglalaman ng emoji bilang isang corpus sa pag-aaral, pagkatapos ay ilagay ang corpus na kailangang masuri sa pinagsanay na klasipikasyon ng damdamin para sa hula ng damdamin. Sa wakas, ang mga resulta ng hula ng damdamin ng classifier ay nahahati sa tatlong uri: negatibo, walang kinikilingan at positibo. Ang pamantayan sa pag-uuri ay:

Gayunpaman, mahirap, ngunit nagawa namin ito !!

Ang paggamit at pag-asam ng Emoji Sentiment Analysis

Ang pagtatasa ng damdamin ay malawakang ginagamit sa marketing, advertising, sikolohiya, medikal at iba pang mga larangan. Napagpasyahan naming gawin ang pagsusuri sa damdaming emoji ay upang matulungan ang mga tao na makakuha ng mas malalim na pag-unawa sa emoji sa aktwal na pakikipag-ugnay sa lipunan, alisin ang kalabuan at hindi pagkakaunawaan ng emoji nang mas epektibo.

Halimbawa, kapag nakikipag-chat ka sa iyong kaibigan (o iyong crush) sa online, maaaring magpadala sa iyo ang ibang tao ng mga emoji na hindi mo masyadong nauunawaan. Sa totoo lang, maraming mga sitwasyong tulad nito, tulad ng:

  • Ano ang ibig 🤒 ibig sabihin kapag ang isang tao ang sumagot sa aking larawan?
  • Ano ang ibig sabihin kapag ang isang batang babae ay nagpapadala ng 😊 sa akin?
  • Kung magpapadala sa akin ang aking crush , magandang sign ba iyon?

Tulad ng alam namin, hindi mo masasabi ang tumpak na kahulugan ng isang emoji, gayunpaman, sa pamamagitan ng aming pag-aaral ng damdamin, maaari mong pag-aralan ang mga emojis na ito sa sikolohikal, tulad ng "pinadalhan niya ako ng isang 💞, ito ay isang positibong tanda, marahil dapat kong tanungin siya" o " bakit pinapadalhan ako ng kasintahan ng isang 😒? Ito ay uri ng negatibo, galit ba siya sa akin? " , isang bagay na tulad nito. Sa aming Emoji Sentiment Analysis , naniniwala akong mas mauunawaan mo ang emoji.


Sa kabuuan, malaki ang nabayaran namin para sa proyektong pagsusuri sa sentimiyento ng emoji. Kahit na mahirap ito, nais pa rin naming gawing mas malalim ito. Sinusuri namin ngayon ang emoji sa iba't ibang mga wika, ang emosyonal na nakakuha ng epekto ng emoji sa purong teksto, at maraming iba pang mga advanced na pag-aaral ang isinasaalang-alang din. Ang lahat ng ito ay upang galugarin ang higit pang paggamit ng emoji, at inaasahan mong mahahanap mo ang emoji na kawili-wili at kaalaman.

Hanapin kamakailan Recents Walang kamakailang paggamit ng emoji Emojify... Tagumpay sa Emojify