Dandanes je ustvarjenih vse več praktičnih in zanimivih uporab emojijev, na primer, različne kategorije emojijev bodo združene v Meme ali pa se na videz nepovezani emoji dejansko lahko uporabijo za opis istega pomena, zaradi česar emoji postopoma ustvarjajo povezavo med njim. To razmerje med čustvenimi simboli želimo vizualno prikazati in uporabnikom omogočiti globlje razumevanje uporabe emodžijev, zato uporabljamo algoritme strojnega učenja za izračun razmerja med emodžiji in rezultat narišemo v lahko razumljivo sliko, ki je razmerje emojijev. Graf .

Kaj je graf odnosov emojijev?

Znano je, da so emoji običajno predstavljeni kot slike, vendar je nemogoče ugotoviti razmerje med emoji s slikami, ker je glavna uporaba emojijev posredovanje informacij in čustev, so bolj podobni jeziku, zato bo natančneje raziskati njun odnos skozi pomen in uporabo emodžijev. Zato smo od leta 2018 do 2021 prejeli vse tvite, ki vsebujejo emodžije, skupaj 812 milijonov tvitov . Glede na to, da bo uporaba emojijev v različnih jezikovnih okoljih različna, smo tvite razvrstili po jeziku in nato z algoritmom strojnega učenja izračunali podobnost besedila med emoji v vsakem jeziku, da bi dobili ustrezen graf razmerja emojijev za vsak jezik.

Kako razumeti graf odnosov emojijev?

To je graf odnosov emojijev👉 za španščino. Rdeče polje prikazuje 9 najbližjih emojijev, dolžina žarka predstavlja stopnjo razmerja, krajši kot je žarek, bližje je razmerje. Poleg tega graf prikazuje tudi del grafa razmerij drugih emojijev. V črni škatli je graf razmerja 👆, in v oranžnem polju je graf razmerja .

Rezultati, prikazani v grafu razmerja, nam omogočajo boljše razumevanje uporabe emojijev. Na primer, ta dva 👈 🥺 👉se v zadnjih letih pogosto uporabljata kot kombinacija z za izražanje užaljenega, sramežljivega ali prosečega, zato sta prikazana v tem grafu razmerij:

Ta dva emodžija se pogosto uporabljata za označevanje povezav, kar pomeni, da imata podobnosti v uporabi, zato sta blizu drug drugemu v grafu razmerij:

Če se poglobite v grafikon odnosov emojijev, boste morda osvežili svoje dojemanje nekaterih emojijev.

Kako izračunati razmerje med emoji?

Nato vam bomo dali podroben opis postopka izračuna. V grobem ga lahko razdelimo na naslednje tri korake:

  • Najprej uporabimo algoritem TF-IDF, da iz tvitov izvlečemo oznake vsakega emojija in težo, ki ustreza vsaki oznaki. Oznake se nanašajo na tiste besede, ki so najbolj povezane z emoji, ki so enakovredne značilnostim emojijev; in uteži se nanašajo na tesnost razmerja med oznakami in emodžiji, višja kot je teža, tesnejši je odnos. O algoritmu in postopku izračuna pridobivanja oznak smo napisali članek, da ga podrobneje predstavimo, lahko kliknete desno povezavo, da ga preberete: ☁️Oblak oznak Emoji: Pomagajte vam, da pridobite več znanja o Emoji!
  • Po pridobitvi nalepk se pojavi nova težava. Ko gre za izračune, vsi vemo, da je na splošno mogoče izračunati samo številčne vrednosti, vendar so oznake predstavljene kot besedilo, kako jih torej lahko izračunamo algoritemsko? Zato je naš drugi korak pretvorba besedila v številčne vrednosti, ki jih je mogoče izračunati—— Vektor . Ta postopek se imenuje vdelava besed . Najprej moramo prebrati veliko količino tweet podatkov z algoritmom word2vec (eden od načinov vdelave besed), da vsako besedo v besedilu pretvorimo v vektor, nato pa lahko dobimo matriko za vdelavo besed, sestavljeno iz vseh visokodimenzionalnih vektorjev besed, kasneje pa preslikamo vsako besedo, ki ustreza vsaki oznaki, ki smo jo dobili v prvem koraku, v visokodimenzionalni vektor prek matrike za vdelavo besed. Tako smo zaključili pretvorbo besedila v vektor. Ti visokodimenzionalni vektorji so izračunani z analizo konteksta besedila, ki lahko dobro ohrani pomensko informacijo vsake besede in tako zagotovi natančnost podobnosti besedila. Algoritem word2vec je podrobno razložen tudi v našem blogu, če želite več podrobnosti, ga lahko preberete: 🔍Emoji Sentiment Analysis
  • Zadnji korak je izračunati podobnost besedila med emojiji. Algoritem, ki se običajno uporablja za izračun podobnosti besedila, je VSM (Vektorski prostorski model) . To je eden najpogosteje uporabljenih modelov izračuna podobnosti, vendar dobi rezultate z izračunom sočasno pojavljajočih se besed (besed, ki se pojavljajo v obeh besedilih) dveh besedil, kar ni natančno, če se soočamo z besedili z enakim pomenom, vendar različnim besedilom. da bi se izognili tej situaciji, smo izbrali drug algoritem—— SCM (mehka kosinusna mera) . Lahko izmeri podobnost med besedami, tako da lahko ta algoritem izračuna podobnost dveh besedil tudi, če dve besedili nimata skupnih besed, tako da oceni podobnost besed. Ko uporabimo SCM za merjenje vektorja, večja vrednost, ki jo dobimo, pomeni večjo podobnost besedila med emojiji in večja kot je podobnost besedila, tesnejša je njuna povezava.

Zaključek

Z grafom odnosov lahko razumemo navade in želje ljudi pri uporabi emojijev ter raziščemo trend uporabe emojijev. Morda boste presenečeni, ko boste ugotovili, da so nekateri čustveni simboli, ki jih ne bi povezali med seboj, pravzaprav zelo tesno povezani, in to je morda nova trendovska uporaba emojijev, ki jih še niste poznali! Tudi, če imate kakršne koli predloge, nam to sporočite v komentarju!


Išči nedavni Nedavne Brez nedavne uporabe emoji Emojify... Emojify uspeh