Në ditët e sotme krijohen gjithnjë e më shumë përdorime praktike dhe interesante emoji, për shembull, kategori të ndryshme emoji do të kombinohen së bashku për t'u bërë një Meme, ose emoji në dukje të palidhura mund të përdoren në të vërtetë për të përshkruar të njëjtin kuptim, gjë që i bën emoji-t gradualisht të krijojnë një lidhje midis ato. Ne duam ta shfaqim këtë marrëdhënie midis emoji-ve në mënyrë vizuale dhe t'i lejojmë përdoruesit të kenë një kuptim më të thellë të përdorimit të emoji-ve, kështu që ne përdorim algoritme të mësimit të makinerive për të llogaritur marrëdhënien midis emoji-ve dhe për të nxjerrë rezultatin në një foto të lehtë për t'u kuptuar, që është Marrëdhënia e emoji-ve Grafiku .
Çfarë është Grafiku i Marrëdhënieve Emoji?
Dihet mirë që emoji-t zakonisht paraqiten si imazhe, por është e pamundur të kuptosh marrëdhënien midis emoji-ve me imazhet, sepse përdorimi kryesor i emoji-ve është të përcjellë informacione dhe emocione, ato janë më shumë si një gjuhë, kështu që do të jetë më e saktë për të eksploruar marrëdhënien e tyre përmes kuptimit dhe përdorimit të emoji-ve. Prandaj, kemi marrë të gjitha tweet-et që përmbajnë emoji nga viti 2018 deri në vitin 2021, në total 812 milionë tweete . Duke marrë parasysh se përdorimi i emoji-ve do të jetë i ndryshëm në mjedise të ndryshme gjuhësore, ne i klasifikuam tweet-et sipas gjuhës dhe më pas llogaritëm ngjashmërinë e tekstit midis emoji-ve në secilën gjuhë sipas algoritmit të mësimit të makinës, në mënyrë që të marrim Grafikun përkatës të Marrëdhënieve Emoji për secilën gjuhë.
Si të kuptoni Grafikun e Marrëdhënieve Emoji?
Ky është Grafiku i Marrëdhënieve Emoji të 👉 për spanjisht. Kutia e kuqe tregon 9 emoji-t më të afërt me të, gjatësia e rrezes përfaqëson shkallën e marrëdhënies, sa më e shkurtër të jetë rrezja, aq më e afërt është marrëdhënia. Përveç kësaj, grafiku tregon gjithashtu një pjesë të grafikut të marrëdhënieve të emoji-ve të tjerë. Në kutinë e zezë është grafiku i marrëdhënieve të 👆 ,dhe në kutinë portokalli është grafiku i marrëdhënieve të ⤵ .
Rezultatet e pasqyruara në grafikun e marrëdhënieve na lejojnë të kemi një kuptim më të pasur të përdorimit të emoji-ve. Për shembull, këto dy emoji 👈 🥺 përdoren shpesh si kombinim me 👉 në vitet e fundit për të shprehur të mërzitur, të turpshëm ose përgjërues, kështu që ato shfaqen në këtë grafik marrëdhëniesh:
Këto dy emoji përdoren shpesh për të treguar lidhjet, që do të thotë se kanë ngjashmëri në përdorim, kështu që janë afër njëri-tjetrit në grafikun e marrëdhënieve:
Nëse futeni në grafikun e marrëdhënieve me emoji, mund të rifreskoni perceptimin tuaj për disa emoji.
Si të llogarisni marrëdhënien midis emoji-ve?
Më pas do t'ju japim një përshkrim të hollësishëm të procesit të llogaritjes. Mund të ndahet përafërsisht në tre hapat e mëposhtëm:
- Së pari, ne përdorim algoritmin TF-IDF për të nxjerrë etiketat e secilit emoji nga tweet-et dhe peshën që korrespondon me secilën etiketë. Etiketat u referohen atyre fjalëve që janë më të lidhura me emoji, të cilat janë ekuivalente me karakteristikat e një emoji; dhe peshat i referohen afërsisë së marrëdhënies midis etiketave dhe emoji-ve, sa më e lartë të jetë pesha, aq më e ngushtë është marrëdhënia. Në lidhje me algoritmin dhe procesin e llogaritjes së marrjes së etiketave, ne kemi shkruar një artikull për ta prezantuar në detaje, mund të klikoni në lidhjen e duhur për ta lexuar: ☁️Emoji Tag Cloud: Ju ndihmon të merrni më shumë njohuri për Emoji!
- Pas marrjes së etiketave, lind një problem i ri. Kur bëhet fjalë për llogaritjet, të gjithë e dimë se në përgjithësi mund të llogariten vetëm vlerat numerike, por etiketat paraqiten si tekst, kështu që si mund të llogariten ato në mënyrë algoritmike? Prandaj, hapi ynë i dytë është konvertimi i tekstit në vlerat numerike që mund të llogariten—— Vektori . Ky proces quhet Word Embedding . Fillimisht duhet të lexojmë një sasi të madhe të dhënash të tweet- eve duke përdorur algoritmin word2vec (një nga metodat e ngulitjes së fjalëve) për të transformuar çdo fjalë në tekst në një vektor, më pas mund të marrim një matricë të futjes së fjalëve që përbëhet nga të gjithë vektorët me dimensione të larta e fjalëve, dhe më vonë hartojeni secilën fjalë që korrespondon me secilën etiketë që morëm në hapin e parë në një vektor me dimensione të larta përmes matricës së ngulitjes së fjalës. Kështu, ne kemi përfunduar konvertimin tekst në vektor. Këta vektorë me dimensione të larta llogariten duke analizuar kontekstin e tekstit, i cili mund të ruajë mirë informacionin semantik të çdo fjale dhe në këtë mënyrë të sigurojë saktësinë e ngjashmërisë së tekstit. Algoritmi word2vec gjithashtu shpjegohet në detaje në blogun tonë, nëse dëshironi më shumë detaje mund ta lexoni: 🔍Analiza e ndjenjave të emoji
- Hapi i fundit është llogaritja e ngjashmërisë së tekstit midis emoji-ve. Algoritmi që përdoret zakonisht për të llogaritur ngjashmërinë e tekstit është VSM (Modeli i Hapësirës Vektoriale) . Ky është një nga modelet më të përdorura të llogaritjes së ngjashmërisë, por ai merr rezultate duke llogaritur fjalët e përbashkëta (fjalë që shfaqen në të dy tekstet) të dy teksteve, gjë që nuk është e saktë kur përballemi me tekste me të njëjtin kuptim, por me formulime të ndryshme. për të shmangur këtë situatë, ne zgjodhëm një algoritëm tjetër—— SCM (Soft Cosine Measure) . Ai mund të masë ngjashmërinë midis fjalëve, kështu që edhe nëse dy tekste nuk kanë fjalë të përbashkëta, ky algoritëm mund të llogarisë ngjashmërinë e dy teksteve duke vlerësuar ngjashmërinë e fjalëve. Pasi përdorim SCM për të matur vektorin, sa më e madhe të jetë vlera që marrim do të thotë aq më e lartë është ngjashmëria e tekstit midis emoji-ve dhe sa më e lartë të jetë ngjashmëria e tekstit, aq më e ngushtë është marrëdhënia e tyre.
konkluzioni
Nëpërmjet grafikut të marrëdhënieve, ne mund të kuptojmë zakonet dhe preferencat e njerëzve për përdorimin e emoji-ve dhe të eksplorojmë trendin e përdorimit të emoji-ve. Ju mund të habiteni kur zbuloni se disa emoji që nuk do t'i lidhni me njëri-tjetrin janë në fakt shumë të lidhura ngushtë dhe ky mund të jetë një përdorim i ri në modë i emoji-ve që nuk e keni njohur ende! Gjithashtu, nëse keni ndonjë sugjerim, ju lutemi na tregoni në koment!