Obecnie powstaje coraz więcej praktycznych i interesujących zastosowań emotikonów, na przykład różne kategorie emotikonów zostaną połączone, aby stać się memem, lub pozornie niepowiązane emotikony mogą być faktycznie użyte do opisania tego samego znaczenia, co powoduje, że emoji stopniowo tworzą połączenie między im. Chcemy pokazać tę relację między emotikonami wizualnie i umożliwić użytkownikom głębsze zrozumienie użycia emotikonów, dlatego używamy algorytmów uczenia maszynowego do obliczania relacji między emotikonami i rysowania wyniku na łatwym do zrozumienia obrazie, jakim jest relacja emoji Wykres .

Co to jest wykres relacji emoji?

Powszechnie wiadomo, że emotikony są zwykle przedstawiane jako obrazy, ale nie da się ustalić związku między emotikonami z obrazami, ponieważ głównym zastosowaniem emotikonów jest przekazywanie informacji i emocji, są one bardziej jak język, więc będzie to dokładniejsze badanie ich relacji poprzez znaczenie i użycie emotikonów. W związku z tym uzyskaliśmy wszystkie tweety zawierające emoji od 2018 do 2021 roku, łącznie 812 milionów tweetów . Biorąc pod uwagę, że użycie emoji będzie różne w różnych środowiskach językowych, sklasyfikowaliśmy tweety według języka, a następnie obliczyliśmy podobieństwo tekstu między emoji w każdym języku za pomocą algorytmu uczenia maszynowego, aby uzyskać odpowiedni wykres relacji emoji dla każdego języka.

Jak zrozumieć wykres zależności emoji?

To jest wykres zależności emoji👉 dla języka hiszpańskiego. Czerwone pole pokazuje 9 najbliższych emoji, długość promienia reprezentuje stopień związku, im krótszy promień, tym bliższy związek. Ponadto wykres pokazuje również część wykresu relacji innych emoji. W czarnej skrzynki jest wykresem związek 👆 , w polu pomarańczowy jest wykresem związek .

Wyniki odzwierciedlone na wykresie relacji pozwalają nam lepiej zrozumieć użycie emoji. Na przykład te dwa emotikony 👈 🥺 są często używane w ostatnich latach w połączeniu z👉 w celu wyrażenia pokrzywdzonych, nieśmiałych lub błagalnych, więc pojawiają się na tym wykresie relacji:

Te dwa emotikony są często używane do wskazywania linków, co oznacza, że mają podobieństwa w użyciu, więc są blisko siebie na wykresie relacji:

Jeśli zagłębisz się w tabelę relacji emoji, możesz odświeżyć swoje postrzeganie niektórych emoji.

Jak obliczyć związek między emoji?

Następnie przedstawimy Ci szczegółowy opis procesu obliczeniowego. Można go z grubsza podzielić na następujące trzy kroki:

  • Najpierw używamy algorytmu TF-IDF, aby wyodrębnić tagi każdego emoji z tweetów i wagę odpowiadającą każdemu tagowi. Tagi odnoszą się do tych słów, które są najbliżej związane z emoji, które są odpowiednikami cech emoji; a wagi odnoszą się do ścisłego związku między tagami a emotikonami, im wyższa waga, tym bliższy związek. O algorytmie i procesie obliczania uzyskiwania tagów napisaliśmy artykuł, aby szczegółowo go przedstawić, możesz kliknąć prawy link, aby go przeczytać: ☁️Chmura tagów emoji: pomoc w zdobyciu większej wiedzy o emotikonach!
  • Po uzyskaniu etykiet pojawia się nowy problem. Jeśli chodzi o obliczenia, wszyscy wiemy, że generalnie można obliczyć tylko wartości liczbowe, ale tagi są przedstawiane jako tekst, więc jak można je obliczyć algorytmicznie? Dlatego naszym drugim krokiem jest konwersja tekstu na wartości liczbowe, które można obliczyć — — Wektor . Ten proces nazywa się osadzaniem słów . Najpierw musimy odczytać dużą ilość danych z tweeta za pomocą algorytmu word2vec (jedna z metod osadzania słów), aby przekształcić każde słowo w tekście w wektor, a następnie możemy uzyskać macierz osadzania słów składającą się ze wszystkich wektorów wysokowymiarowych słów, a później odwzorowuje każde słowo odpowiadające każdemu znacznikowi, który otrzymaliśmy w pierwszym kroku, na wielowymiarowy wektor za pomocą macierzy osadzania słów. W ten sposób zakończyliśmy konwersję tekstu na wektor. Te wysokowymiarowe wektory są obliczane na podstawie analizy kontekstu tekstu, który może dobrze zachować informacje semantyczne każdego słowa, a tym samym zapewnić dokładność podobieństwa tekstu. Algorytm word2vec jest również szczegółowo wyjaśniony na naszym blogu, jeśli chcesz więcej szczegółów, możesz go przeczytać: 🔍Analiza nastrojów emoji
  • Ostatnim krokiem jest obliczenie podobieństwa tekstu między emotikonami. Algorytmem powszechnie używanym do obliczania podobieństwa tekstu jest VSM(Vector Space Model) . Jest to jeden z najczęściej używanych modeli obliczania podobieństwa, ale uzyskuje wyniki poprzez obliczenie współwystępujących słów (słów występujących w obu tekstach) z dwóch tekstów, co nie jest dokładne w przypadku tekstów o tym samym znaczeniu, ale różnych sformułowaniach. aby uniknąć tej sytuacji, wybraliśmy inny algorytm—— SCM (Soft Cosine Measure) . Może mierzyć podobieństwo między słowami, więc nawet jeśli dwa teksty nie mają wspólnych słów, ten algorytm może obliczyć podobieństwo dwóch tekstów, oceniając podobieństwo słów. Po użyciu SCM do pomiaru wektora, im większa otrzymana wartość, tym większe podobieństwo tekstu między emoji, a im wyższe podobieństwo tekstu, tym bliższy ich związek.

Wniosek

Dzięki wykresowi relacji możemy zrozumieć zwyczaje i preferencje ludzi dotyczące korzystania z emotikonów, a także zbadać trendy korzystania z emotikonów. Możesz być zaskoczony, że niektóre emoji, których nie kojarzysz ze sobą, są w rzeczywistości bardzo blisko spokrewnione i może to być nowe modne użycie emoji, którego jeszcze nie znasz! Jeśli masz jakieś sugestie, poinformuj nas o tym w komentarzu!


Szukaj ostatnie Ostatnie Brak emotikonów ostatniego użycia emoji... Emojifikuj sukces