Emoji są pełne emocji. Potrafi wzmocnić lub dostosować ton i nastrój tekstu, jednocześnie emocje wyrażane przez emoji mogą być bardziej oczywiste niż same słowa.

Na przykład ten emoji 👿 (zła twarz z rogami). Jest to oczywiście postać diabła, więc mogą być myśli, że jest to „zły” emoji, jak jakieś złe myśli w czyjejś głowie.

Jednak ten rodzaj opisu jest bardzo abstrakcyjny. Czy możemy zatem zwizualizować typy i poziomy nastrojów wyrażane przez te emotikony?


Odpowiedź brzmi oczywiście „Tak”! Przeprowadziliśmy przetwarzanie języka naturalnego (NLP) na publicznych próbkach nie mniej niż 50 milionów tweetów i używamy analizy nastrojów tekstowych (zwanej również eksploracją opinii), aby powiązać sentyment emoji z zestawem wartości i zwizualizować go. Spędziliśmy dużo czasu, energii i mocy obliczeniowej, aby nasza analiza sentymentu emoji była bardziej naukowa i rygorystyczna, aby każdy mógł poczuć urok i lepiej zrozumieć emoji.

Wizualne wykresy do analizy nastrojów emoji

Dane takie jak wartość sentymentu emoji zostały obliczone na podstawie analizy sentymentu tekstu, która należy do statystyki i teorii prawdopodobieństwa. Po rozwiązaniu problemu algorytmu i mocy obliczeniowej pojawiły się nowe trudności: jak sprawić, by użytkownicy zrozumieli te profesjonalne dane?

Przemyka nam myśl... Hej! Co powiesz na wizualizację wartości sentymentu emoji z kilkoma fajnymi projektami!

💡: Przekształciliśmy obliczone i przeanalizowane dane (po lewej) na wykres, który może być lepiej zrozumiały dla użytkowników (po prawej), który może bardziej intuicyjnie pokazać emocjonalny podział emoji;

Pozwólcie, że wyjaśnię poniższy wykres, który przedstawia wyniki analizy tendencji nastrojów emoji w rzeczywistej komunikacji.

💡: 2 rodzaje wykresów do analizy nastrojów emoji 👿, tutaj analizujemy tylko powyższy wykres.

Łuk półokręgu na obrazku podzielony jest na trzy kolory, reprezentujące różne tendencje emocjonalne emoji 👿 . Jak widać, proporcje tych trzech emocji wynoszą około 4:1:5, zielony i pomarańczowy mają podobne proporcje, co oznacza, że ten emoji jest bardziej neutralny (niespodzianka!!).

  • Szary kursor to poziom ufności , pojęcie statystyczne. Jego pozycja i szerokość wskazują: Expected Value ± Confidence .
  • Oczekiwana wartość : jest to średnia ważona rozproszonych zmiennych losowych wartości sentymentu emoji, używana do wyrażania prawdopodobieństwa, c ∈ [−1, 0, +1] .
  • Pewność : Jest to zestaw parametrów rozkładu wartości sentymentu emoji, pokazuje rozsądny zakres błędu w postaci interwału dodatniego i ujemnego. Im większa liczba próbek korpusowych, tym mniejszy błąd.

Mówiąc najprościej, im bliżej kursora po lewej stronie, emocja tego emoji jest bardziej negatywna. Wręcz przeciwnie, im bliżej kursora po prawej stronie, tym bardziej pozytywne emocje wyraża ten emoji. A im węższy jest kursor, tym dokładniejsza jest ocena emocji.


Czy teraz rozumiesz nasz wykres analizy nastrojów emoji?

Co to jest analiza nastrojów?

Uważam, że zrozumiałeś wykres danych analizy nastrojów emoji, więc porozmawiajmy o tym, czym jest analiza nastrojów.

Analiza sentymentu nazywana jest również eksploracją opinii. Z technicznego punktu widzenia analiza sentymentu jest częścią badań nad przetwarzaniem języka naturalnego (NLP). Metody analizy nastrojów dzielą się na dwa typy: uczenie maszynowe i metody oparte na słowniku . Jednak wraz z rozwojem technologii głębokiego uczenia się, wykorzystanie tej technologii do analizy sentymentów stało się głównym nurtem.

Proces analizy sentymentu obejmuje wstępne przetwarzanie danych, inżynierię funkcji i uczenie modeli. Ogólnie rzecz biorąc, etap wstępnego przetwarzania danych dzieli głównie tekst na słowa i usuwa słowa stop oraz znaki interpunkcyjne. Jednak nasza analiza sentymentu zachowuje znaki interpunkcyjne i słowa stop. Na etapie inżynierii funkcji wybraliśmy reprezentację osadzania słów (Word2Vec) zaproponowaną przez zespół Google w 2013 roku, która dzieli się na model CBOW (continuous bag of words) oraz model Skip-gram . Wyniki modelu są następujące:

💡:Po lewej stronie znajduje się model CBOW, po prawej model Skip-gram

CBOW opiera się na kontekście przewidywania słowa docelowego do trenowania w celu uzyskania wektora słowa. Jak pokazano na rysunku, W(t) jest przewidywane na podstawie czterech słów W(t-2), W(t-1), W(t+1), W(t+2) ; A pomijanie gramów polega na przewidywaniu otaczających słów zgodnie ze słowem docelowym, które należy wytrenować, aby uzyskać wektor słowa. Jak pokazano na rysunku, jest przewidywanie W(t-2),W(t-1),W(t+1),W(t+2) zgodnie z W(t) .

Na etapie przewidywania modelu dzielimy dane na dwie części: zbiór uczący podzielony w stosunku 5:1 oraz zbiór testowy i zbiór uczący są przetwarzane w niewłaściwy sposób.

Zastosowanie analizy sentymentu w emotikonach

Analiza sentymentu to kompleksowa metoda analizy, która łączy głębokie uczenie się i statystykę. Wartość sentymentu emoji uzyskaliśmy po złożonej analizie i obliczeniu ryz danych, a pełny proces analizy sentymentu emoji wygląda następująco:

Proces analizy sentymentu Emoji

  • Oznacz korpus sieci społecznościowych
  • Wstępne przetwarzanie danych
  • Podziel zbiór danych: zestaw treningowy (80%), zestaw testowy (20%)
  • Użyj sieci neuronowej LSTM do zbudowania modelu
  • Zgodnie z wydajnością modelu na zestawie testowym, dostosuj hiperparametry, aby poprawić zdolność uogólniania modelu
  • Wykonaj tę samą akcję wstępnego przetwarzania danych na danych nieoznaczonych
  • Użyj wytrenowanego modelu przewidywania nastrojów, aby przewidzieć tendencję nastrojów w danych nieoznaczonych

Przeprowadzamy analizę nastrojów emoji i korzystamy z technologii uczenia głębokiego, aby trenować, aby uzyskać klasyfikator nastrojów tekstu emoji. Dla warstwy wyjściowej klasyfikatora wybieramy funkcję sigmoid do aktywacji i rzutujemy wyniki warstwy wyjściowej na przedział 0-1. Im tekst jest bliższy 0, tym bardziej jest negatywny, a im bliżej 1, tym bardziej jest pozytywny.

Wzór funkcji sigmoidalnej to: F(x)=1/(1+ex)

Używamy dużej próbki danych 50 milionów tweetów zawierających emoji jako korpus analizy, a następnie umieszczamy korpus, który ma zostać przeanalizowany, w wytrenowanym klasyfikatorze nastrojów w celu przewidywania nastrojów. Wreszcie, wyniki przewidywania nastrojów przez klasyfikator dzielą się na trzy typy: negatywne, neutralne i pozytywne. Kryteriami klasyfikacji są:

W każdym razie jest to trudne, ale nam się udało!!

Wykorzystanie i perspektywa analizy sentymentu Emoji

Analiza sentymentu znajduje szerokie zastosowanie w marketingu, reklamie, psychologii, medycynie i innych dziedzinach. Zdecydowaliśmy się przeprowadzić analizę sentymentu emoji, aby pomóc ludziom lepiej zrozumieć emoji w rzeczywistych interakcjach społecznościowych, skuteczniej wyeliminować niejednoznaczność i niezrozumienie emoji.

Na przykład, gdy rozmawiasz ze swoim przyjacielem (lub swoją sympatią) online, druga osoba może czasami wysyłać Ci emotikony, których nie do końca rozumiesz. W rzeczywistości jest wiele takich sytuacji, takich jak:

  • Co oznacza 🤒, jeśli ktoś odpowie na moje zdjęcie?
  • Co to znaczy, gdy dziewczyna wysyła do mnie 😊?
  • Jeśli moja sympatia przyśle mi ❤ , czy to dobry znak?

Jak wiemy, nie możesz określić dokładnego znaczenia emotikonów, jednak dzięki naszej analizie nastrojów możesz przeanalizować te emotikony psychologicznie, na przykład „wysłała mi 💞, to pozytywny znak, może powinienem ją zaprosić” lub „ dlaczego mój chłopak przysyła mi 😒? To trochę negatywne, czy jest na mnie zły?" , coś takiego. Uważam, że dzięki naszej analizie nastrojów emoji możesz głębiej zrozumieć emoji.


Podsumowując, zapłaciliśmy dużo za ten projekt analizy nastrojów emoji. Chociaż jest to trudne, nadal chcemy to pogłębiać. Obecnie analizujemy emotikony w różnych językach, uwzględniono również emocjonalny wpływ emotikonów na czysty tekst, a także rozważono kilka innych zaawansowanych badań. Wszystko po to, aby zbadać więcej zastosowań emoji i mieć nadzieję, że emoji są interesujące i pouczające.

Szukaj ostatnie Ostatnie Brak emotikonów ostatniego użycia emoji... Emojifikuj sukces