Emoji сповнені емоцій. Це може покращити або відрегулювати тон і настрій тексту, в той же час емоції, висловлені емодзі, можуть бути більш очевидними, ніж лише слова.

Наприклад цей смайлик 👿 (розлючене обличчя з рогами). Це очевидно у формі диявольського персонажа, тому, можливо, думки вважають це "поганим" смайликом, як деякі злі думки в голові когось.

Але все-таки такий опис є дуже абстрактним. Отже, чи можемо ми візуалізувати типи і рівні настроїв, виражені цими смайлами?


Відповідь - так, звичайно! Ми провели обробку природних мов (NLP) на загальнодоступних зразках розміром не менше 50 мільйонів твітів, і ми використовуємо Text Sentiment Analysis (також званий аналіз думки), щоб пов’язати настрої емодзі з набором значень і візуалізувати його. Ми витратили багато часу, енергії та обчислювальних потужностей, щоб зробити наш аналіз настроїв емодзі більш науковим та суворим, щоб кожен міг відчути шарм та краще зрозуміти емодзі.

Візуальні графіки для аналізу настроїв емодзі

Такі дані, як значення настрою емодзі, були розраховані відповідно до аналізу настрою тексту, який належить до статистики та теорії ймовірностей. Після того, як ми вирішили проблему алгоритму та обчислювальної потужності, тоді зіткнулися з новими труднощами: як змусити користувачів зрозуміти ці професійні дані?

Думка перетинає наш розум—— Гей! Як щодо того, щоб ми візуалізували значення емоцій смайлів за допомогою декількох крутих дизайнів!

💡: ми перетворили обчислені та проаналізовані дані (ліворуч) у діаграму, яка може бути краще зрозуміла користувачам (праворуч), яка може більш інтуїтивно показати емоційний поділ емодзі;

Тож дозвольте мені пояснити наступну діаграму, яка відображає результати аналізу схильності до смайлів у реальному спілкуванні.

💡: 2 типи діаграм для аналізу настроїв смайликів, тут ми аналізуємо лише діаграму вище.

Дуга півкола на зображенні розділена на три кольори, що представляють різні емоційні тенденції смайлів 👿 . Як бачимо, пропорції цих трьох емоцій складають приблизно 4: 1: 5, зелений та оранжевий мають подібні пропорції, а це означає, що цей смайлик є нейтральнішим (сюрприз !!).

  • Сірий курсор - це рівень довіри , статистичне поняття. Його положення та ширина вказують: Expected Value ± Confidence .
  • Очікуване значення : Це середньозважене значення дисперсійних випадкових величин значення емоції, яке використовується для вираження ймовірності, c ∈ [−1, 0, +1] .
  • Довіра : Це набір параметрів розподілу значення настрою емодзі, показує розумний діапазон помилок у вигляді позитивного та негативного інтервалу. І чим більше кількість зразків корпусу, тим менша похибка.

Простіше кажучи, чим ближче курсор ліворуч, тим емоційність цього емодзі стає більш негативною. Навпаки, чим ближче курсор праворуч, тим позитивніші емоції виражаються цим смайликом. І чим вужчий курсор, тим судження про емоції є точнішим.


Тепер ви можете зрозуміти нашу діаграму аналізу настроїв емодзі?

Що таке аналіз настрою?

Я вважаю, що ви зрозуміли таблицю даних аналізу настроїв емодзі, тож давайте поговоримо про те, що таке аналіз настрою.

Аналіз настрою також називають аналізом думок. Технічно кажучи, аналіз настроїв є частиною дослідження природних мов (NLP). Методи аналізу настроїв поділяються на два типи: машинне навчання та методи на основі словника . Але з розвитком технології глибокого навчання використання цієї технології для аналізу настроїв стало основним.

Процес аналізу настрою включає попередню обробку даних, розробку функцій та навчання моделям. Взагалі кажучи, етап попередньої обробки даних в основному ділить текст на слова та усуває слова зупинки та пунктуацію. Однак наш аналіз настрою зберігає розділові знаки та слова зупинки. На етапі проектування функцій ми обрали представлення вбудовування слова (Word2Vec), запропоноване командою Google у 2013 році, яке поділяється на модель CBOW (безперервний мішок слів) та модель Skip-gram . Результати моделі такі:

💡: Зліва - модель CBOW, праворуч - модель Skip-gram

CBOW базується на контексті, щоб передбачити цільове слово, яке потрібно навчити отримувати вектор слова. Як показано на малюнку, W (t) передбачається на основі чотирьох слів W(t-2), W(t-1), W(t+1), W(t+2) ; А скіп-грам - це передбачити оточуючі слова відповідно до цільового слова, щоб навчитись отримувати вектор слова. Як показано на малюнку, це передбачити W(t-2),W(t-1),W(t+1),W(t+2) відповідно до W (t) .

На етапі прогнозування моделі ми ділимо дані на дві частини: Навчальний набір, розділений у співвідношенні 5: 1, і набір тестів та навчальний набір обробляються не в порядку.

Застосування аналізу настроїв у смайликах

Аналіз настрою - це комплексний метод аналізу, який поєднує глибоке навчання та статистику. Ми отримали значення емоцій емоцій після складного аналізу та розрахунку масивів даних, і повний процес аналізу настрою емодзі такий:

Процес аналізу настрою емодзі

  • Позначте корпус соціальних мереж
  • Попередня обробка даних
  • Розділіть набір даних: Набір тренувань (80%), Набір тестування (20%)
  • Використовуйте нейронну мережу LSTM для побудови моделі
  • Відповідно до продуктивності моделі на тестовому наборі відрегулюйте гіперпараметри, щоб поліпшити узагальнюючу здатність моделі
  • Виконайте однакову дію попередньої обробки даних для немічених даних
  • Використовуйте навчену модель прогнозування настрою, щоб передбачити тенденцію настрою на немаркованих даних

Ми проводимо аналіз настроїв на смайликах і використовуємо технологію глибокого навчання, щоб навчитися отримувати класифікатор настрою тексту емодзі. Для вихідного рівня класифікатора ми вибираємо функцію сигмоїда для активації та проектуємо результати вихідного рівня в інтервал 0-1. Чим ближче текст до 0, тим більше він негативний, і чим ближчий до 1, тим позитивніший.

Формула сигмоїдної функції: F(x)=1/(1+ex)

Ми використовуємо велику вибірку даних із 50 мільйонів твітів, що містять смайлики, як аналітичний корпус, а потім додаємо, що корпус повинен бути проаналізований у навчений класифікатор настроїв для прогнозування настрою. Нарешті, результати прогнозування настроїв класифікатором поділяються на три типи: негативні, нейтральні та позитивні. Критеріями класифікації є:

У всякому разі, це складно, але ми це зробили !!

Використання та перспективи аналізу настроїв емодзі

Аналіз настрою широко використовується в маркетингу, рекламі, психології, медицині та інших сферах. Ми вирішили зробити аналіз настрою емодзі, щоб допомогти людям глибше зрозуміти емодзі в реальній соціальній взаємодії, усунути двозначність та нерозуміння емодзі більш ефективно.

Наприклад, коли ви спілкуєтеся в чаті зі своїм другом (або вашим влюбленням) в Інтернеті, інша людина може іноді надсилати вам смайли, які ви не зовсім розумієте. Насправді існує багато подібних ситуацій, таких як:

  • Що означає if, якщо хтось відповідає на моє фото?
  • Що означає, коли дівчина посилає мені 😊?
  • Якщо моє придушення посилає мене , це хороший знак?

Як ми знаємо, ви не можете сказати точне значення смайликів, однак, за допомогою нашого аналізу настроїв, ви можете проаналізувати ці смайлики психологічно, наприклад, "вона прислала мені 💞, це позитивний знак, можливо, я повинен запросити її" або " чому мій хлопець посилає мені a? Це негативно, він злий на мене? " , щось на зразок цього. За допомогою нашого аналізу настроїв емодзі я вважаю, що ви можете глибше зрозуміти смайли.


Загалом, ми багато заплатили за цей проект аналізу настроїв емодзі. Хоча це важко, ми все одно хочемо зробити це глибшим. Зараз ми аналізуємо смайлики різними мовами, ефект емоційного посилення смайликів на чистий текст, а також було розглянуто кілька інших вдосконалених досліджень. Все це для вивчення більш широкого використання смайлів, і сподіваємось, ви знайдете, що смайли є цікавими та інформативними.

Пошук недавні Останні Смайли нещодавно не використовувалися Emojify... Emojify Успіх