Эмодзи полны эмоций. Он может улучшить или отрегулировать тон и настроение текста, в то же время эмоции, выражаемые смайликами, могут быть более очевидными, чем только слова.

Например, этот смайлик 👿 (сердитое лицо с рогами). Очевидно, он имеет форму персонажа-дьявола, поэтому могут возникать мысли, которые считают, что это «плохой» смайлик, например, какие-то злые мысли в чьей-то голове.

Но все же такое описание очень абстрактное. Следовательно, можем ли мы визуализировать типы и уровни настроений, выражаемые этими смайликами?


Конечно же, да! Мы выполнили обработку естественного языка (NLP) на общедоступных образцах не менее чем 50 миллионов твитов, и мы используем анализ тональности текста (также называемый интеллектуальным анализом мнений), чтобы связать настроение смайлика с набором значений и визуализировать его. Мы потратили много времени, энергии и вычислительных мощностей, чтобы сделать наш анализ настроений смайликов более научным и строгим, чтобы каждый мог почувствовать очарование и лучше понять смайлики.

Визуальные диаграммы для анализа настроений смайликов

Такие данные, как значение настроения эмодзи, были рассчитаны в соответствии с анализом тональности текста, который относится к статистике и теории вероятностей. После того, как мы решили проблему алгоритмов и вычислительной мощности, возникли новые трудности: как заставить пользователей понимать эти профессиональные данные?

Мысль приходит в голову ... Эй! Как насчет того, чтобы визуализировать ценности эмоций с помощью классных дизайнов!

💡: мы преобразовали рассчитанные и проанализированные данные (слева) в диаграмму, которая может быть лучше понятна пользователям (справа), которая может более интуитивно отображать эмоциональное разделение эмодзи;

Итак, позвольте мне объяснить следующую диаграмму, которая отображает результаты анализа тенденций настроений смайликов в реальном общении.

💡: 2 типа диаграмм для анализа настроений смайликов 👿, здесь мы анализируем только диаграмму выше.

Полукруглая дуга на картинке разделена на три цвета, отражающие различные эмоциональные тенденции смайликов 👿 . Как мы видим, пропорции этих трех эмоций примерно 4: 1: 5, зеленый и оранжевый имеют аналогичные пропорции, что означает, что этот смайлик более нейтральный (сюрприз !!).

  • Серый курсор - это статистическая концепция уровня уверенности. Его положение и ширина указывают: Expected Value ± Confidence .
  • Ожидаемое значение : это средневзвешенное значение дисперсионных случайных величин значения настроения эмодзи, используемое для выражения вероятности, c ∈ [−1, 0, +1] .
  • Уверенность : это набор параметров распределения значений настроения эмодзи, показывающий разумный диапазон ошибок в виде положительного и отрицательного интервала. И чем больше количество выборок корпуса, тем меньше ошибка.

Проще говоря, чем ближе курсор к левому краю, тем эмоции у этого эмодзи более негативные. Напротив, чем ближе курсор к правому краю, тем больше положительных эмоций выражает этот смайлик. И чем уже курсор, тем точнее оценка эмоции.


Теперь вы понимаете нашу диаграмму анализа настроений смайликов?

Что такое анализ настроений?

Я считаю, что вы поняли диаграмму данных анализа настроений смайликов, поэтому давайте поговорим о том, что такое анализ настроений.

Анализ настроений также называется интеллектуальным анализом мнений. С технической точки зрения, анализ тональности является частью исследования обработки естественного языка (НЛП). Методы анализа тональности делятся на два типа: машинное обучение и методы на основе словаря . Но с развитием технологии глубокого обучения использование этой технологии для анализа настроений стало основным направлением.

Процесс анализа настроений включает в себя предварительную обработку данных, разработку функций и обучение модели. Вообще говоря, этап предварительной обработки данных в основном делит текст на слова и удаляет стоп-слова и знаки препинания. Однако наш анализ тональности сохраняет знаки препинания и стоп-слова. На этапе разработки функций мы выбрали представление встраивания слов (Word2Vec), предложенное командой Google в 2013 году, которое разделено на модель CBOW (непрерывный мешок слов) и модель Skip-gram . Результаты модели следующие:

💡 : Слева - модель CBOW, справа - модель Skip-gram

CBOW основан на контексте, чтобы предсказать целевое слово, которое нужно обучить для получения вектора слова. Как показано на рисунке, W (t) предсказывается на основе четырех слов W(t-2), W(t-1), W(t+1), W(t+2) ; А скип-грамма - это предсказание окружающих слов в соответствии с целевым словом, которое нужно обучить для получения вектора слова. Как показано на рисунке, это прогнозирование W(t-2),W(t-1),W(t+1),W(t+2) согласно W (t) .

На этапе прогнозирования модели мы разделяем данные на две части: обучающий набор, разделенный в соотношении 5: 1, и тестовый набор, и обучающий набор обрабатываются не по порядку.

Применение анализа настроений в смайликах

Анализ настроений - это комплексный метод анализа, сочетающий глубокое обучение и статистику. Мы получили значение настроения смайликов после комплексного анализа и расчета массива данных, и полный процесс анализа настроения смайликов выглядит следующим образом:

Процесс анализа настроений эмодзи

  • Пометить корпус социальных сетей
  • Предварительная обработка данных
  • Разделите набор данных: обучающий набор (80%), тестовый набор (20%)
  • Используйте нейронную сеть LSTM для построения модели
  • В соответствии с характеристиками модели на тестовом наборе отрегулируйте гиперпараметры, чтобы улучшить способность модели к обобщению.
  • Выполните то же действие предварительной обработки данных для немаркированных данных
  • Используйте обученную модель прогнозирования настроений, чтобы предсказать тенденцию настроений для немаркированных данных.

Мы проводим анализ тональности смайликов и используем технологию глубокого обучения, чтобы научиться получать классификатор тональности текста смайликов. Для выходного слоя классификатора мы выбираем сигмовидную функцию для активации и проецируем результаты выходного слоя в интервал 0-1. Чем ближе текст к 0, тем он отрицательнее и чем ближе к 1, тем более положительным.

Формула сигмовидной функции: F(x)=1/(1+ex)

Мы используем большую выборку данных из 50 миллионов твитов, содержащих эмодзи, в качестве корпуса анализа, а затем помещаем корпус, который необходимо проанализировать, в обученный классификатор настроений для прогнозирования настроений. Наконец, результаты прогнозирования настроений классификатором делятся на три типа: отрицательные, нейтральные и положительные. Критерии классификации:

В любом случае, это сложно, но мы справились !!

Использование и перспективы анализа настроений по эмодзи

Анализ настроений широко используется в маркетинге, рекламе, психологии, медицине и других областях. Мы решили провести анализ настроений смайликов, чтобы помочь людям глубже понять смайлы в реальном социальном взаимодействии, более эффективно устранить двусмысленность и непонимание смайликов.

Например, когда вы болтаете со своим другом (или любимым человеком) в Интернете, другой человек может иногда отправлять вам смайлики, которые вы не совсем понимаете. На самом деле таких ситуаций много, например:

  • Что означает 🤒, если кто-то отвечает на мою фотографию?
  • Что значит, когда девушка отправляет мне 😊?
  • Если моя любовь пришлет мне , это хороший знак?

Как мы знаем, вы не можете определить точное значение смайлика, однако с помощью нашего сентиментального анализа вы можете проанализировать эти смайлики психологически, например: «Она прислала мне, это положительный знак, может, мне стоит пригласить ее на свидание» или « почему мой парень посылает мне? Это вроде негатива, он зол на меня? " , что-то вроде этого. Я считаю, что с помощью нашего анализа настроений к эмодзи вы сможете глубже понять эмодзи.


В общем, мы очень много заплатили за этот проект по анализу настроений смайликов. Несмотря на то, что это сложно, мы все же хотим сделать это глубже. Сейчас мы анализируем эмодзи на разных языках, влияние эмодзи на эмоциональный эффект в чистом тексте, а также были рассмотрены несколько других продвинутых исследований. Все это сделано для того, чтобы изучить более широкое использование смайликов и надеяться, что вы найдете смайлы интересными и информативными.

Поиск Недавние Недавние Нет недавно использованных смайликов смайлики... Эмодзи успеха