Emoji са пълни с емоции. Той може да подобри или коригира тона и настроението на текста, като същевременно емоциите, изразени от емотикони, могат да бъдат по-очевидни от думите.

Например това емоджи 👿 (ядосано лице с рога). Очевидно е под формата на дяволски характер, така че може би има мисли, които се считат за „лоши“ емоджи, като някои зли мисли в нечия глава.

Но все пак този вид описание е много абстрактно. Следователно, можем ли да визуализираме типовете и нивата на настроения, изразени от тези емоджи?


Отговорът е "Да", разбира се! Извършихме обработка на естествен език (NLP) на публични извадки с не по-малко от 50 милиона туитове и използваме Text Sentiment Analysis (наричан още извличане на мнение), за да свържем настроението на емоджи с набор от стойности и да го визуализираме. Прекарахме много време, енергия и изчислителна мощ, за да направим нашия анализ на настроенията на емоджи по-научен и строг, така че всеки да може да усети очарованието и да получи по-добро разбиране за емоджи.

Визуални диаграми за анализ на настроението на емоджи

Данни като стойността на настроението на емоджи са изчислени съгласно анализ на настроението на текста, който принадлежи към статистиката и теорията на вероятностите. След като решихме проблема с алгоритъма и изчислителната мощ, срещнахме нови трудности: как да накараме потребителите да разберат тези професионални данни?

Една мисъл ни пресича ума - - Хей! Какво ще кажете да визуализираме стойностите на емотиконите с някои страхотни дизайни!

💡: Преобразувахме изчислените и анализирани данни (вляво) в диаграма, която може да бъде по-добре разбрана от потребителите (вдясно), която може по-интуитивно да покаже емоционалното разделение на емоджи;

Така че позволете ми да обясня следната диаграма, която изобразява резултатите от анализа на тенденцията за настроение на емоджи в реалната комуникация.

💡: 2 вида диаграми за анализ на емоциите 👿, тук анализираме само графиката по-горе.

Полукръговата дъга на картината е разделена на три цвята, представляващи различни емоционални тенденции на емоджи 👿 . Както виждаме, пропорциите на тези три емоции са около 4: 1: 5, зеленото и оранжевото имат подобни пропорции, което означава, че това емоджи е по-неутрално (изненада !!).

  • Сивият курсор е Нивото на доверие, статистическа концепция. Неговото положение и ширина показват: Expected Value ± Confidence .
  • Очаквана стойност : Това е претеглената средна стойност на дисперсионните случайни променливи на стойността на настроението на емоджи, използвана за изразяване на вероятност, c ∈ [−1, 0, +1] .
  • Увереност : Това е наборът от параметри на разпределението на стойността на емотиконите, показва разумен диапазон на грешки под формата на положителен и отрицателен интервал. И колкото по-голям е броят на корпусните проби, толкова по-малка е грешката.

Просто казано, колкото по-близо е курсорът вляво, толкова по-негативна е емоцията на това емоджи. Напротив, колкото по-близо е курсорът вдясно, толкова по-положителна емоция се изразява от това емоджи. И колкото по-тесен е курсорът, толкова по-точна е преценката на емоцията.


Сега, можете ли да разберете нашата диаграма за анализ на настроенията на емоджи?

Какво е анализ на настроението?

Вярвам, че сте разбрали таблицата с данни за анализ на настроението на емоджи, така че нека поговорим за това какво е анализ на настроението.

Анализът на настроението се нарича още копаене на мнение. Технически погледнато, анализът на настроенията е част от изследванията на естествения език (NLP). Методите за анализ на настроението са разделени на два вида: машинно обучение и методи, базирани на речник . Но с развитието на технологията за дълбоко обучение, използването на тази технология за анализ на настроенията се превърна в основен поток.

Процесът на анализ на настроенията включва предварителна обработка на данни, инженеринг на функции и обучение на модели. Най-общо казано, етапът на предварителна обработка на данните главно разделя текста на думи и премахва стоп думите и пунктуацията. Нашият анализ на настроенията обаче запазва пунктуационни знаци и стоп думи. На етапа на проектиране на функции избрахме представяне на вграждането на думи (Word2Vec), предложено от екипа на Google през 2013 г., което е разделено на модела CBOW (непрекъсната торба с думи) и модела Skip-gram . Резултатите от модела са както следва:

💡: Отляво е моделът CBOW, отдясно е моделът Skip-gram

CBOW се основава на контекста, за да предскаже целевата дума, която да се обучи за получаване на думата вектор. Както е показано на фигурата, W (t) се прогнозира въз основа на четири думи W(t-2), W(t-1), W(t+1), W(t+2) ; И skip-gram е да се предскажат околните думи според целевата дума, която да се тренира, за да се получи думата вектор. Както е показано на фигурата е да се предскаже W(t-2),W(t-1),W(t+1),W(t+2) според W (t) .

В етапа на прогнозиране на модела, ние разделяме данните на две части: Комплектът за обучение, разделен в съотношение 5: 1 и тестовият комплект и учебният комплект се обработват извън ред.

Прилагане на анализ на настроението в емотикони

Анализът на настроението е изчерпателен метод за анализ, който съчетава задълбочено обучение и статистика. Получихме стойността на настроението на емотикони след сложен анализ и изчисляване на потоци от данни, а пълният процес на анализ на настроението на емоджи беше, както следва:

Процесът на анализ на настроението на емоджи

  • Етикет на корпуса за социални мрежи
  • Предварителна обработка на данни
  • Разделете набора от данни: Комплект за обучение (80%), Комплект за тестване (20%)
  • Използвайте невронна мрежа LSTM, за да изградите модел
  • Според производителността на модела на тестовия набор, коригирайте хиперпараметрите, за да подобрите обобщаващата способност на модела
  • Извършете същото действие за предварителна обработка на данни върху немаркирани данни
  • Използвайте обучения модел за прогнозиране на настроението, за да предскажете тенденцията на настроението върху немаркирани данни

Извършваме анализ на настроенията на емоджи и използваме технология за дълбоко обучение, за да тренираме, за да получим класификатор на настроенията за текст на емотикони. За изходния слой на класификатора избираме сигмоидната функция, която да се активира, и проектираме резултатите от изходния слой в интервала от 0-1. Колкото по-близо е текстът до 0, толкова по-отрицателен е и колкото по-близо е до 1, толкова по-положителен е.

Формулата на сигмоидната функция е: F(x)=1/(1+ex)

Използваме голяма извадка от 50 милиона туитове, съдържащи емотикони като корпус за анализ, след което поставяме корпуса да бъде анализиран в обучения класификатор на настроенията за прогнозиране на настроението. И накрая, резултатите от прогнозирането на настроението от класификатора се разделят на три вида: отрицателни, неутрални и положителни. Критериите за класификация са:

Както и да е, трудно е, но го направихме !!

Използването и перспективите за анализ на настроението на емоджи

Анализът на настроението се използва широко в маркетинга, рекламата, психологията, медицината и други области. Решихме да направим анализ на настроението на емоджи, за да помогнем на хората да разберат по-дълбоко емотиконите в действителното социално взаимодействие, да премахнат по-ефективно неяснотата и неразбирането на емоджи.

Например, когато разговаряте с приятеля си (или влюбеността си) онлайн, другият човек понякога може да ви изпрати емотикони, които не разбирате напълно. Всъщност има много ситуации като тази, като например:

  • Какво означава 🤒 , ако някой отговори на моята снимка?
  • Какво означава, когато едно момиче ми изпрати 😊 ?
  • Ако моята смачканост ме изпрати , това добър знак ли е?

Както знаем, не можете да кажете точното значение на емоджи, но чрез нашия анализ на настроенията можете да анализирате тези емоджи психологически, като „тя ми изпрати 💞, това е положителен знак, може би трябва да я поканя да излезе“ или „ защо приятелят ми ми изпраща 😒? Това е нещо негативно, ядосан ли ми е? " , нещо като това. С нашия анализ на настроението на емоджи вярвам, че можете да разберете емоджи по-дълбоко.


Като цяло сме платили много за този проект за анализ на настроенията на емоджи. Въпреки че е трудно, все пак искаме да го направим по-дълбоко. Сега анализираме емоджи на различни езици, ефекта на емоционалната печалба на емоджи върху чист текст и няколко други напреднали проучвания също са разгледани. Всичко това е да се изследва повече използването на емотикони и се надявам, че емоджитата са интересни и информативни.

Търси скорошни Скорошни Няма скорошно използване на емотикони Emojify... Emojify успех