Емоџији су пуни емоција. Може да побољша или прилагоди тон и расположење текста, а истовремено емоције које изражавају емоји могу бити очигледније од речи.

На пример овај емоји ји (бесно лице са роговима). Очигледно је у облику ђаволског лика, па можда постоје мисли за које се сматра да је то „лош“ емоџи, попут неких злих мисли у нечијој глави.

Али ипак, овакав опис је врло апстрактан. Стога, можемо ли да визуализујемо типове осећања и нивое изражене овим емојијима?


Одговор је "Да", наравно! Извели смо обраду природног језика (НЛП) на јавним узорцима од не мање од 50 милиона твитова, а анализу расположења текста (која се назива и рударење мишљењима) користимо за повезивање расположења емоџија са низом вредности и његову визуализацију. Потрошили смо пуно времена, енергије и рачунарске снаге како бисмо нашу анализу расположења емојија учинили научнијом и ригорознијом, тако да сви могу осетити шарм и боље разумети емоји сличице.

Визуелне табеле за анализу расположења емоџија

Подаци као што је вредност расположења емоџија израчунати су према анализи расположења текста, која припада статистици и теорији вероватноће. Након што смо решили проблем алгоритма и рачунарске снаге, тада смо наишли на нове потешкоће: како натерати кориснике да разумеју ове професионалне податке?

Помишља нам мисао --— Хеј! Шта кажете на то да визуализујемо вредности расположења за емоји сличице са неким сјајним дизајном!

💡: Израчунате и анализиране податке (лево) претворили смо у графикон који корисници могу боље разумети (десно), а који интуитивније може показати емоционалну поделу емоји-ја;

Дакле, дозволите ми да објасним следећу табелу која приказује резултате анализе тенденција емотикона у стварној комуникацији.

💡: 2 врсте графикона за анализу емотикона 👿, овде анализирамо само горњи графикон.

Полукружни лук на слици подељен је у три боје, представљајући различите емоционалне тенденције емоџија 👿 . Као што видимо, пропорције ове три емоције су око 4: 1: 5, зелена и наранџаста имају сличне пропорције, што значи да је овај емоји више неутралан (изненађење !!).

  • Сиви курсор је ниво поверења , статистички концепт. Његов положај и ширина указују на: Expected Value ± Confidence .
  • Очекивана вредност : То је пондерисани просек дисперзивних случајних променљивих вредности расположења емоџија, који се користи за изражавање вероватноће, c ∈ [−1, 0, +1] .
  • Поуздање : То је скуп параметара дистрибуције вредности расположења за емоји, показује разуман опсег грешака у облику позитивног и негативног интервала. И што је већи број узорака корпуса, то је мања грешка.

Једноставно речено, што је курсор ближи левој страни, осећај овог емојија је негативнији. Напротив, што је курсор ближи десној страни, тим емотиконима се изражавају позитивније емоције. А што је курсор ужи, процена осећања је тачнија.


Сада, можете ли да разумете нашу табелу анализе расположења емоји сличица?

Шта је анализа расположења?

Верујем да сте разумели табелу података анализе расположења емоји-ја, па хајде да разговарамо о томе шта је анализа расположења.

Анализа расположења такође се назива рударење мишљењима. Технички гледано, анализа сентимента је део истраживања обраде природног језика (НЛП). Методе анализе сентимента су подељене у две врсте: машинско учење и методе засноване на речнику . Али са развојем технологије дубоког учења, употреба ове технологије за анализу расположења постала је главни ток.

Процес анализе сентимента укључује претпрераду података, инжењеринг карактеристика и обуку модела. Уопштено говорећи, фаза предобраде података углавном дели текст на речи и уклања зауставне речи и интерпункцију. Међутим, наша анализа сентимента задржава интерпункцијске знакове и зауставне речи. У фази инжењеринга карактеристика изабрали смо представу за уграђивање речи (Ворд2Вец) коју је Гооглеов тим предложио 2013. године, а која је подељена на модел ЦБОВ (непрекидна врећа речи) и модел Скип-грам . Резултати модела су следећи:

💡: Лево је модел ЦБОВ, десно модел Скип-грам

ЦБОВ је заснован на контексту за предвиђање циљне речи која ће се обучити за добијање вектора речи. Као што је приказано на слици, В (т) се предвиђа на основу четири речи W(t-2), W(t-1), W(t+1), W(t+2) ; А скип-грам је предвиђање околних речи према циљаној речи која ће се обучити за добијање вектора речи. Као што је приказано на слици је предвиђање W(t-2),W(t-1),W(t+1),W(t+2) према В (т) .

У фази предвиђања модела податке делимо на два дела: Сет тренинга подељен у омјеру 5: 1 и тест сет и сет тренинга обрађују се без реда.

Примена анализе сентимента у емоџијима

Анализа расположења је свеобухватна метода анализе која комбинује дубоко учење и статистику. Вредност емоји емотикона добили смо након сложене анализе и израчунавања хрпа података, а комплетан поступак анализе сентимента емоји је следећи:

Процес анализе емоционалног расположења

  • Означите корпус друштвених мрежа
  • Предобрада података
  • Подијелите скуп података: Сет за обуку (80%), Сет за тестирање (20%)
  • Користите ЛСТМ неуронску мрежу за изградњу модела
  • Према перформансама модела на тест скупу, подесите хиперпараметре да бисте побољшали способност генерализације модела
  • Извршите исту радњу обраде података на необележеним подацима
  • Користите обучени модел предвиђања сентимента да бисте предвидели тенденцију сентимента на необележеним подацима

Вршимо анализу расположења на емоџијима и користимо технологију дубоког учења да бисмо обучили како бисмо добили класификатор расположења за текст емојија. За излазни слој класификатора бирамо сигмоидну функцију за активирање и пројектујемо резултате излазног слоја у интервал од 0-1. Што је текст ближи 0, то је негативнији, а ближи 1, то је позитивнији.

Формула сигмоидне функције је: F(x)=1/(1+ex)

Користимо велики узорак података од 50 милиона твитова који садрже емоџије као корпус за анализу, а затим ставимо да корпус треба да се анализира у обучени класификатор расположења за предвиђање осећања. Коначно, резултати предвиђања осећања од стране класификатора су подељени у три врсте: негативни, неутрални и позитивни. Критеријуми за класификацију су:

У сваком случају, тешко је, али успели смо !!

Употреба и перспектива анализе емоционалних осећања

Анализа расположења се широко користи у маркетингу, оглашавању, психологији, медицини и другим областима. Одлучили смо да направимо анализу расположења емоји-ја како бисмо помогли људима да дубље разумеју емоји-емоције у стварној друштвеној интеракцији, ефикасније елиминишу двосмисленост и неразумевање емоји-ја.

На пример, када ћаскате са пријатељем (или симпатијом) на мрежи, друга особа вам понекад може послати емоџије које не разумете сасвим. Заправо, постоји много оваквих ситуација, као што су:

  • Шта 🤒 значи да неко одговори на моје слике?
  • Шта значи кад ми девојка пошаље 😊 ?
  • Ако ме моја симпатија пошаље , да ли је то добар знак?

Као што знамо, не можете да кажете тачно значење емоџија, међутим, кроз нашу анализу расположења, можете их психолошки анализирати, на пример „послала ми је 💞, то је позитиван знак, можда бих требало да је позовем да изађе“ или „ зашто ми дечко шаље 😒? То је некако негативно, да ли се љути на мене? " , овако нешто. Уз нашу анализу расположења емоџија верујем да можете дубље да разумете емоџије.


Све у свему, платили смо пуно за овај пројекат анализе расположења емојија. Иако је тешко, ипак желимо да то учинимо дубљим. Сада анализирамо емоџије на различитим језицима, ефекат емоционалног добитка емоџија на чисти текст, а узето је у обзир и неколико других напредних студија. Све ово треба да истражи више употребе емоџија и надамо се да ће вам емоји бити занимљиви и информативни.

Претрага недавни Недавно Нема недавне употребе емоџија Емојифи... Емојифи успех