이모티콘은 감정으로 가득 차 있습니다. 텍스트의 톤과 분위기를 향상 시키거나 조정할 수 있으며 동시에 이모티콘으로 표현되는 감정이 단어만으로 표현되는 것보다 더 분명 할 수 있습니다.

예를 들어이 이모티콘 👿 (뿔이있는 화난 얼굴). 분명히 악마 캐릭터의 형태이기 때문에 누군가의 머릿속에있는 악한 생각처럼 "나쁜"이모 지로 간주되는 생각이있을 수 있습니다.

그러나 여전히 이러한 종류의 설명은 매우 추상적입니다. 따라서 이러한 이모티콘이 표현하는 감정 유형과 수준을 시각화 할 수 있습니까?


물론 대답은 "예"입니다! 우리는 5 천만 개 이상의 트윗의 공개 샘플에 대해 자연어 처리 (NLP) 를 수행했으며, 텍스트 감정 분석 (오피니언 마이닝이라고도 함)을 사용하여 이모 지 감정을 일련의 값과 연결하고 시각화합니다. 우리는 이모티콘 감정 분석을보다 과학적이고 엄격하게 만들기 위해 많은 시간, 에너지 및 컴퓨팅 성능을 사용하여 모든 사람이 매력을 느끼고 이모티콘을 더 잘 이해할 수 있도록했습니다.

이모티콘 감정 분석을위한 시각적 차트

이모티콘 감정 값과 같은 데이터는 통계 및 확률 이론에 속하는 텍스트 감정 분석에 따라 계산되었습니다. 알고리즘과 컴퓨팅 성능 문제를 해결 한 후 새로운 어려움에 직면했습니다. 사용자가 이러한 전문적인 데이터를 이해하도록 만드는 방법은 무엇입니까?

생각이 우리 마음을 가로 지른다 —— 헤이! 멋진 디자인으로 이모티콘 감정 값을 시각화하는 것은 어떻습니까!

💡 : 계산 및 분석 된 데이터 (왼쪽)를 사용자가 더 잘 이해할 수있는 차트 (오른쪽)로 변환하여 이모티콘의 감정적 구분을보다 직관적으로 보여줄 수 있습니다.

그래서 실제 커뮤니케이션에서 이모티콘의 감정 성향 분석 결과를 보여주는 다음 차트를 설명하겠습니다.

💡 : 이모티콘 👿의 감정 분석을위한 2 가지 유형의 차트, 여기서는 위의 차트 만 분석합니다.

그림 속의 반원 호는 세 가지 색상으로 구분되어 이모티콘의 다양한 감정적 성향을 나타냅니다 👿 . 보시다시피이 세 가지 감정의 비율은 약 4 : 1 : 5이고, 녹색과 주황색은 비슷한 비율로이 이모티콘이 더 중립적이라는 것을 의미합니다 (놀랍습니다 !!).

  • 회색 커서는 통계 개념 인 Confidence Level입니다. 위치와 너비는 Expected Value ± Confidence 나타냅니다.
  • 기대 값 : 이모 지 감정 값의 분산 형 랜덤 변수의 가중 평균으로 확률을 표현하는데 사용됩니다. c ∈ [−1, 0, +1] .
  • Confidence : 이모 지 감정 값 분포의 매개 변수 집합으로 긍정 및 부정적 간격의 형태로 합리적인 오차 범위를 보여줍니다. 말뭉치 샘플 수가 많을수록 오류가 작아집니다.

간단히 말해서 커서가 왼쪽에 가까울수록이 이모티콘의 감정은 더 부정적입니다. 반대로 커서가 오른쪽에 가까울수록이 이모티콘이 더 긍정적 인 감정을 표현합니다. 그리고 커서가 좁을수록 감정의 판단이 더 정확합니다.


이제 이모 지 감정 분석 차트를 이해할 수 있습니까?

감정 분석이란 무엇입니까?

이모 지 감정 분석의 데이터 차트를 이해했다고 생각하므로 감정 분석이 무엇인지 이야기합시다.

감정 분석은 오피니언 마이닝이라고도합니다. 기술적으로 말하면 감정 분석은 자연어 처리 (NLP) 연구의 일부입니다. 감정 분석 방법은 기계 학습사전 기반 방법의 두 가지 유형으로 나뉩니다. 그러나 딥 러닝 기술의 발전으로이 기술을 감정 분석에 사용하는 것이 주류가되었습니다.

감정 분석 프로세스에는 데이터 전처리, 기능 엔지니어링 및 모델 학습이 포함됩니다. 일반적으로 데이터 전처리 단계는 주로 텍스트를 단어로 나누고 불용어와 구두점을 제거합니다. 그러나 감정 분석은 구두점과 불용어를 유지합니다. 기능 엔지니어링 단계에서는 2013 년 Google 팀에서 제안한 단어 임베딩 표현 (Word2Vec)을 선택했는데, 이는 CBOW (continuous bag of words) 모델과 Skip-gram 모델로 나뉩니다. 모델 결과는 다음과 같습니다.

💡 : 왼쪽은 CBOW 모델, 오른쪽은 Skip-gram 모델

CBOW는 단어 벡터를 얻기 위해 훈련 할 대상 단어를 예측하는 컨텍스트를 기반으로합니다. 그림에서 보듯이 W (t) W(t-2), W(t-1), W(t+1), W(t+2) 네 단어를 기반으로 예측됩니다. 그리고 skip-gram은 단어 벡터를 얻기 위해 훈련 할 대상 단어에 따라 주변 단어를 예측하는 것입니다. 도면에 도시 된 바와 같이, 예측하는 W(t-2),W(t-1),W(t+1),W(t+2) W (t)에 따라.

모델 예측 단계에서는 데이터를 두 부분으로 나눕니다. 훈련 세트는 5 : 1의 비율로 나누고 테스트 세트와 훈련 세트는 순서에 상관없이 처리됩니다.

이모티콘에 감정 분석 적용

감정 분석은 딥 러닝과 통계를 결합한 포괄적 인 분석 방법입니다. 복잡한 데이터 분석과 계산을 통해 이모 지의 감성 가치를 얻었으며 전체 이모 지 감성 분석 프로세스는 다음과 같습니다.

이모티콘 감정 분석 과정

  • 소셜 네트워킹 말뭉치 레이블 지정
  • 데이터 전처리
  • 데이터 셋 분할 : Training Set (80 %), Testing Set (20 %)
  • LSTM 신경망을 사용하여 모델 구축
  • 테스트 세트의 모델 성능에 따라 하이퍼 파라미터를 조정하여 모델의 일반화 기능을 향상시킵니다.
  • 레이블이 지정되지 않은 데이터에 대해 동일한 데이터 사전 처리 작업을 수행합니다.
  • 훈련 된 감정 예측 모델을 사용하여 레이블이 지정되지 않은 데이터에 대한 감정 경향을 예측합니다.

이모티콘에 대한 감정 분석을 수행하고 딥 러닝 기술을 사용하여 이모티콘 텍스트 감정 분류기를 얻기 위해 훈련합니다. 분류기의 출력 계층에 대해 활성화 할 시그 모이 드 함수를 선택하고 출력 계층 결과를 0-1의 간격으로 투영합니다. 텍스트가 0에 가까울수록 더 부정적이며 1에 가까울수록 더 긍정적입니다.

시그 모이 드 함수 공식은 다음과 같습니다. F(x)=1/(1+ex)

분석 말뭉치로 이모티콘이 포함 된 5 천만 트윗의 대규모 샘플 데이터를 사용한 다음 감정 예측을 위해 훈련 된 감정 분류기에 분석해야하는 말뭉치를 넣습니다. 마지막으로 분류 자에 의한 감정 예측 결과는 부정적, 중립적, 긍정적 인 세 가지 유형으로 나뉩니다. 분류 기준은 다음과 같습니다.

어쨌든 어렵지만 우리가 해냈다 !!

Emoji Sentiment Analysis의 사용 및 전망

감정 분석은 마케팅, 광고, 심리학, 의료 및 기타 분야에서 널리 사용됩니다. 이모 지 감정 분석은 사람들이 실제 사회적 상호 작용에서 이모지를 더 깊이 이해하고 이모 지의 모호함과 오해를보다 효과적으로 제거하는 데 도움이되는 것입니다.

예를 들어, 친구 (또는 좋아하는 사람)와 온라인으로 채팅 할 때 상대방이 가끔 이해하지 못하는 그림 이모티콘을 보낼 수 있습니다. 실제로 다음과 같은 많은 상황이 있습니다.

  • 누군가가 내 사진에 답장하면 🤒 은 무엇을 의미합니까?
  • 소녀가 나 에게 😊 을 보낸다는 것은 무엇을 의미합니까?
  • 내 짝사랑이 나를 보내면 , 좋은 징조인가요?

우리가 알다시피, 당신은 그림 이모티콘의 정확한 의미를 알 수없는 것처럼하지만, 우리의 감정 분석을 통해, 당신은 심리적으로이 그림 이모티콘을 분석 할 수 있습니다 "그녀가 나에게 보낸 💞, 그것은, 어쩌면 내가 그녀를 요청해야 긍정적 인 신호이다"또는 " 내 남자 친구가 왜 나에게 😒를 보냈지? 그건 좀 부정적인데, 그가 나 한테 화났어? " , 이 같은. 이모티콘 감정 분석 을 통해 이모티콘을 더 깊이 이해할 수 있다고 생각합니다.


대체로 우리는이 이모티콘 감정 분석 프로젝트에 많은 비용을 지불했습니다. 어렵지만 더 깊게 만들고 싶습니다. 우리는 이제 다른 언어로 된 이모지를 분석하고 있으며, 이모지가 순수 텍스트에 미치는 감정적 이득 효과를 분석하고 있으며, 여러 다른 고급 연구도 고려되었습니다. 이 모든 것은 이모티콘의 더 많은 사용을 탐색하기위한 것이며 이모티콘이 흥미롭고 유익하다는 것을 알기를 바랍니다.

찾기 최근 최근 최근 사용한 이모티콘 없음 이모티콘... 이모티콘 성공