요즘에는 점점 더 실용적이고 흥미로운 이모티콘 사용법이 만들어지고 있습니다. 예를 들어 서로 다른 범주의 이모티콘이 함께 결합되어 밈이 되거나 겉보기에 관련이 없어 보이는 이모티콘이 실제로 동일한 의미를 설명하는 데 사용될 수 있습니다. 그들을. 이모티콘 간의 관계를 시각적으로 보여주고 사용자가 이모티콘 사용에 대해 더 깊이 이해할 수 있도록 하기 위해 기계 학습 알고리즘을 사용하여 이모티콘 간의 관계를 계산하고 그 결과를 이해하기 쉬운 그림으로 그리는 것이 이모티콘 관계입니다. 그래프 .

이모티콘 관계 그래프가 무엇인가요?

이모티콘은 일반적으로 이미지로 제공되는 것으로 잘 알려져 있지만 이모티콘의 주요 용도는 정보와 감정을 전달하는 것이기 때문에 이모티콘과 이미지 사이의 관계를 파악하는 것은 불가능합니다. 이모티콘의 의미와 사용법을 통해 그들의 관계를 탐색하는 것이 더 정확합니다. 따라서 2018년부터 2021년까지 이모티콘이 포함된 모든 트윗을 확보하여 총 8억 1200만 트윗을 확보했습니다. 이모티콘의 사용은 언어 환경에 따라 다를 수 있다는 점을 고려하여 언어별로 트윗을 분류한 다음 기계 학습 알고리즘을 통해 언어별 이모티콘 간의 텍스트 유사도 를 계산하여 언어별 해당 이모티콘 관계 그래프를 얻습니다.

이모티콘 관계 그래프를 이해하는 방법?

스페인어 👉 의 이모티콘 관계 그래프입니다. 빨간색 상자는 가장 가까운 9개의 이모티콘을 나타내며 광선의 길이는 관계의 정도를 나타내며 광선이 짧을수록 관계가 더 가깝습니다. 또한 그래프는 다른 이모티콘의 관계 그래프의 일부도 보여줍니다. 검은색 상자는 👆 의 관계 그래프이고, 주황색 상자는 의 관계 그래프입니다.

관계 그래프에 반영된 결과를 통해 이모티콘 사용에 대해 더 깊이 이해할 수 있습니다. 예를 들어, 이 두 이모티콘 👈 🥺은 최근 몇 년 동안👉과 함께 화난, 수줍음 또는 탄원을 표현하는 데 자주 사용되므로 이 관계 그래프에 나타납니다.

이 두 이모티콘은 종종 링크를 나타내는 데 사용됩니다. 즉, 사용법이 유사하므로 관계 그래프에서 서로 가깝습니다.

이모티콘 관계 차트를 자세히 살펴보면 일부 이모티콘에 대한 인식을 새로 고칠 수 있습니다.

이모티콘 간의 관계를 계산하는 방법은 무엇입니까?

다음으로 계산 과정에 대해 자세히 설명하겠습니다. 크게 다음 세 단계로 나눌 수 있습니다.

  • 먼저 TF-IDF 알고리즘 을 사용하여 트윗에서 각 이모티콘의 태그와 각 태그에 해당하는 가중치를 추출합니다. 태그는 이모티콘과 가장 밀접한 관련이 있는 단어를 말하며 이모티콘의 특성과 동일합니다. 가중치는 태그와 이모지의 관계의 친밀도를 의미하며 가중치가 높을수록 관계가 더 가깝습니다. 태그를 가져오는 알고리즘 및 계산 프로세스에 대해 자세히 소개하는 기사를 작성했습니다. 오른쪽 링크를 클릭하여 읽을 수 있습니다. ☁️Emoji Tag Cloud: Emoji에 대한 더 많은 지식을 얻을 수 있도록 도와주세요!
  • 레이블을 얻은 후 새로운 문제가 발생합니다. 계산에 관해서는 일반적으로 숫자 값만 계산할 수 있다는 것을 우리 모두 알고 있지만 태그는 텍스트로 표시됩니다. 그렇다면 어떻게 알고리즘적으로 계산할 수 있습니까? 따라서 두 번째 단계는 텍스트를 계산할 수 있는 숫자 값으로 변환하는 것입니다. — Vector . 이 프로세스를 Word Embedding 이라고 합니다. 텍스트의 각 단어를 벡터로 변환하기 위해 word2vec 알고리즘 (단어 임베딩 방법 중 하나)을 사용하여 먼저 많은 양의 트윗 데이터를 읽어야 합니다. 그러면 모든 고차원 벡터로 구성된 단어 임베딩 행렬을 얻을 수 있습니다. 단어를 포함하고 나중에 첫 번째 단계에서 얻은 각 태그에 해당하는 각 단어를 단어 임베딩 행렬을 통해 고차원 벡터로 매핑합니다. 이로써 우리는 텍스트에서 벡터로의 변환을 완료했습니다. 이러한 고차원 벡터는 각 단어의 의미 정보를 잘 보존하여 텍스트 유사성의 정확성을 보장할 수 있는 텍스트의 컨텍스트를 분석하여 계산됩니다. word2vec 알고리즘은 블로그에도 자세히 설명되어 있습니다. 더 자세한 내용을 원하시면 읽어보세요: 🔍이모티콘 감정 분석
  • 마지막 단계는 이모티콘 간의 텍스트 유사도를 계산하는 것입니다. 텍스트 유사도를 계산하는 데 일반적으로 사용되는 알고리즘은 VSM(벡터 공간 모델) 입니다. 이것은 가장 널리 사용되는 유사도 계산 모델 중 하나이지만 두 텍스트의 동시 발생 단어(두 텍스트에 모두 나타나는 단어)를 계산하여 결과를 얻습니다. 이러한 상황을 피하기 위해 다른 알고리즘인 SCM(Soft Cosine Measure)을 선택했습니다. 단어 사이의 유사도를 측정할 수 있으므로 두 텍스트에 공통된 단어가 없더라도 이 알고리즘은 단어 유사도를 평가하여 두 텍스트의 유사도를 계산할 수 있습니다. SCM을 사용하여 벡터를 측정한 후 얻은 값이 클수록 이모티콘 간의 텍스트 유사도가 높고 텍스트 유사도가 높을수록 관계가 더 가깝습니다.

결론

관계 그래프를 통해 사람들의 이모티콘 사용 습관과 선호도를 파악하고 이모티콘 사용 경향을 탐색할 수 있습니다. 서로 연관되지 않은 일부 이모티콘이 실제로 매우 밀접하게 관련되어 있다는 사실에 놀랄 수 있으며, 이는 아직 알려지지 않은 최신 유행의 이모티콘 사용일 수 있습니다! 또한 제안할 사항이 있으면 댓글로 알려주세요!


찾기 최근 최근 최근 사용한 이모티콘 없음 이모티콘... 이모티콘 성공