Günümüzde giderek daha pratik ve ilginç emoji kullanımları yaratılıyor, örneğin, farklı emoji kategorileri bir araya getirilerek bir Meme haline getirilecek veya görünüşte alakasız emoji aslında aynı anlamı tanımlamak için kullanılabilir, bu da emoji'nin kademeli olarak aralarında bir bağlantı oluşturmasını sağlar. onlara. Emoji arasındaki bu ilişkiyi görsel olarak göstermek ve kullanıcıların emoji kullanımını daha derinden anlamalarını sağlamak istiyoruz, bu nedenle emoji arasındaki ilişkiyi hesaplamak için makine öğrenme algoritmaları kullanıyoruz ve sonucu Emoji İlişkisi olan anlaşılması kolay bir resme çiziyoruz. Grafik .

Emoji İlişki Grafiği Nedir?

Emojilerin genellikle görüntü olarak sunulduğu iyi bilinir, ancak emojilerin görüntülerle ilişkisini anlamak imkansızdır, çünkü emojinin temel kullanımı bilgi ve duygu iletmek olduğundan, bunlar daha çok bir dil gibidir, bu yüzden olacaktır. emojinin anlamı ve kullanımı yoluyla ilişkilerini keşfetmek için daha doğru. Bu nedenle 2018'den 2021'e kadar emoji içeren tüm tweet'leri toplam 812 milyon tweet'e ulaştık . Farklı dil ortamlarında emoji kullanımının farklı olacağı düşünülerek tweetleri dile göre sınıflandırdık ve ardından her dil için karşılık gelen Emoji İlişki Grafiği'ni elde etmek için makine öğrenme algoritması ile her dildeki emojiler arasındaki Metin Benzerliğini hesapladık.

Emoji İlişki Grafiği Nasıl Anlaşılır?

Bu, İspanyolca için 👉Emoji İlişki Grafiğidir. Kırmızı kutu kendisine en yakın 9 emojiyi gösterir, ışının uzunluğu ilişkinin derecesini temsil eder, ışın ne kadar kısaysa ilişki o kadar yakındır. Ayrıca grafik, diğer emojilerin ilişki grafiğinin bir bölümünü de gösterir. Kara kutuda 👆'nin ilişki grafiği ve turuncu kutuda 'nin ilişki grafiği var.

İlişki grafiğine yansıyan sonuçlar, emoji kullanımı hakkında daha zengin bir anlayışa sahip olmamızı sağlıyor. Örneğin, bu iki emoji 👈 🥺 👉son yıllarda sık sık üzülmüş utangaç veya yalvaran ifade etmek için ile bir arada kullanılıyor, bu yüzden bu ilişki grafiğinde görünüyorlar:

Bu iki emoji genellikle bağlantıları belirtmek için kullanılır, bu da kullanım açısından benzerlikleri olduğu anlamına gelir, bu nedenle ilişki grafiğinde birbirlerine yakındırlar:

Emoji ilişki tablosunu incelerseniz, bazı emojilere ilişkin algınızı tazeleyebilirsiniz.

Emoji arasındaki ilişki nasıl hesaplanır?

Daha sonra size hesaplama sürecinin ayrıntılı bir açıklamasını vereceğiz. Kabaca aşağıdaki üç adıma ayrılabilir:

  • İlk olarak, tweet'lerden her emojinin etiketlerini ve her bir etikete karşılık gelen ağırlığı çıkarmak için TF-IDF algoritmasını kullanıyoruz. Etiketler, emoji ile en yakından ilişkili olan ve bir emojinin özelliklerine eşdeğer olan kelimeleri ifade eder; ve ağırlıklar, etiketler ve emoji arasındaki ilişkinin yakınlığını ifade eder, ağırlık ne kadar yüksek olursa, ilişki o kadar yakın olur. Etiket alma algoritması ve hesaplama süreci hakkında detaylı bir şekilde tanıtmak için bir makale yazdık, okumak için sağdaki linke tıklayabilirsiniz: ☁️Emoji Etiket Bulutu: Emoji Hakkında Daha Fazla Bilgi Edinmenize Yardımcı Olur!
  • Etiketleri aldıktan sonra yeni bir sorun ortaya çıkıyor. Hesaplamalar söz konusu olduğunda, hepimiz biliyoruz ki genellikle sadece sayısal değerler hesaplanabilir, ancak etiketler metin olarak sunulur, peki algoritmik olarak nasıl hesaplanabilir? Bu nedenle ikinci adımımız, metni hesaplanabilecek sayısal değerlere dönüştürmektir—— Vektör . Bu işleme Kelime Gömme denir. Metindeki her bir kelimeyi bir vektöre dönüştürmek için önce word2vec algoritmasını (kelime gömme yöntemlerinden biri) kullanarak büyük miktarda tweet verisini okumamız gerekiyor, daha sonra tüm yüksek boyutlu vektörlerden oluşan bir kelime gömme matrisi elde edebiliriz. ve daha sonra ilk adımda aldığımız her etikete karşılık gelen her bir kelimeyi, kelime gömme matrisi aracılığıyla yüksek boyutlu bir vektöre eşleyin. Böylece metinden vektöre dönüştürme işlemini tamamlamış olduk. Bu yüksek boyutlu vektörler, her kelimenin anlamsal bilgisini iyi koruyabilen ve böylece metin benzerliğinin doğruluğunu sağlayan metnin bağlamı analiz edilerek hesaplanır. Word2vec algoritması da blogumuzda detaylı olarak anlatılıyor, daha fazla detay isterseniz okuyabilirsiniz: 🔍Emoji Duygu Analizi
  • Son adım, emojiler arasındaki metin benzerliğini hesaplamaktır. Metin benzerliğini hesaplamak için yaygın olarak kullanılan algoritma VSM(Vektör Uzay Modelidir) . Bu, en yaygın olarak kullanılan benzerlik hesaplama modellerinden biridir, ancak iki metnin birlikte geçen kelimelerini (her iki metinde de geçen kelimeler) hesaplayarak sonuçlar elde eder; bu, aynı anlama sahip ancak farklı ifadelere sahip metinlerle karşılaştırıldığında doğru değildir. bu durumdan kaçınmak için başka bir algoritma seçtik—— SCM(Soft Cosine Measure) . Kelimeler arasındaki benzerliği ölçebilir, böylece iki metnin ortak kelimeleri olmasa bile, bu algoritma kelime benzerliğini değerlendirerek iki metnin benzerliğini hesaplayabilir. Vektörü ölçmek için SCM'yi kullandıktan sonra, elde ettiğimiz değer ne kadar büyük olursa, emojiler arasındaki metin benzerliği o kadar yüksek ve metin benzerliği ne kadar yüksek olursa, ilişkileri o kadar yakın olur.

Çözüm

İlişki grafiği sayesinde insanların emoji kullanım alışkanlıklarını ve tercihlerini anlayabilir ve emoji kullanım trendlerini keşfedebiliriz. Birbirinizle ilişkilendirmeyeceğiniz bazı emojilerin aslında çok yakından ilişkili olduğunu görünce şaşırabilirsiniz ve bu henüz bilmediğiniz yeni bir moda emoji kullanımı olabilir! Ayrıca, herhangi bir öneriniz varsa, lütfen yorumda bize bildirin!


Ara sonlar sonlar Yakın zamanda kullanılmayan emoji Emojileştir... Başarıyı Emojileştirin