Emoji penuh dengan emosi. Ini dapat meningkatkan atau menyesuaikan nada dan suasana teks, pada masa yang sama, emosi yang diungkapkan oleh emoji dapat lebih jelas daripada kata-kata sahaja.

Contohnya emoji ini 👿 (muka marah dengan tanduk). Tentunya dalam bentuk watak syaitan, jadi mungkin ada pemikiran yang dianggap sebagai emoji "buruk", seperti beberapa pemikiran jahat di kepala seseorang.

Tetapi, penerangan seperti ini sangat abstrak. Oleh itu, bolehkah kita menggambarkan jenis dan tahap sentimen yang dinyatakan oleh emoji ini?


Jawapannya adalah "Ya" sudah tentu! Kami melakukan Pemprosesan Bahasa Semula jadi (NLP) pada sampel awam yang tidak kurang dari 50 juta tweet, dan kami menggunakan Analisis Sentimen Teks (juga disebut pertimbangan pendapat) untuk mengaitkan sentimen emoji dengan sekumpulan nilai dan memvisualisasikannya. Kami menghabiskan banyak masa, tenaga dan kekuatan pengkomputeran untuk membuat analisis sentimen emoji kami lebih saintifik dan ketat, sehingga semua orang dapat merasakan daya tarikan dan pemahaman yang lebih baik mengenai emoji.

Carta visual untuk analisis sentimen emoji

Data seperti nilai sentimen emoji dikira mengikut analisis sentimen teks, yang termasuk dalam statistik dan teori kebarangkalian. Setelah kami menyelesaikan masalah kuasa algoritma dan pengkomputeran, kemudian menghadapi kesulitan baru: bagaimana membuat pengguna memahami data profesional ini?

Fikiran melintas di fikiran kita—— Hei! Bagaimana dengan kita membayangkan nilai sentimen emoji dengan beberapa reka bentuk yang menarik!

💡: Kami menukar data yang dikira dan dianalisis (kiri) menjadi carta yang dapat lebih difahami oleh pengguna (kanan), yang secara intuitif dapat menunjukkan pembahagian emoji emosi;

Oleh itu, izinkan saya menerangkan carta berikut, yang menggambarkan hasil analisis kecenderungan sentimen emoji dalam komunikasi sebenar.

💡: 2 jenis carta untuk analisis sentimen emoji,, di sini kami hanya menganalisis carta di atas.

Lengkungan separuh bulatan dalam gambar terbahagi kepada tiga warna, yang mewakili kecenderungan emosi emoji yang berbeza 👿 . Seperti yang kita lihat, perkadaran ketiga-tiga emosi ini adalah sekitar 4: 1: 5, hijau dan oren mempunyai perkadaran yang serupa, yang bermaksud emoji ini lebih bersifat neutral (kejutan !!).

  • Kursor kelabu adalah Tahap Keyakinan , konsep statistik. Kedudukan dan lebarnya menunjukkan: Expected Value ± Confidence .
  • Nilai yang Diharapkan : Merupakan purata wajaran pemboleh ubah rawak tersebar dari nilai sentimen emoji, digunakan untuk menyatakan kebarangkalian, c ∈ [−1, 0, +1] .
  • Keyakinan : Ini adalah set parameter taburan nilai sentimen emoji, menunjukkan julat ralat yang wajar dalam bentuk selang positif dan negatif. Dan semakin besar bilangan sampel korpus, semakin kecil ralatnya.

Secara sederhana, kursor semakin dekat ke kiri, emosi emoji ini lebih negatif. Sebaliknya, semakin dekat kursor ke kanan, emosi yang lebih positif dinyatakan oleh emoji ini. Dan semakin pendek kursornya, penilaian emosi itu lebih tepat.


Sekarang, bolehkah anda memahami carta analisis sentimen emoji kami?

Apa itu Analisis Sentimen?

Saya percaya bahawa anda telah memahami carta data analisis sentimen emoji, jadi mari kita bincangkan apa itu analisis sentimen.

Analisis sentimen juga dipanggil pertambangan pendapat. Secara teknikal, analisis sentimen adalah sebahagian daripada penyelidikan pemprosesan bahasa semula jadi (NLP). Kaedah analisis sentimen terbahagi kepada dua jenis: Pembelajaran mesin dan kaedah berasaskan Kamus . Tetapi dengan perkembangan teknologi pembelajaran mendalam, penggunaan teknologi ini untuk analisis sentimen telah menjadi arus perdana.

Proses analisis sentimen merangkumi pemprosesan data, teknik ciri dan latihan model. Secara umum, tahap pemprosesan data terutamanya membahagikan teks menjadi kata-kata dan membuang kata berhenti dan tanda baca. Walau bagaimanapun, analisis sentimen kami mengekalkan tanda baca dan kata berhenti. Pada peringkat kejuruteraan ciri, kami memilih perwakilan penyisipan kata (Word2Vec) yang dicadangkan oleh pasukan Google pada tahun 2013, yang dibahagikan kepada model CBOW (beg perkataan berterusan) dan model Skip-gram . Hasil model adalah seperti berikut:

💡 : Di sebelah kiri adalah model CBOW, di sebelah kanan adalah model Skip-gram

CBOW berdasarkan konteks untuk memprediksi kata sasaran yang akan dilatih untuk memperoleh vektor kata. Seperti yang ditunjukkan dalam gambar, W (t) diramalkan berdasarkan empat kata W(t-2), W(t-1), W(t+1), W(t+2) ; Dan skip-gram adalah untuk meramalkan perkataan di sekitarnya mengikut kata sasaran untuk melatih mendapatkan vektor kata. Seperti yang ditunjukkan dalam gambar adalah untuk meramalkan W(t-2),W(t-1),W(t+1),W(t+2) menurut W (t) .

Pada tahap ramalan model, kami membahagikan data menjadi dua bahagian: Set latihan dibahagikan pada nisbah 5: 1 dan set ujian dan set latihan diproses tidak teratur.

Aplikasi analisis sentimen dalam emoji

Analisis sentimen adalah kaedah analisis komprehensif yang menggabungkan pembelajaran mendalam dan statistik. Kami telah memperoleh nilai sentimen emoji setelah analisis kompleks dan pengiraan bilangan data, dan proses analisis sentimen emoji lengkap adalah seperti berikut:

Proses Analisis Sentimen Emoji

  • Labelkan korpus rangkaian sosial
  • Pemprosesan data
  • Bagilah set data: Set Latihan (80%), Set Pengujian (20%)
  • Gunakan rangkaian saraf LSTM untuk membina model
  • Mengikut prestasi model pada set ujian, sesuaikan hiperparameter untuk meningkatkan kemampuan generalisasi model
  • Lakukan tindakan pemprosesan data yang sama pada data yang tidak berlabel
  • Gunakan model ramalan sentimen terlatih untuk meramalkan kecenderungan sentimen pada data yang tidak berlabel

Kami melakukan analisis sentimen pada emoji, dan menggunakan teknologi pembelajaran mendalam untuk melatih mendapatkan pengelasan sentimen teks emoji. Untuk lapisan output pengklasifikasi, kami memilih fungsi sigmoid untuk diaktifkan, dan memproyeksikan hasil lapisan hasil ke selang 0-1. Semakin dekat teks ke 0, semakin negatif, dan semakin dekat dengan teks, semakin positif.

Rumus fungsi sigmoid adalah: F(x)=1/(1+ex)

Kami menggunakan data sampel yang besar dari 50 juta tweet yang mengandung emoji sebagai korpus analisis, kemudian meletakkan korpus perlu dianalisis menjadi pengklasifikasi sentimen terlatih untuk ramalan sentimen. Akhirnya, hasil ramalan sentimen oleh pengkelasan terbahagi kepada tiga jenis: negatif, neutral dan positif. Kriteria klasifikasi adalah:

Bagaimanapun, ia sukar, tetapi kami berjaya !!

Penggunaan dan prospek Analisis Sentimen Emoji

Analisis sentimen banyak digunakan dalam bidang pemasaran, periklanan, psikologi, perubatan dan lain-lain. Kami memutuskan untuk melakukan analisis sentimen emoji adalah untuk membantu orang memahami lebih mendalam tentang emoji dalam interaksi sosial yang sebenarnya, menghilangkan kekaburan dan salah faham mengenai emoji dengan lebih berkesan.

Contohnya, semasa anda berbual dengan rakan anda (atau orang yang anda gemari) dalam talian, orang lain kadangkala menghantar emoji kepada anda yang anda tidak begitu faham. Sebenarnya, terdapat banyak situasi seperti ini, seperti:

  • Apa 🤒 jika seseorang membalas foto saya?
  • Apa maksudnya apabila seorang gadis menghantar 😊 kepada saya?
  • Sekiranya saya menghancurkan saya ❤ , adakah itu petanda yang baik?

Seperti yang kita ketahui, anda tidak dapat mengetahui maksud tepat emoji, namun, melalui analisis sentimen kami, anda mungkin dapat menganalisis emoji ini secara psikologi, seperti "dia mengirim saya 💞, itu adalah tanda positif, mungkin saya harus mengajaknya keluar" atau " mengapa teman lelaki saya menghantar saya 😒? Ini agak negatif, adakah dia marah kepada saya? " , sesuatu seperti ini. Dengan Analisis Sentimen Emoji kami, saya yakin anda dapat memahami emoji dengan lebih mendalam.


Secara keseluruhan, kami telah membayar banyak untuk projek analisis sentimen emoji ini. Walaupun sukar, kami tetap ingin membuatnya lebih mendalam. Kami kini menganalisis emoji dalam bahasa yang berlainan, kesan peningkatan emosi emoji pada teks murni, dan beberapa kajian lanjutan lain juga telah dipertimbangkan. Semua ini adalah untuk meneroka lebih banyak penggunaan emoji, dan harap anda dapati emoji menarik dan bermaklumat.