امروزه استفاده‌های کاربردی و جالب‌تری از ایموجی‌ها ایجاد می‌شود، به عنوان مثال، دسته‌های مختلف ایموجی با هم ترکیب می‌شوند تا به یک میم تبدیل شوند، یا در واقع می‌توان از ایموجی‌های به ظاهر نامرتبط برای توصیف همان معنی استفاده کرد، که باعث می‌شود ایموجی‌ها به تدریج ارتباطی بین آن‌ها ایجاد کنند. آنها ما می خواهیم این رابطه بین ایموجی ها را به صورت بصری نشان دهیم و به کاربران اجازه دهیم درک عمیق تری از استفاده از ایموجی داشته باشند، بنابراین از الگوریتم های یادگیری ماشینی برای محاسبه رابطه بین ایموجی ها استفاده می کنیم و نتیجه را به یک تصویر آسان برای درک ترسیم می کنیم که همان رابطه ایموجی است. نمودار .

نمودار رابطه ایموجی چیست؟

به خوبی شناخته شده است که ایموجی ها معمولاً به صورت تصویر ارائه می شوند، اما نمی توان ارتباط بین ایموجی ها و تصاویر را مشخص کرد، زیرا کاربرد اصلی ایموجی ها انتقال اطلاعات و احساسات است، آنها بیشتر شبیه یک زبان هستند، بنابراین چنین خواهد شد. دقیق تر برای کشف رابطه آنها از طریق معنا و استفاده از ایموجی. بنابراین، ما تمام توییت‌های حاوی ایموجی را از سال ۲۰۱۸ تا ۲۰۲۱ به دست آوردیم که در مجموع ۸۱۲ میلیون توییت بود. با توجه به اینکه استفاده از ایموجی در محیط‌های زبانی متفاوت خواهد بود، توییت‌ها را بر اساس زبان طبقه‌بندی کردیم و سپس شباهت متن بین ایموجی‌ها در هر زبان را با الگوریتم یادگیری ماشین محاسبه کردیم تا نمودار رابطه ایموجی مربوط به هر زبان را بدست آوریم.

چگونه نمودار رابطه ایموجی را درک کنیم؟

این نمودار رابطه Emoji 👉 برای اسپانیایی است. کادر قرمز 9 نزدیکترین ایموجی به آن را نشان می دهد، طول پرتو نشان دهنده درجه ارتباط است، هر چه پرتو کوتاهتر باشد، رابطه نزدیکتر است. علاوه بر این، نمودار بخشی از گراف رابطه سایر ایموجی ها را نیز نشان می دهد. در جعبه سیاه نمودار رابطه 👆 و در کادر نارنجی نمودار رابطه است .

نتایج منعکس شده در نمودار رابطه به ما این امکان را می دهد که درک غنی تری از استفاده از ایموجی داشته باشیم. به عنوان مثال، این دو ایموجی👈 🥺 اغلب به صورت ترکیبی با 👉 در سال های اخیر برای بیان ناراحتی، خجالتی بودن یا التماس کردن استفاده می شوند، بنابراین در این نمودار رابطه ظاهر می شوند:

این دو ایموجی اغلب برای نشان دادن پیوندها استفاده می‌شوند، به این معنی که شباهت‌هایی در استفاده دارند، بنابراین در نمودار رابطه به یکدیگر نزدیک هستند:

اگر به نمودار رابطه ایموجی ها دقت کنید، ممکن است درک خود را از برخی از ایموجی ها تازه کنید.

چگونه رابطه بین ایموجی ها را محاسبه کنیم؟

در ادامه به شما شرح مفصلی از فرآیند محاسبه خواهیم داد. تقریباً می توان آن را به سه مرحله زیر تقسیم کرد:

  • ابتدا از الگوریتم TF-IDF برای استخراج برچسب‌های هر ایموجی از توییت‌ها و وزن مربوط به هر تگ استفاده می‌کنیم. برچسب ها به آن دسته از کلماتی اطلاق می شود که بیشترین ارتباط را با ایموجی دارند که معادل ویژگی های یک ایموجی هستند. و وزن ها به نزدیکی رابطه بین برچسب ها و ایموجی ها اشاره دارد، هر چه وزن بالاتر باشد، رابطه نزدیک تر است. درباره الگوریتم و محاسبات روند گرفتن برچسب ها، ما یک مقاله به معرفی آن را در جزئیات نوشته شده است، شما می توانید از لینک سمت راست به خواندن آن کلیک کنید: ☁️Emoji ابر برچسب: شما کمک کند تا بیشتر دانش emoji نگارش کنید!
  • پس از به دست آوردن برچسب ها، مشکل جدیدی ایجاد می شود. وقتی صحبت از محاسبات می شود، همه ما می دانیم که به طور کلی فقط مقادیر عددی قابل محاسبه هستند، اما برچسب ها به صورت متن ارائه می شوند، پس چگونه می توان آنها را به صورت الگوریتمی محاسبه کرد؟ بنابراین، مرحله دوم ما تبدیل متن به مقادیر عددی قابل محاسبه است—— Vector . به این فرآیند تعبیه کلمه گفته می شود. ابتدا باید مقدار زیادی از داده های توییت را با استفاده از الگوریتم word2vec (یکی از روش های جاسازی کلمه) بخوانیم تا هر کلمه در متن را به یک برداری تبدیل کنیم، سپس می توانیم یک ماتریس جاسازی کلمه متشکل از همه بردارهای با ابعاد بالا را بدست آوریم. از کلمات، و بعداً هر کلمه مربوط به هر برچسبی را که در مرحله اول دریافت کردیم، از طریق ماتریس تعبیه کلمه در یک بردار با ابعاد بالا ترسیم کنید. بنابراین، ما تبدیل متن به بردار را تکمیل کردیم. این بردارهای با ابعاد بالا با تجزیه و تحلیل بافت متن محاسبه می شوند که به خوبی می توانند اطلاعات معنایی هر کلمه را حفظ کنند و در نتیجه از صحت شباهت متن اطمینان حاصل کنند. الگوریتم word2vec نیز در وبلاگ ما به تفصیل توضیح داده شده است، اگر جزئیات بیشتری می خواهید می توانید آن را بخوانید: 🔍تحلیل احساسات Emoji
  • آخرین مرحله محاسبه شباهت متن بین ایموجی ها است. الگوریتمی که معمولاً برای محاسبه شباهت متن استفاده می شود VSM (مدل فضای برداری) است . این یکی از پرکاربردترین مدل‌های محاسبه شباهت است، اما با محاسبه کلمات همزمان (کلماتی که در هر دو متن آمده است) دو متن به نتایجی دست می‌یابد که در مواجهه با متن‌هایی با معنی یکسان، اما با عبارت متفاوت، دقیق نیست. برای جلوگیری از این وضعیت، الگوریتم دیگری را انتخاب کردیم - SCM (Soft Cosine Measure) . این الگوریتم می تواند شباهت بین کلمات را اندازه گیری کند، بنابراین حتی اگر دو متن کلمات مشترکی نداشته باشند، این الگوریتم می تواند شباهت دو متن را با ارزیابی شباهت کلمه محاسبه کند. پس از استفاده از SCM برای اندازه گیری بردار، هر چه مقدار بزرگتر به دست آوریم به این معنی است که شباهت متن بین ایموجی ها بیشتر می شود و هر چه شباهت متن بیشتر باشد، رابطه آنها نزدیک تر است.

نتیجه

از طریق نمودار رابطه، می‌توانیم عادت‌ها و ترجیحات افراد در استفاده از ایموجی را درک کنیم و روند استفاده از ایموجی‌ها را بررسی کنیم. ممکن است تعجب کنید اگر متوجه شوید که برخی از شکلک‌هایی که نمی‌خواهید با یکدیگر ارتباط برقرار کنید، در واقع بسیار به هم مرتبط هستند، و این ممکن است استفاده مرسوم از شکلک‌هایی باشد که هنوز نمی‌شناسید! همچنین، اگر پیشنهادی دارید، لطفاً در نظرات به ما بگویید!


جستجو اخیر اخیر ایموجی اخیر استفاده نشده است Emojify کنید... Emojify Success