في الوقت الحاضر ، يتم إنشاء المزيد والمزيد من استخدامات الرموز التعبيرية العملية والمثيرة للاهتمام ، على سبيل المثال ، سيتم دمج فئات مختلفة من الرموز التعبيرية معًا لتصبح Meme ، أو يمكن استخدام الرموز التعبيرية التي تبدو غير مرتبطة في الواقع لوصف نفس المعنى ، مما يجعل الرموز التعبيرية تدريجيًا تنشئ اتصالًا بين معهم. نريد إظهار هذه العلاقة بين الرموز التعبيرية بصريًا والسماح للمستخدمين بفهم أعمق لاستخدام الرموز التعبيرية ، لذلك نستخدم خوارزميات التعلم الآلي لحساب العلاقة بين الرموز التعبيرية ورسم النتيجة في صورة سهلة الفهم ، وهي علاقة Emoji رسم بياني .

ما هو الرسم البياني للعلاقة Emoji?

من المعروف أن الرموز التعبيرية تُقدم عادةً على شكل صور ، لكن من المستحيل معرفة العلاقة بين الرموز التعبيرية بالصور ، لأن الاستخدام الرئيسي للرموز التعبيرية هو نقل المعلومات والعواطف ، فهي أشبه باللغة ، لذلك ستكون كذلك. أكثر دقة لاستكشاف علاقتهم من خلال معنى واستخدام الرموز التعبيرية. لذلك حصلنا على جميع التغريدات التي تحتوي على إيموجي من 2018 إلى 2021 بإجمالي 812 مليون تغريدة . بالنظر إلى أن استخدام الرموز التعبيرية سيكون مختلفًا في بيئات اللغات المختلفة ، قمنا بتصنيف التغريدات حسب اللغة ، ثم حسبنا تشابه النص بين الرموز التعبيرية في كل لغة عن طريق خوارزمية التعلم الآلي ، وذلك للحصول على الرسم البياني لعلاقات الرموز التعبيرية المقابل لكل لغة.

كيف نفهم الرسم البياني للعلاقة Emoji؟

هذا هو الرسم البياني للعلاقة من الرموز التعبيرية للإسبانية👉 . يُظهر المربع الأحمر أقرب 9 رموز تعبيرية إليه ، ويمثل طول الشعاع درجة العلاقة ، وكلما كان الشعاع أقصر ، كانت العلاقة أقرب. بالإضافة إلى ذلك ، يُظهر الرسم البياني أيضًا جزءًا من الرسم البياني لعلاقة الرموز التعبيرية الأخرى. في المربع الأسود يوجد الرسم البياني للعلاقة 👆, وفي المربع البرتقالي يوجد الرسم البياني للعلاقة .

تسمح لنا النتائج المنعكسة في الرسم البياني للعلاقة بالحصول على فهم أكثر ثراءً لاستخدام الرموز التعبيرية. على سبيل المثال ، غالبًا ما يتم استخدام هذين الرموز التعبيرية 👈 🥺كمزيج مع 👉 في السنوات الأخيرة للتعبير عن المتظلم أو الخجل أو الترافع ، لذلك تظهر في مخطط العلاقة هذا:

غالبًا ما يتم استخدام هذين الرمزين التعبيريين للإشارة إلى الروابط ، مما يعني وجود أوجه تشابه في الاستخدام ، لذا فهما قريبان من بعضهما البعض في الرسم البياني للعلاقة:

إذا تعمقت في مخطط علاقة الرموز التعبيرية ، فيمكنك تحديث إدراكك لبعض الرموز التعبيرية.

كيف تحسب العلاقة بين الإيموجي؟

بعد ذلك سنقدم لك وصفًا تفصيليًا لعملية الحساب. يمكن تقسيمها تقريبًا إلى الخطوات الثلاث التالية:

  • أولاً ، نستخدم خوارزمية TF-IDF لاستخراج علامات كل رمز تعبيري من التغريدات والوزن المقابل لكل علامة. تشير العلامات إلى تلك الكلمات الأكثر ارتباطًا بالإيموجي ، والتي تعادل خصائص الرموز التعبيرية ؛ تشير الأوزان والأوزان إلى تقارب العلاقة بين العلامات والرموز التعبيرية ، فكلما زاد الوزن ، كانت العلاقة أقرب. حول الخوارزمية وعملية الحساب للحصول على العلامات ، قمنا بكتابة مقال لتقديمه بالتفصيل ، يمكنك النقر فوق الرابط الصحيح لقراءته: ☁️Emoji Tag Cloud: مساعدتك في الحصول على مزيد من المعرفة بالإيموجي!
  • بعد الحصول على الملصقات ، تنشأ مشكلة جديدة. عندما يتعلق الأمر بالحسابات ، نعلم جميعًا أنه يمكن حساب القيم الرقمية فقط بشكل عام ، ولكن يتم تقديم العلامات كنص ، فكيف يمكن حسابها بطريقة حسابية؟ لذلك ، فإن خطوتنا الثانية هي تحويل النص إلى قيم رقمية يمكن حسابها ————— . تسمى هذه العملية تضمين الكلمات . نحتاج أولاً إلى قراءة قدر كبير من بيانات التغريدات باستخدام خوارزمية word2vec (إحدى طرق تضمين الكلمات) لتحويل كل كلمة في النص إلى متجه ، ثم يمكننا الحصول على مصفوفة تضمين كلمة تتكون من جميع المتجهات عالية الأبعاد من الكلمات ، ثم قم بعد ذلك بتعيين كل كلمة مطابقة لكل علامة وصلنا إليها في الخطوة الأولى إلى متجه عالي الأبعاد من خلال مصفوفة تضمين الكلمة. وهكذا ، نكون قد أكملنا تحويل النص إلى المتجه. يتم حساب هذه المتجهات عالية الأبعاد من خلال تحليل سياق النص ، والذي يمكن أن يحافظ جيدًا على المعلومات الدلالية لكل كلمة وبالتالي ضمان دقة تشابه النص. يتم أيضًا شرح خوارزمية word2vec بالتفصيل في مدونتنا ، إذا كنت تريد المزيد من التفاصيل يمكنك قراءتها: 🔍 تحليل المشاعر الإيموجي
  • الخطوة الأخيرة هي حساب تشابه النص بين الرموز التعبيرية. الخوارزمية المستخدمة بشكل شائع لحساب تشابه النص هي VSM (Vector Space Model) . يعد هذا أحد أكثر نماذج حساب التشابه استخدامًا ، ولكنه يحصل على النتائج من خلال حساب الكلمات المتزامنة (الكلمات التي تظهر في كلا النصين) من نصين ، وهو أمر غير دقيق عند مواجهة نصوص لها نفس المعنى ولكن بصيغة مختلفة. لتجنب هذا الموقف ، اخترنا خوارزمية أخرى - SCM (مقياس جيب التمام الناعم) . يمكنه قياس التشابه بين الكلمات ، لذلك حتى لو لم يكن لدى نصين كلمات مشتركة ، يمكن لهذه الخوارزمية حساب التشابه بين نصين من خلال تقييم كلمة التشابه. بعد استخدام SCM لقياس المتجه ، كلما زادت القيمة التي نحصل عليها كلما زاد تشابه النص بين الرموز التعبيرية ، وكلما زاد تشابه النص ، كانت علاقتهما أقرب.

استنتاج

من خلال الرسم البياني للعلاقة ، يمكننا فهم عادات الأشخاص وتفضيلاتهم في استخدام الرموز التعبيرية ، واستكشاف اتجاه استخدامات الرموز التعبيرية. قد تندهش عندما تجد أن بعض الرموز التعبيرية التي لا تربطها ببعضها البعض هي في الواقع مرتبطة ارتباطًا وثيقًا للغاية ، وقد يكون هذا استخدامًا عصريًا جديدًا للرموز التعبيرية التي لم تعرفها بعد! أيضًا ، إذا كان لديك أي اقتراحات ، فيرجى إخبارنا في التعليق!


بحث استراحة حديث لا تستخدم الرموز التعبيرية مؤخرًا إموجيفي... نجاح Emojify