इमोजी इमोशन से भरे हुए हैं। यह पाठ के स्वर और मनोदशा को बढ़ा या समायोजित कर सकता है, साथ ही, इमोजी द्वारा व्यक्त की गई भावनाएं केवल शब्दों से अधिक स्पष्ट हो सकती हैं।

उदाहरण के लिए यह इमोजी 👿 (सींग वाला गुस्सा चेहरा)। यह स्पष्ट रूप से एक शैतान चरित्र के रूप में है, इसलिए विचार हो सकते हैं कि यह एक "बुरा" इमोजी है, जैसे किसी के सिर में कुछ बुरे विचार।

लेकिन फिर भी, इस तरह का विवरण बहुत सारगर्भित है। इसलिए, क्या हम इन इमोजी द्वारा व्यक्त भावनाओं के प्रकारों और स्तरों की कल्पना कर सकते हैं?


उत्तर "हाँ" अवश्य है! हमने 50 मिलियन से कम ट्वीट के सार्वजनिक नमूनों पर प्राकृतिक भाषा प्रसंस्करण (एनएलपी) का प्रदर्शन किया, और हम इमोजी भावना को मूल्यों के एक सेट के साथ जोड़ने और इसकी कल्पना करने के लिए टेक्स्ट सेंटीमेंट एनालिसिस (जिसे ओपिनियन माइनिंग भी कहा जाता है) का उपयोग करते हैं। हमने अपने इमोजी भावना विश्लेषण को अधिक वैज्ञानिक और कठोर बनाने के लिए बहुत समय, ऊर्जा और कंप्यूटिंग शक्ति खर्च की, ताकि हर कोई आकर्षण महसूस कर सके और इमोजी की बेहतर समझ प्राप्त कर सके।

इमोजी भावना विश्लेषण के लिए विज़ुअल चार्ट

इमोजी सेंटीमेंट वैल्यू जैसे डेटा की गणना टेक्स्ट सेंटीमेंट विश्लेषण के अनुसार की गई, जो सांख्यिकी और संभाव्यता सिद्धांत से संबंधित है। एल्गोरिथ्म और कंप्यूटिंग शक्ति की समस्या को हल करने के बाद, नई कठिनाइयों का सामना करना पड़ा: उपयोगकर्ताओं को इन पेशेवर डेटा को कैसे समझा जाए?

हमारे मन में एक विचार कौंधता है—- अरे! हम कुछ शानदार डिज़ाइनों के साथ इमोजी भावना मूल्यों की कल्पना कैसे करते हैं!

: हमने परिकलित और विश्लेषण किए गए डेटा (बाएं) को एक चार्ट में बदल दिया है जिसे उपयोगकर्ता (दाएं) बेहतर ढंग से समझ सकते हैं, जो इमोजी के भावनात्मक विभाजन को अधिक सहजता से दिखा सकता है;

तो मैं निम्नलिखित चार्ट की व्याख्या करता हूं, जो वास्तविक संचार में इमोजी की भावना प्रवृत्ति विश्लेषण के परिणामों को दर्शाता है।

💡: इमोजी के भाव विश्लेषण के लिए 2 प्रकार के चार्ट, यहां हम केवल ऊपर दिए गए चार्ट का विश्लेषण करते हैं।

चित्र में अर्धवृत्त चाप को तीन रंगों में विभाजित किया गया है, जो इमोजी 👿 की विभिन्न भावनात्मक प्रवृत्तियों का प्रतिनिधित्व करता है। जैसा कि हम देख सकते हैं, इन तीन भावनाओं का अनुपात लगभग 4:1:5 है, हरे और नारंगी रंग के समान अनुपात हैं, जिसका अर्थ है कि यह इमोजी अधिक तटस्थ है (आश्चर्य !!)

  • ग्रे कर्सर कॉन्फिडेंस लेवल है , जो एक सांख्यिकीय अवधारणा है। इसकी स्थिति और चौड़ाई इंगित करती है: Expected Value ± Confidence
  • अपेक्षित मान : यह इमोजी भावना मान के फैलाव वाले यादृच्छिक चर का भारित औसत है, जिसका उपयोग संभाव्यता व्यक्त करने के लिए किया जाता है, c ∈ [−1, 0, +1]
  • कॉन्फिडेंस : यह इमोजी सेंटीमेंट वैल्यू डिस्ट्रीब्यूशन का पैरामीटर सेट है, पॉजिटिव और नेगेटिव इंटरवल के रूप में एक उचित एरर रेंज दिखाता है। और कॉर्पस नमूनों की संख्या जितनी बड़ी होगी, त्रुटि उतनी ही कम होगी।

सीधे शब्दों में कहें तो कर्सर जितना बायीं ओर होगा, इस इमोजी का इमोशन ज्यादा नेगेटिव है। इसके विपरीत, कर्सर जितना दाईं ओर होगा, इस इमोजी द्वारा व्यक्त की गई सकारात्मक भावना उतनी ही अधिक होगी। और कर्सर जितना संकरा होता है, भावना का निर्णय उतना ही सटीक होता है।


अब, क्या आप इमोजी भावना विश्लेषण के हमारे चार्ट को समझ सकते हैं?

सेंटीमेंट एनालिसिस क्या है?

मेरा मानना है कि आप इमोजी सेंटीमेंट एनालिसिस के डेटा चार्ट को समझ गए हैं, तो आइए बात करते हैं कि सेंटीमेंट एनालिसिस क्या है।

सेंटीमेंट एनालिसिस को ओपिनियन माइनिंग भी कहा जाता है। तकनीकी रूप से बोलते हुए, भावना विश्लेषण प्राकृतिक भाषा प्रसंस्करण (एनएलपी) अनुसंधान का हिस्सा है। सेंटीमेंट एनालिसिस मेथड्स को दो प्रकारों में बांटा गया है: मशीन लर्निंग और डिक्शनरी-बेस्ड मेथड्स । लेकिन गहन शिक्षण प्रौद्योगिकी के विकास के साथ, भावना विश्लेषण के लिए इस तकनीक का उपयोग मुख्यधारा बन गया है।

भावना विश्लेषण प्रक्रिया में डेटा प्रीप्रोसेसिंग, फीचर इंजीनियरिंग और मॉडल प्रशिक्षण शामिल हैं। सामान्यतया, डेटा प्रीप्रोसेसिंग चरण मुख्य रूप से टेक्स्ट को शब्दों में विभाजित करता है और स्टॉप शब्दों और विराम चिह्नों को हटा देता है। हालाँकि, हमारा मनोभाव विश्लेषण विराम चिह्नों को बनाए रखता है और शब्दों को रोकता है। फीचर इंजीनियरिंग चरण में, हमने 2013 में Google टीम द्वारा प्रस्तावित शब्द एम्बेडिंग प्रतिनिधित्व (Word2Vec) को चुना, जिसे CBOW (शब्दों का निरंतर बैग) मॉडल और स्किप-ग्राम मॉडल में विभाजित किया गया है। मॉडल के परिणाम इस प्रकार हैं:

बाईं ओर CBOW मॉडल है, दाईं ओर स्किप-ग्राम मॉडल है

सीबीओओ शब्द वेक्टर प्राप्त करने के लिए प्रशिक्षित करने के लिए लक्षित शब्द की भविष्यवाणी करने के संदर्भ पर आधारित है। जैसा कि चित्र में दिखाया गया है, W(t) की भविष्यवाणी चार शब्दों W(t-2), W(t-1), W(t+1), W(t+2) ; और स्किप-ग्राम शब्द वेक्टर प्राप्त करने के लिए लक्षित शब्द के अनुसार आसपास के शब्दों की भविष्यवाणी करना है। जैसा कि चित्र में दिखाया गया है W(t-2),W(t-1),W(t+1),W(t+2) अनुसार W(t) की भविष्यवाणी करना है।

मॉडल भविष्यवाणी चरण में, हम डेटा को दो भागों में विभाजित करते हैं: प्रशिक्षण सेट को 5:1 के अनुपात में विभाजित किया जाता है और परीक्षण सेट और प्रशिक्षण सेट को क्रम से बाहर संसाधित किया जाता है।

इमोजी में भावना विश्लेषण का अनुप्रयोग

सेंटीमेंट एनालिसिस एक व्यापक विश्लेषण पद्धति है जो गहन शिक्षण और आँकड़ों को जोड़ती है। हमने जटिल विश्लेषण और डेटा की गणना के बाद इमोजी का भाव मूल्य प्राप्त किया है, और पूरी इमोजी भावना विश्लेषण प्रक्रिया इस प्रकार है:

इमोजी सेंटीमेंट एनालिसिस की प्रक्रिया

  • सोशल नेटवर्किंग कॉर्पस लेबल करें
  • डेटा प्रीप्रोसेसिंग
  • डेटासेट को विभाजित करें: प्रशिक्षण सेट(80%), परीक्षण सेट(20%)
  • मॉडल बनाने के लिए LSTM तंत्रिका नेटवर्क का उपयोग करें
  • परीक्षण सेट पर मॉडल के प्रदर्शन के अनुसार, मॉडल की सामान्यीकरण क्षमता में सुधार करने के लिए हाइपरपैरामीटर को समायोजित करें
  • लेबल रहित डेटा पर समान डेटा प्रीप्रोसेसिंग क्रिया करें
  • बिना लेबल वाले डेटा पर सेंटीमेंट की प्रवृत्ति का अनुमान लगाने के लिए प्रशिक्षित सेंटीमेंट प्रेडिक्शन मॉडल का इस्तेमाल करें

हम इमोजी पर भावनाओं का विश्लेषण करते हैं, और इमोजी टेक्स्ट सेंटीमेंट क्लासिफायर प्राप्त करने के लिए प्रशिक्षित करने के लिए गहन शिक्षण तकनीक का उपयोग करते हैं। क्लासिफायरियर की आउटपुट लेयर के लिए, हम सक्रिय करने के लिए सिग्मॉइड फ़ंक्शन का चयन करते हैं, और आउटपुट लेयर परिणामों को 0-1 के अंतराल में प्रोजेक्ट करते हैं। पाठ 0 के जितना करीब है, उतना ही नकारात्मक है, और 1 के जितना करीब है, उतना ही सकारात्मक है।

सिग्मॉइड फ़ंक्शन सूत्र है: F(x)=1/(1+ex)

हम विश्लेषण कॉर्पस के रूप में इमोजी युक्त 50 मिलियन ट्वीट्स के एक बड़े नमूना डेटा का उपयोग करते हैं, फिर भावना भविष्यवाणी के लिए प्रशिक्षित भावना वर्गीकरण में कॉर्पस का विश्लेषण करने की आवश्यकता होती है। अंत में, क्लासिफायरियर द्वारा भावना की भविष्यवाणी के परिणामों को तीन प्रकारों में विभाजित किया गया है: नकारात्मक, तटस्थ और सकारात्मक। वर्गीकरण मानदंड हैं:

वैसे भी यह मुश्किल है, लेकिन हमने इसे बनाया है !!

इमोजी सेंटीमेंट एनालिसिस का उपयोग और संभावना

विपणन, विज्ञापन, मनोविज्ञान, चिकित्सा और अन्य क्षेत्रों में भावना विश्लेषण का व्यापक रूप से उपयोग किया जाता है। हम इमोजी भावना विश्लेषण करने का निर्णय लेते हैं ताकि लोगों को वास्तविक सामाजिक संपर्क में इमोजी की गहरी समझ प्राप्त करने में मदद मिल सके, इमोजी की अस्पष्टता और गलतफहमी को और अधिक प्रभावी ढंग से समाप्त किया जा सके।

उदाहरण के लिए, जब आप अपने दोस्त (या अपने क्रश) के साथ ऑनलाइन चैट कर रहे होते हैं, तो दूसरा व्यक्ति कभी-कभी आपको ऐसी इमोजी भेज सकता है जिसे आप ठीक से नहीं समझते हैं। दरअसल, ऐसी कई स्थितियां हैं, जैसे:

  • अगर कोई मेरी तस्वीर का जवाब देता है तो का क्या मतलब होता है?
  • इसका क्या मतलब महिला भेजता है करता 😊 मेरे लिए?
  • अगर मेरा क्रश मुझे भेजता है, तो क्या यह एक अच्छा संकेत है?

जैसा कि हम जानते हैं, आप इमोजी का सटीक अर्थ नहीं बता सकते हैं, हालांकि, हमारे भावना विश्लेषण के माध्यम से, आप इन इमोजी का मनोवैज्ञानिक रूप से विश्लेषण कर सकते हैं, जैसे "उसने मुझे एक भेजा, यह एक सकारात्मक संकेत है, शायद मुझे उससे बाहर पूछना चाहिए" या " मेरा बॉयफ्रेंड मुझे क्यों भेजता है? यह एक तरह से नकारात्मक है, क्या वह मुझ पर पागल है?" , कुछ इस तरह। हमारे इमोजी सेंटीमेंट एनालिसिस के साथ , मेरा मानना है कि आप इमोजी को और गहराई से समझ सकते हैं।


कुल मिलाकर, हमने इस इमोजी भावना विश्लेषण परियोजना के लिए बहुत अधिक भुगतान किया है। हालांकि यह मुश्किल है, फिर भी हम इसे और गहरा करना चाहते हैं। अब हम विभिन्न भाषाओं में इमोजी का विश्लेषण कर रहे हैं, शुद्ध पाठ पर इमोजी का भावनात्मक लाभ प्रभाव, और कई अन्य उन्नत अध्ययनों पर भी विचार किया गया है। ये सभी इमोजी के अधिक उपयोग का पता लगाने के लिए हैं, और आशा करते हैं कि इमोजी दिलचस्प और जानकारीपूर्ण हैं।

खोज हाल हाल ही इमोजी का कोई हालिया उपयोग नहीं इमोजी... सफलता का अनुकरण करें