ক্রিয়া মেনু

ধরন

চামড়া স্বন

চুল শৈলী

লিঙ্গ

ভাবপ্রবণতা

সংস্করণ

ইমোজি আবেগে ভরপুর। এটি পাঠ্যের সুর ও মেজাজকে বাড়িয়ে তুলতে বা সামঞ্জস্য করতে পারে, একই সাথে ইমোজি দ্বারা প্রকাশিত আবেগগুলি কেবল শব্দের চেয়ে আরও স্পষ্ট হতে পারে।

উদাহরণস্বরূপ এই ইমোজি 👿 (শিংগুলির সাথে রাগান্বিত মুখ)। এটি স্পষ্টতই একটি শয়তান চরিত্রের আকারে, সুতরাং কারও মাথায় কিছু খারাপ চিন্তাভাবনার মতো এটি "খারাপ" ইমোজি হিসাবে বিবেচিত ধারণা থাকতে পারে।

তবে এখনও, এই ধরণের বর্ণনাটি খুব বিমূর্ত। সুতরাং, আমরা কি এই ইমোজিগুলি দ্বারা প্রকাশিত সংবেদনের ধরণগুলি এবং স্তরগুলিকে কল্পনা করতে পারি?


উত্তরটি অবশ্যই "হ্যাঁ" অবশ্যই! আমরা ৫০ কোটিরও কম টুইটের পাবলিক স্যাম্পলগুলিতে নেচারাল ল্যাঙ্গুয়েজ প্রসেসিং (এনএলপি) সম্পাদন করেছি এবং ইমোজি অনুভূতিকে মানগুলির একটি সংখ্যার সাথে সংযুক্ত করতে এবং এটি কল্পনা করার জন্য আমরা টেক্সট সেন্টিমেন্ট এনালাইসিস (যাকে মতামত খনিরও বলা হয়) ব্যবহার করি। আমাদের ইমোজি অনুভূতি বিশ্লেষণকে আরও বৈজ্ঞানিক ও কঠোর করতে আমরা প্রচুর সময়, শক্তি এবং কম্পিউটিং শক্তি ব্যয় করেছি, যাতে প্রত্যেকে মনোমুগ্ধকরতা অনুভব করতে পারে এবং ইমোজি সম্পর্কে আরও ভাল বুঝতে পারে।

ইমোজি সংবেদন বিশ্লেষণের জন্য ভিজ্যুয়াল চার্ট

ইমোজি সেন্টিমেন্ট মান হিসাবে ডেটা পাঠ্য সংবেদন বিশ্লেষণ অনুযায়ী গণনা করা হয়েছিল, যা পরিসংখ্যান এবং সম্ভাবনা তত্ত্বের অন্তর্গত। আমরা অ্যালগরিদম এবং কম্পিউটিং পাওয়ার সমস্যার সমাধান করার পরে, নতুন সমস্যার মুখোমুখি হয়েছিল: ব্যবহারকারীদের এই পেশাদার ডেটাগুলি কীভাবে বোঝা যায়?

একটা চিন্তা আমাদের মনকে অতিক্রম করে —— আরে! কিছু শীতল নকশার সাহায্যে আমরা ইমোজি সেন্টিমেন্টের মানগুলি কীভাবে ভিজ্যুয়ালাইজ করব!

;: আমরা গণনা করা এবং বিশ্লেষণ করা ডেটা (বাম) এমন একটি চার্টে রূপান্তর করি যা ব্যবহারকারীরা (ডান) আরও ভালভাবে বুঝতে পারে যা ইমোজিটির সংবেদনশীল বিভাগকে আরও স্বজ্ঞাতভাবে প্রদর্শন করতে পারে;

সুতরাং আমাকে নীচের চার্টটি ব্যাখ্যা করতে দাও, যা প্রকৃত যোগাযোগের ক্ষেত্রে ইমোজিদের অনুভূতি প্রবণতা বিশ্লেষণের ফলাফলগুলি চিত্রিত করে।

।: ইমোজি ti এর সংবেদন বিশ্লেষণের জন্য 2 ধরণের চার্ট, এখানে আমরা কেবল উপরের চার্টটি বিশ্লেষণ করি।

চিত্রের অর্ধবৃত্ত তোরণটি ইমোজি different এর বিভিন্ন সংবেদনশীল প্রবণতা উপস্থাপন করে তিনটি বর্ণে বিভক্ত 👿 আমরা দেখতে পাচ্ছি, এই তিনটি আবেগের অনুপাত প্রায় 4: 1: 5, সবুজ এবং কমলাতে সমান অনুপাত রয়েছে যার অর্থ এই ইমোজি আরও নিরপেক্ষ (আশ্চর্য !!) is

  • ধূসর কার্সার হ'ল আত্মবিশ্বাস স্তর , একটি পরিসংখ্যানগত ধারণা। এর অবস্থান এবং প্রস্থ নির্দেশ করে: Expected Value ± Confidence
  • প্রত্যাশিত মান : এটি সম্ভাব্যতা প্রকাশ করার জন্য ব্যবহৃত ইমোজি সেন্টিমেন্ট মানের ছড়িয়ে পড়া এলোমেলো ভেরিয়েবলের ওজনযুক্ত গড়, c ∈ [−1, 0, +1]
  • আত্মবিশ্বাস : এটি ইমোজি সেন্টিমেন্ট মান বিতরণের প্যারামিটার সেট, ইতিবাচক এবং নেতিবাচক ব্যবধানের আকারে যুক্তিসঙ্গত ত্রুটির পরিসীমা দেখায়। এবং কর্পাস নমুনার সংখ্যা বৃহত্তর, ত্রুটি তত কম smaller

সোজা কথায়, বাম দিকের কাছাকাছি কার্সারটি, এই ইমোজিটির আবেগটি আরও নেতিবাচক। বিপরীতে, ডান দিকে ঘনিষ্ঠ কার্সার, এই ইমোজি দ্বারা প্রকাশিত আরও ইতিবাচক আবেগ। সংক্ষিপ্ততর কার্সর হ'ল, আবেগের রায়টি আরও সঠিক।


এখন, আপনি কি ইমোজি সংবেদন বিশ্লেষণের আমাদের চার্টটি বুঝতে পারবেন?

সেন্টিমেন্ট বিশ্লেষণ কী?

আমি বিশ্বাস করি যে আপনি ইমোজিটি সেন্টিমেন্ট বিশ্লেষণের ডেটা চার্টটি বুঝতে পেরেছেন, তাই অনুভূতি বিশ্লেষণ কী তা নিয়ে কথা বলা যাক।

সেন্টিমেন্ট বিশ্লেষণকে মতামত খননও বলা হয়। প্রযুক্তিগতভাবে বলতে গেলে অনুভূতি বিশ্লেষণ প্রাকৃতিক ভাষা প্রক্রিয়াকরণের (এনএলপি) গবেষণার অংশ। অনুভূতি বিশ্লেষণ পদ্ধতিগুলি দুটি ধরণের মধ্যে বিভক্ত: মেশিন লার্নিং এবং অভিধান-ভিত্তিক পদ্ধতিগুলি । তবে গভীর শিক্ষণ প্রযুক্তির বিকাশের সাথে সংবেদন বিশ্লেষণের জন্য এই প্রযুক্তিটির ব্যবহার মূলধারায় পরিণত হয়েছে।

সংবেদন বিশ্লেষণ পদ্ধতিতে ডেটা প্রিপ্রোসেসিং, ফিচার ইঞ্জিনিয়ারিং এবং মডেল প্রশিক্ষণ অন্তর্ভুক্ত রয়েছে। সাধারণত বললে, ডেটা প্রিপ্রোসেসিং স্টেজ মূলত পাঠ্যগুলিকে শব্দের মধ্যে ভাগ করে এবং স্টপ শব্দ এবং বিরামচিহ্নগুলি সরিয়ে দেয়। তবে আমাদের অনুভূতি বিশ্লেষণ বিরাম চিহ্নগুলি এবং স্টপ শব্দগুলিকে ধরে রেখেছে। বৈশিষ্ট্য ইঞ্জিনিয়ারিং পর্যায়ে, আমরা ২০১৩ সালে গুগল দল দ্বারা প্রস্তাবিত এম্বেডিং প্রতিনিধিত্ব (ওয়ার্ড 2 ভেক) শব্দটি বেছে নিয়েছিলাম, যা সিবিডাব্লু (শব্দগুলির একটানা ব্যাগ) মডেল এবং স্কিপ-গ্রাম মডেলগুলিতে বিভক্ত। মডেল ফলাফল নিম্নলিখিত:

। The বামদিকে সিবিওউ মডেল রয়েছে, ডানদিকে স্কিপ-গ্রাম মডেল

সিবিডাব্লু ভেক্টর শব্দটি অর্জনের জন্য প্রশিক্ষিত লক্ষ্য শব্দটির পূর্বাভাসের ভিত্তিতে তৈরি। চিত্রটিতে প্রদর্শিত হিসাবে, ডাব্লু (টি) W(t-2), W(t-1), W(t+1), W(t+2) চারটি শব্দের ভিত্তিতে পূর্বাভাস দেওয়া হয়েছে; এবং স্কিপ-গ্রাম হ'ল ভেক্টরটি প্রাপ্ত প্রশিক্ষণের জন্য লক্ষ্য শব্দ অনুসারে আশেপাশের শব্দগুলির পূর্বাভাস দেওয়া। যেমন ছবিতে দেখানো ভবিষ্যদ্বাণী করা হয় W(t-2),W(t-1),W(t+1),W(t+2) ডব্লিউ (টি) অনুযায়ী।

মডেল পূর্বাভাসের পর্যায়ে আমরা তথ্যগুলিকে দুটি ভাগে বিভক্ত করি: প্রশিক্ষণ সেটটি 5: 1 অনুপাতের ভিত্তিতে বিভক্ত করা হয় এবং পরীক্ষার সেট এবং প্রশিক্ষণ সেটটি যথাযথভাবে প্রক্রিয়াজাত করা হয়।

ইমোজিতে সংবেদন বিশ্লেষণের প্রয়োগ

সেন্টিমেন্ট বিশ্লেষণ একটি বিস্তৃত বিশ্লেষণ পদ্ধতি যা গভীর শিক্ষা এবং পরিসংখ্যানকে একত্রিত করে। আমরা জটিল বিশ্লেষণ এবং ডেটা পুনরায় গণনা করার পরে ইমোজিটির সংবেদনশীল মান পেয়েছি এবং সম্পূর্ণ ইমোজি অনুভূতি বিশ্লেষণ প্রক্রিয়াটি নিম্নরূপ:

ইমোজি সেন্টিমেন্ট বিশ্লেষণের প্রক্রিয়া

  • লেবেল সামাজিক নেটওয়ার্কিং কর্পাস
  • ডেটা প্রিপ্রোসেসিং
  • ডেটাসেট ভাগ করুন: প্রশিক্ষণ সেট (80%), পরীক্ষার সেট (20%)
  • একটি মডেল তৈরি করতে LSTM নিউরাল নেটওয়ার্ক ব্যবহার করুন
  • পরীক্ষার সেটটিতে মডেলটির কর্মক্ষমতা অনুসারে, মডেলের সাধারণীকরণের দক্ষতা উন্নত করতে হাইপারপ্যারামিটারগুলি সামঞ্জস্য করুন
  • লেবেলযুক্ত ডেটাতে একই ডেটা প্রিপ্রসেসিং ক্রিয়া সম্পাদন করুন
  • লেবেলযুক্ত ডেটাতে সংবেদনশীলতার প্রবণতা পূর্বাভাস দেওয়ার জন্য প্রশিক্ষিত সংবেদন অনুমানের মডেলটি ব্যবহার করুন

আমরা ইমোজি সম্পর্কে সংবেদন বিশ্লেষণ করি এবং ইমোজি পাঠ্য সংবেদী শ্রেণিবদ্ধ পেতে প্রশিক্ষণের জন্য গভীর শিক্ষণ প্রযুক্তি ব্যবহার করি। শ্রেণিবদ্ধের আউটপুট স্তরটির জন্য, আমরা সক্রিয় করার জন্য সিগময়েড ফাংশনটি নির্বাচন করি এবং আউটপুট স্তরটির ফলাফল 0-1 এর ব্যবধানে প্রজেক্ট করি। পাঠ্যটি যত কাছাকাছি হবে, এটি তত বেশি নেতিবাচক হবে এবং এটি 1 এর নিকটবর্তী হয়, এটি তত বেশি ইতিবাচক হয়।

সিগময়েড ফাংশন সূত্রটি হ'ল: F(x)=1/(1+ex)

আমরা বিশ্লেষণ কর্পস হিসাবে ইমোজি সম্বলিত 50 মিলিয়ন টুইটের একটি বৃহত নমুনা ডেটা ব্যবহার করি, তারপরে সংবেদনের পূর্বাভাসের জন্য কর্পাসকে প্রশিক্ষিত সংবেদনশীল শ্রেণিবদ্ধে বিশ্লেষণ করা দরকার। পরিশেষে, শ্রেণিবদ্ধ দ্বারা সংবেদন অনুমানের ফলাফলগুলি তিন ধরণের মধ্যে বিভক্ত: নেতিবাচক, নিরপেক্ষ এবং ধনাত্মক। শ্রেণিবিন্যাসের মানদণ্ডগুলি হ'ল:

যাইহোক, এটা কঠিন, কিন্তু আমরা এটি তৈরি করেছি !!

ইমোজি সেন্টিমেন্ট বিশ্লেষণের ব্যবহার এবং সম্ভাবনা

সংবেদন বিশ্লেষণ বিপণন, বিজ্ঞাপন, মনোবিজ্ঞান, চিকিত্সা এবং অন্যান্য ক্ষেত্রে ব্যাপকভাবে ব্যবহৃত হয়। আমরা ইমোজিটি সেন্টিমেন্ট বিশ্লেষণ করার সিদ্ধান্ত নিয়েছি হ'ল সত্যিকারের সামাজিক মিথস্ক্রিয়ায় লোকেদের ইমোজি সম্পর্কে গভীর ধারণা পেতে, ইমোজি সম্পর্কে অস্পষ্টতা এবং ভুল বোঝাবুঝিকে আরও কার্যকরভাবে দূর করতে সহায়তা করা।

উদাহরণস্বরূপ, আপনি যখন অনলাইনে আপনার বন্ধুর (বা আপনার ক্রাশ) সাথে চ্যাট করছেন, তখন অন্য ব্যক্তি কখনও কখনও আপনাকে এমন ইমোজিস পাঠাতে পারে যা আপনি বেশ বোঝেন না। আসলে, এরকম অনেকগুলি পরিস্থিতি রয়েছে যেমন:

  • কেউ যদি আমার ছবিতে উত্তর দেয় তবে এর অর্থ কী?
  • কোনও মেয়ে আমাকে send প্রেরণ করলে এর অর্থ কী?
  • যদি আমার ক্রাশ আমাকে প্রেরণ করে ?, এটি কি ভাল লক্ষণ?

যেমনটি আমরা জানি, আপনি ইমোজিটির সঠিক অর্থ বলতে পারবেন না, তবে আমাদের সংবেদন বিশ্লেষণের মাধ্যমে আপনি এই ইমোজিগুলি মনস্তাত্ত্বিকভাবে বিশ্লেষণ করতে পারেন, "তিনি আমাকে একটি sent পাঠিয়েছিলেন, এটি একটি ইতিবাচক লক্ষণ, সম্ভবত আমার তাকে জিজ্ঞাসা করা উচিত" বা " আমার বয়ফ্রেন্ড কেন আমাকে send প্রেরণ করে? এটা একধরণের নেতিবাচক, সে কি আমার প্রতি ক্ষিপ্ত? " , এটার মতো কিছু. আমাদের ইমোজি সেন্টিমেন্ট বিশ্লেষণ সহ , আমি বিশ্বাস করি আপনি ইমোজি আরও গভীরভাবে বুঝতে পারবেন।


সব মিলিয়ে আমরা এই ইমোজিটি সেন্টিমেন্ট বিশ্লেষণ প্রকল্পের জন্য অনেক মূল্য দিয়েছি। যদিও এটি কঠিন, আমরা এখনও এটি আরও গভীর করতে চাই। আমরা এখন বিভিন্ন ভাষায় ইমোজি বিশ্লেষণ করছি, খাঁটি পাঠ্যের উপর ইমোজিগুলির আবেগগত লাভের প্রভাব এবং অন্যান্য বেশ কয়েকটি উন্নত অধ্যয়নও বিবেচনা করা হয়েছে। এগুলি হ'ল ইমোজি ব্যবহারের আরও অন্বেষণ করতে এবং আশা করি আপনি ইমোজিটি আকর্ষণীয় এবং তথ্যবহুল।