დღესდღეობით სულ უფრო და უფრო პრაქტიკული და საინტერესო emoji-ის გამოყენება იქმნება, მაგალითად, emoji-ების სხვადასხვა კატეგორიები გაერთიანდება მემად, ან ერთი და იგივე მნიშვნელობის აღსაწერად შეიძლება გამოყენებულ იქნას ერთი შეხედვით დაუკავშირებელი emoji, რაც აიძულებს emoji თანდათან შექმნას კავშირი. მათ. ჩვენ გვინდა ვიზუალურად ვაჩვენოთ ეს ურთიერთობა emoji-ს შორის და მივცეთ მომხმარებლებს ემოჯის გამოყენების უფრო ღრმა გაგება, ამიტომ ვიყენებთ მანქანური სწავლების ალგორითმებს, რათა გამოვთვალოთ კავშირი emoji-ს შორის და მივიღოთ შედეგი ადვილად გასაგებ სურათზე, რაც არის Emoji-ის ურთიერთობა. გრაფიკი .

რა არის Emoji ურთიერთობის გრაფიკი?

ცნობილია, რომ ემოციები, როგორც წესი, გამოსახულებად არის წარმოდგენილი, მაგრამ ემოჯი სურათებთან ურთიერთობის გარკვევა შეუძლებელია, რადგან ემოჯის ძირითადი გამოყენება ინფორმაციისა და ემოციების გადმოცემაა, ისინი უფრო ენას ჰგავს, ამიტომ ასე იქნება. უფრო ზუსტია მათი ურთიერთობის შესასწავლად emoji-ს მნიშვნელობისა და გამოყენების გზით. აქედან გამომდინარე, ჩვენ მივიღეთ ყველა ტვიტი, რომელიც შეიცავს emoji-ს 2018 წლიდან 2021 წლამდე, ჯამში 812 მილიონი ტვიტი . იმის გათვალისწინებით, რომ emoji-ის გამოყენება განსხვავებული იქნება სხვადასხვა ენობრივ გარემოში, ჩვენ დავახარისხეთ ტვიტები ენის მიხედვით და შემდეგ გამოვთვალეთ ტექსტის მსგავსება თითოეულ ენაზე emoji-ებს შორის მანქანური სწავლების ალგორითმის მიხედვით, რათა მივიღოთ შესაბამისი Emoji ურთიერთობის გრაფიკი თითოეული ენისთვის.

როგორ გავიგოთ Emoji ურთიერთობის გრაფიკი?

ეს არის Emoji ურთიერთობის გრაფიკი 👉 ესპანურისთვის. წითელ ველში ნაჩვენებია მასთან 9 უახლოესი emoji, სხივის სიგრძე წარმოადგენს ურთიერთობის ხარისხს, რაც უფრო მოკლეა სხივი, მით უფრო მჭიდროა ურთიერთობა. გარდა ამისა, გრაფიკი ასევე აჩვენებს სხვა ემოციების ურთიერთობის გრაფიკის ნაწილს. შავ ყუთში არის 👆 ის ურთიერთობის გრაფიკი, ხოლო ნარინჯისფერ უჯრაში არის ის ურთიერთობის გრაფიკი.

ურთიერთობების გრაფიკზე ასახული შედეგები საშუალებას გვაძლევს უფრო მდიდრულად გავიგოთ emoji-ს გამოყენება. მაგალითად, ეს ორი 👈 🥺 ხშირად გამოიყენება კომბინაციაში 👉 ბოლო წლებში, რათა გამოხატონ ნაწყენი, მორცხვი ან ვედრება, ასე რომ, ისინი ჩნდება ურთიერთობის ამ გრაფიკში:

ეს ორი ემოჯი ხშირად გამოიყენება ბმულების აღსანიშნავად, რაც ნიშნავს, რომ მათ აქვთ მსგავსება გამოყენებაში, ამიტომ ისინი ახლოს არიან ერთმანეთთან ურთიერთობის გრაფიკში:

თუ ჩაუღრმავდებით emoji-ებთან ურთიერთობის სქემას, შეგიძლიათ განაახლოთ თქვენი აღქმა ზოგიერთი emoji-ზე.

როგორ გამოვთვალოთ ურთიერთობა ემოციებს შორის?

შემდეგ ჩვენ მოგაწვდით გაანგარიშების პროცესის დეტალურ აღწერას. ის შეიძლება დაიყოს უხეშად შემდეგ სამ ეტაპად:

  • პირველ რიგში, ჩვენ ვიყენებთ TF-IDF ალგორითმს , რომ ამოვიღოთ თითოეული emoji-ის ტეგები ტვიტებიდან და თითოეული ტეგის შესაბამისი წონა. ტეგები ეხება იმ სიტყვებს, რომლებიც ყველაზე მჭიდროდ არის დაკავშირებული emoji-სთან, რომლებიც ეკვივალენტურია emoji-ის მახასიათებლების; და წონა ეხება ტეგებსა და ემოციებს შორის ურთიერთობის სიახლოვეს, რაც უფრო მაღალია წონა, მით უფრო მჭიდროა ურთიერთობა. ტეგების მიღების ალგორითმისა და გამოთვლის პროცესის შესახებ დავწერეთ სტატია მის დეტალურად გასაცნობად, წასაკითხად შეგიძლიათ დააჭიროთ მარჯვენა ბმულს: ☁️Emoji Tag Cloud: დაგეხმარებათ მიიღოთ მეტი ცოდნა Emoji-ზე!
  • ეტიკეტების მოპოვების შემდეგ ჩნდება ახალი პრობლემა. რაც შეეხება გამოთვლებს, ჩვენ ყველამ ვიცით, რომ ზოგადად მხოლოდ რიცხვითი მნიშვნელობების გამოთვლაა შესაძლებელი, მაგრამ ტეგები წარმოდგენილია ტექსტის სახით, ასე რომ, როგორ შეიძლება მათი გამოთვლა ალგორითმულად? ამიტომ, ჩვენი მეორე ნაბიჯი არის ტექსტის გადაქცევა ციფრულ მნიშვნელობებად, რომლებიც შეიძლება გამოითვალოს—— ვექტორი . ამ პროცესს Word Embedding ეწოდება. ჩვენ ჯერ უნდა წავიკითხოთ დიდი რაოდენობით tweet მონაცემები word2vec ალგორითმის (სიტყვის ჩაშენების ერთ-ერთი მეთოდი) გამოყენებით ტექსტში თითოეული სიტყვის ვექტორად გადაქცევისთვის, შემდეგ მივიღოთ სიტყვის ჩაშენების მატრიცა, რომელიც შედგება ყველა მაღალგანზომილებიანი ვექტორისგან. სიტყვების, შემდეგ კი თითოეული სიტყვის შესაბამისი თითოეული ტეგის დახატვა, რომელიც ჩვენ მივიღეთ პირველ ეტაპზე მაღალგანზომილებიან ვექტორში სიტყვის ჩაშენების მატრიცის მეშვეობით. ამრიგად, ჩვენ დავასრულეთ ტექსტიდან ვექტორად გადაქცევა. ეს მაღალგანზომილებიანი ვექტორები გამოითვლება ტექსტის კონტექსტის ანალიზით, რომელსაც შეუძლია კარგად შეინარჩუნოს თითოეული სიტყვის სემანტიკური ინფორმაცია და ამით უზრუნველყოს ტექსტის მსგავსების სიზუსტე. Word2vec ალგორითმი ასევე დეტალურად არის ახსნილი ჩვენს ბლოგში, თუ გსურთ მეტი დეტალი შეგიძლიათ წაიკითხოთ: 🔍Emoji Sentiment Analysis
  • ბოლო ნაბიჯი არის ემოჯიებს შორის ტექსტის მსგავსების გამოთვლა. ალგორითმი, რომელიც ჩვეულებრივ გამოიყენება ტექსტის მსგავსების გამოსათვლელად, არის VSM (Vector Space Model) . ეს არის ერთ-ერთი ყველაზე ფართოდ გამოყენებული მსგავსების გამოთვლის მოდელი, მაგრამ ის იღებს შედეგებს ორი ტექსტის თანხვედრილი სიტყვების (სიტყვები, რომლებიც გვხვდება ორივე ტექსტში) გამოთვლით, რაც არ არის ზუსტი, როდესაც ერთი და იგივე მნიშვნელობით, მაგრამ განსხვავებული ფორმულირებით ტექსტებს ვუყურებთ. ამ სიტუაციის თავიდან ასაცილებლად, ჩვენ ავირჩიეთ სხვა ალგორითმი - SCM (Soft Cosine Measure) . მას შეუძლია გაზომოს მსგავსება სიტყვებს შორის, ასე რომ, მაშინაც კი, თუ ორ ტექსტს არ აქვს საერთო სიტყვები, ამ ალგორითმს შეუძლია გამოთვალოს ორი ტექსტის მსგავსება სიტყვების მსგავსების შეფასებით. მას შემდეგ რაც ვიყენებთ SCM ვექტორის გასაზომად, რაც უფრო დიდ მნიშვნელობას ვიღებთ, მით უფრო მაღალია ტექსტის მსგავსება ემოჯიებს შორის და რაც უფრო მაღალია ტექსტის მსგავსება, მით უფრო მჭიდროა მათი ურთიერთობა.

დასკვნა

ურთიერთობების გრაფიკის მეშვეობით ჩვენ შეგვიძლია გავიგოთ ადამიანების ჩვევები და პრეფერენციები emoji-ს გამოყენებისას და გამოვიკვლიოთ emoji-ს გამოყენების ტენდენცია. შეიძლება გაგიკვირდეთ, როცა აღმოაჩენთ, რომ ზოგიერთი emoji, რომლებსაც არ აკავშირებთ ერთმანეთთან, რეალურად ძალიან მჭიდრო კავშირშია და ეს შეიძლება იყოს emoji-ის ახალი მოდური გამოყენება, რომელიც ჯერ არ იცით! ასევე, თუ თქვენ გაქვთ რაიმე შემოთავაზება, გთხოვთ მოგვწეროთ კომენტარებში!


ფუნქცია მენიუ

emoji კატეგორიები

emoji კანის ფერი

emoji თმის სტილი

emoji სქესი

emoji გრძნობა

emoji ვერსია