Σήμερα δημιουργούνται όλο και περισσότερες πρακτικές και ενδιαφέρουσες χρήσεις emoji, για παράδειγμα, διαφορετικές κατηγορίες emoji θα συνδυαστούν μεταξύ τους για να γίνουν Meme, ή τα φαινομενικά άσχετα emoji μπορούν να χρησιμοποιηθούν για να περιγράψουν το ίδιο νόημα, γεγονός που κάνει τα emoji σταδιακά να δημιουργούν μια σύνδεση μεταξύ τους. Θέλουμε να δείξουμε αυτή τη σχέση μεταξύ των emoji οπτικά και να επιτρέψουμε στους χρήστες να κατανοήσουν βαθύτερα τη χρήση emoji, επομένως χρησιμοποιούμε αλγόριθμους μηχανικής εκμάθησης για να υπολογίσουμε τη σχέση μεταξύ των emoji και να σχεδιάσουμε το αποτέλεσμα σε μια εύκολα κατανοητή εικόνα, η οποία είναι η Σχέση Emoji Γράφημα .

Τι είναι το γράφημα σχέσης Emoji;

Είναι γνωστό ότι τα emoji συνήθως παρουσιάζονται ως εικόνες, αλλά είναι αδύνατο να καταλάβουμε τη σχέση μεταξύ των emoji με τις εικόνες, επειδή η κύρια χρήση των emoji είναι η μετάδοση πληροφοριών και συναισθημάτων, μοιάζουν περισσότερο με μια γλώσσα, επομένως θα είναι πιο ακριβείς για να εξερευνήσετε τη σχέση τους μέσω της σημασίας και της χρήσης των emoji. Επομένως, λάβαμε όλα τα tweets που περιέχουν emoji από το 2018 έως το 2021, συνολικά 812 εκατομμύρια tweets . Λαμβάνοντας υπόψη ότι η χρήση των emoji θα είναι διαφορετική σε διαφορετικά γλωσσικά περιβάλλοντα, ταξινομήσαμε τα tweets ανά γλώσσα και στη συνέχεια υπολογίσαμε την ομοιότητα κειμένου μεταξύ emoji σε κάθε γλώσσα με τον αλγόριθμο μηχανικής εκμάθησης, ώστε να λάβουμε το αντίστοιχο Γράφημα Σχέσεων Emoji για κάθε γλώσσα.

Πώς να κατανοήσετε το Γράφημα Σχέσεων Emoji;

Αυτό είναι το γράφημα σχέσεων Emoji του 👉 για ισπανικά. Το κόκκινο πλαίσιο δείχνει τα 9 πλησιέστερα emoji σε αυτό, το μήκος της ακτίνας αντιπροσωπεύει τον βαθμό σχέσης, όσο μικρότερη είναι η ακτίνα, τόσο πιο στενή είναι η σχέση. Επιπλέον, το γράφημα δείχνει επίσης ένα μέρος του γραφήματος σχέσεων άλλων emoji. Στο μαύρο κουτί είναι το γράφημα σχέσης του 👆 ,και στο πορτοκαλί πλαίσιο είναι το γράφημα σχέσης του .

Τα αποτελέσματα που αντικατοπτρίζονται στο γράφημα σχέσεων μας επιτρέπουν να κατανοήσουμε πιο πλούσια τη χρήση των emoji. Για παράδειγμα, αυτά τα δύο 👈 🥺 χρησιμοποιούνται συχνά ως συνδυασμός με το 👉τα τελευταία χρόνια για να εκφράσουν θλίψη, ντροπαλή ή ικεσία, επομένως εμφανίζονται σε αυτό το γράφημα σχέσης:

Αυτά τα δύο emoji χρησιμοποιούνται συχνά για να υποδείξουν συνδέσμους, πράγμα που σημαίνει ότι έχουν ομοιότητες στη χρήση, επομένως είναι κοντά το ένα στο άλλο στο γράφημα σχέσεων:

Εάν εμβαθύνετε στο γράφημα σχέσεων emoji, μπορείτε να ανανεώσετε την αντίληψή σας για ορισμένα emoji.

Πώς να υπολογίσετε τη σχέση μεταξύ των emoji;

Στη συνέχεια θα σας δώσουμε μια λεπτομερή περιγραφή της διαδικασίας υπολογισμού. Μπορεί να χωριστεί χονδρικά στα ακόλουθα τρία βήματα:

  • Αρχικά, χρησιμοποιούμε τον αλγόριθμο TF-IDF για να εξαγάγουμε τις ετικέτες κάθε emoji από τα tweets και το βάρος που αντιστοιχεί σε κάθε ετικέτα. Οι ετικέτες αναφέρονται σε εκείνες τις λέξεις που σχετίζονται στενότερα με τα emoji, οι οποίες είναι ισοδύναμες με τα χαρακτηριστικά ενός emoji. και τα βάρη αναφέρονται στην εγγύτητα της σχέσης μεταξύ ετικετών και emoji, όσο μεγαλύτερο είναι το βάρος, τόσο πιο στενή είναι η σχέση. Σχετικά με τον αλγόριθμο και τη διαδικασία υπολογισμού της λήψης ετικετών, έχουμε γράψει ένα άρθρο για να το παρουσιάσουμε λεπτομερώς, μπορείτε να κάνετε κλικ στον δεξιό σύνδεσμο για να το διαβάσετε: ☁️Emoji Tag Cloud: Σας βοηθά να αποκτήσετε περισσότερες γνώσεις για τα Emoji!
  • Μετά την απόκτηση των ετικετών, προκύπτει ένα νέο πρόβλημα. Όσον αφορά τους υπολογισμούς, όλοι γνωρίζουμε ότι γενικά μπορούν να υπολογιστούν μόνο αριθμητικές τιμές, αλλά οι ετικέτες παρουσιάζονται ως κείμενο, οπότε πώς μπορούν να υπολογιστούν αλγοριθμικά; Επομένως, το δεύτερο βήμα μας είναι να μετατρέψουμε το κείμενο στις αριθμητικές τιμές που μπορούν να υπολογιστούν—— Διάνυσμα . Αυτή η διαδικασία ονομάζεται Ενσωμάτωση Word . Πρέπει πρώτα να διαβάσουμε ένα μεγάλο αριθμό δεδομένων tweet χρησιμοποιώντας τον αλγόριθμο word2vec (μία από τις μεθόδους ενσωμάτωσης λέξεων) για να μετατρέψουμε κάθε λέξη στο κείμενο σε διάνυσμα και μετά μπορούμε να λάβουμε έναν πίνακα ενσωμάτωσης λέξης που αποτελείται από όλα τα διανύσματα υψηλών διαστάσεων λέξεων και αργότερα αντιστοιχίστε κάθε λέξη που αντιστοιχεί σε κάθε ετικέτα που πήραμε στο πρώτο βήμα σε ένα διάνυσμα υψηλών διαστάσεων μέσω της μήτρας ενσωμάτωσης λέξεων. Έτσι, ολοκληρώσαμε τη μετατροπή κειμένου σε διάνυσμα. Αυτά τα διανύσματα υψηλών διαστάσεων υπολογίζονται αναλύοντας το πλαίσιο του κειμένου, το οποίο μπορεί να διατηρήσει καλά τις σημασιολογικές πληροφορίες κάθε λέξης και έτσι να εξασφαλίσει την ακρίβεια της ομοιότητας του κειμένου. Ο αλγόριθμος word2vec εξηγείται επίσης λεπτομερώς στο ιστολόγιό μας, αν θέλετε περισσότερες λεπτομέρειες μπορείτε να τον διαβάσετε: 🔍Emoji Sentiment Analysis
  • Το τελευταίο βήμα είναι να υπολογίσετε την ομοιότητα κειμένου μεταξύ των emoji. Ο αλγόριθμος που χρησιμοποιείται συνήθως για τον υπολογισμό της ομοιότητας κειμένου είναι το VSM (Vector Space Model) . Αυτό είναι ένα από τα πιο ευρέως χρησιμοποιούμενα μοντέλα υπολογισμού ομοιότητας, αλλά λαμβάνει αποτελέσματα υπολογίζοντας συνυπάρχουσες λέξεις (λέξεις που εμφανίζονται και στα δύο κείμενα) δύο κειμένων, κάτι που δεν είναι ακριβές όταν αντιμετωπίζουμε κείμενα με την ίδια σημασία αλλά διαφορετική διατύπωση. Για να αποφύγουμε αυτήν την κατάσταση, επιλέξαμε έναν άλλο αλγόριθμο—— SCM (Soft Cosine Measure) . Μπορεί να μετρήσει την ομοιότητα μεταξύ των λέξεων, επομένως ακόμα κι αν δύο κείμενα δεν έχουν κοινές λέξεις, αυτός ο αλγόριθμος μπορεί να υπολογίσει την ομοιότητα δύο κειμένων αξιολογώντας την ομοιότητα λέξεων. Αφού χρησιμοποιήσουμε το SCM για να μετρήσουμε το διάνυσμα, όσο μεγαλύτερη είναι η τιμή που παίρνουμε σημαίνει τόσο μεγαλύτερη είναι η ομοιότητα κειμένου μεταξύ των emoji και όσο μεγαλύτερη είναι η ομοιότητα κειμένου, τόσο πιο στενή είναι η σχέση τους.

συμπέρασμα

Μέσω του γραφήματος σχέσεων, μπορούμε να κατανοήσουμε τις συνήθειες και τις προτιμήσεις των ανθρώπων στη χρήση emoji και να εξερευνήσουμε την τάση των χρήσεων emoji. Μπορεί να εκπλαγείτε όταν ανακαλύψετε ότι ορισμένα emoji που δεν θα συνδέατε μεταξύ τους είναι στην πραγματικότητα πολύ στενά συνδεδεμένα και αυτό μπορεί να είναι μια νέα μοντέρνα χρήση emoji που δεν έχετε γνωρίσει ακόμα! Επίσης, αν έχετε οποιεσδήποτε προτάσεις, πείτε μας στο σχόλιο!


Λειτουργία Μενού

Κατηγορίες

απόχρωση δέρματος

χτένισμα

γένος

Συναίσθημα

Εκδοχή