ทุกวันนี้มีการใช้อีโมจิที่เป็นประโยชน์และน่าสนใจมากขึ้นเรื่อย ๆ ตัวอย่างเช่น อิโมจิประเภทต่างๆ จะรวมกันเป็น Meme หรืออิโมจิที่ดูเหมือนไม่เกี่ยวข้องกันจริง ๆ สามารถใช้อธิบายความหมายเดียวกันได้ ซึ่งทำให้อิโมจิค่อยๆ สร้างการเชื่อมต่อระหว่าง พวกเขา. เราต้องการแสดงความสัมพันธ์ระหว่างอิโมจิด้วยสายตาและให้ผู้ใช้เข้าใจการใช้อิโมจิที่ลึกซึ้งยิ่งขึ้น ดังนั้นเราจึงใช้อัลกอริธึมการเรียนรู้ของเครื่องเพื่อคำนวณความสัมพันธ์ระหว่างอิโมจิและวาดผลลัพธ์เป็นภาพที่เข้าใจง่ายซึ่งก็คือ ความสัมพันธ์ของอิโมจิ กราฟ
กราฟความสัมพันธ์ Emoji คืออะไร?
เป็นที่ทราบกันดีอยู่แล้วว่าอิโมจิมักจะถูกนำเสนอเป็นรูปภาพ แต่เป็นไปไม่ได้ที่จะเข้าใจความสัมพันธ์ระหว่างอิโมจิกับรูปภาพ เพราะการใช้อีโมจิเป็นหลักคือการถ่ายทอดข้อมูลและอารมณ์ พวกมันจะเหมือนภาษามากกว่า ดังนั้นมันจะเป็น แม่นยำยิ่งขึ้นในการสำรวจความสัมพันธ์ผ่านความหมายและการใช้อีโมจิ ดังนั้นเราจึงได้รับ ทวีตทั้งหมดที่มีอีโมจิตั้งแต่ปี 2018 ถึง 2021 รวม 812 ล้านทวีต เมื่อพิจารณาว่าการใช้อีโมจิจะแตกต่างกันในสภาพแวดล้อมภาษาต่างๆ เราจึงจัดประเภททวีตตามภาษา จากนั้นจึงคำนวณ ความคล้ายคลึงของข้อความ ระหว่างอิโมจิในแต่ละภาษาโดยใช้อัลกอริธึมการเรียนรู้ของเครื่อง เพื่อให้ได้กราฟความสัมพันธ์ของอิโมจิที่สอดคล้องกันสำหรับแต่ละภาษา
จะเข้าใจกราฟความสัมพันธ์ของ Emoji ได้อย่างไร
นี่คือกราฟความสัมพันธ์ Emoji ของ 👉 สำหรับภาษาสเปน กล่องสีแดงแสดงอีโมจิที่ใกล้ที่สุด 9 ตัว ความยาวของรังสีแสดงระดับความสัมพันธ์ ยิ่งรังสีสั้น ความสัมพันธ์ยิ่งใกล้กัน นอกจากนี้ กราฟยังแสดงส่วนหนึ่งของกราฟความสัมพันธ์ของอีโมจิอื่นๆ ในกล่องสีดำคือกราฟความสัมพันธ์ของ 👆 และในกล่องสีส้มคือกราฟความสัมพันธ์ของ ⤵
ผลลัพธ์ที่แสดงในกราฟความสัมพันธ์ทำให้เราเข้าใจการใช้อีโมจิมากขึ้น ตัวอย่างเช่น อิโมจิสองตัวนี้ 👈 🥺 มักถูกใช้ร่วมกันกับ 👉 ในช่วงไม่กี่ปีที่ผ่านมานี้ เพื่อแสดงความไม่พอใจ เขินอาย หรืออ้อนวอน ดังนั้นอิโมจิจึงปรากฏในกราฟความสัมพันธ์นี้:
อิโมจิทั้งสองนี้มักใช้เพื่อระบุลิงก์ ซึ่งหมายความว่ามีความคล้ายคลึงในการใช้งาน จึงอยู่ใกล้กันในกราฟความสัมพันธ์:
หากคุณเจาะลึกแผนภูมิความสัมพันธ์อีโมจิ คุณอาจรีเฟรชการรับรู้ของคุณเกี่ยวกับอีโมจิบางตัว
จะคำนวณความสัมพันธ์ระหว่างอิโมจิได้อย่างไร?
ต่อไปเราจะให้คำอธิบายโดยละเอียดเกี่ยวกับกระบวนการคำนวณ สามารถแบ่งคร่าวๆ ได้เป็น 3 ขั้นตอนดังนี้
- อันดับแรก เราใช้ อัลกอริทึม TF-IDF เพื่อแยกแท็กของอีโมจิแต่ละตัวออกจากทวีตและน้ำหนักที่สอดคล้องกับแต่ละแท็ก แท็กหมายถึงคำที่เกี่ยวข้องมากที่สุดกับอีโมจิซึ่งเทียบเท่ากับลักษณะของอีโมจิ และน้ำหนักหมายถึงความใกล้ชิดของความสัมพันธ์ระหว่างแท็กและอีโมจิ ยิ่งน้ำหนักสูง ความสัมพันธ์ก็จะยิ่งใกล้ชิดกันมากขึ้น เกี่ยวกับอัลกอริทึมและกระบวนการคำนวณของการได้รับแท็ก เราได้เขียนบทความเพื่อแนะนำโดยละเอียด คุณสามารถคลิกลิงก์ขวาเพื่ออ่าน: ☁️Emoji Tag Cloud: ช่วยให้คุณได้รับความรู้เกี่ยวกับ Emoji มากขึ้น!
- หลังจากได้รับฉลากแล้วปัญหาใหม่ก็เกิดขึ้น เมื่อพูดถึงการคำนวณ เราทุกคนทราบดีว่าโดยทั่วไปแล้วสามารถคำนวณได้เฉพาะค่าตัวเลขเท่านั้น แต่แท็กจะแสดงเป็นข้อความ ดังนั้นจะคำนวณตามอัลกอริทึมได้อย่างไร ดังนั้น ขั้นตอนที่สองของเราคือการแปลงข้อความเป็นค่าตัวเลขที่สามารถคำนวณได้—— เวกเตอร์ กระบวนการนี้เรียกว่า Word Embedding เราต้องอ่านข้อมูลทวีตจำนวนมากก่อนโดยใช้ อัลกอริธึม word2vec (หนึ่งในวิธีการฝังคำ) เพื่อแปลงแต่ละคำในข้อความให้เป็นเวกเตอร์ จากนั้นเราจะได้เมทริกซ์การฝังคำที่ประกอบด้วยเวกเตอร์มิติสูงทั้งหมด ของคำ และต่อมาแมปแต่ละคำที่สัมพันธ์กับแต่ละแท็กที่เราได้รับในขั้นแรกในเวกเตอร์มิติสูง ผ่านเมทริกซ์การฝังคำ ดังนั้นเราจึงได้เสร็จสิ้นการแปลงข้อความเป็นเวกเตอร์ เวกเตอร์มิติสูงเหล่านี้คำนวณโดยการวิเคราะห์บริบทของข้อความ ซึ่งสามารถเก็บรักษาข้อมูลเชิงความหมายของแต่ละคำได้ดี และด้วยเหตุนี้จึงรับรองความถูกต้องของความคล้ายคลึงของข้อความ อัลกอริธึม word2vec มีการอธิบายอย่างละเอียดในบล็อกของเรา หากคุณต้องการรายละเอียดเพิ่มเติม คุณสามารถอ่านได้ที่: 🔍Emoji Sentiment Analysis
- ขั้นตอนสุดท้ายคือการคำนวณความคล้ายคลึงของข้อความระหว่างอิโมจิ อัลกอริทึมที่ใช้กันทั่วไปในการคำนวณความคล้ายคลึงของข้อความคือ VSM (Vector Space Model) นี่เป็นหนึ่งในแบบจำลองการคำนวณความคล้ายคลึงกันที่ใช้กันอย่างแพร่หลายมากที่สุด แต่ได้ผลลัพธ์โดยการคำนวณคำที่เกิดขึ้นร่วมกัน (คำที่ปรากฏในทั้งสองข้อความ) ของข้อความสองข้อความซึ่งไม่ถูกต้องเมื่อต้องเผชิญกับข้อความที่มีความหมายเหมือนกัน แต่ใช้คำต่างกันดังนั้น เพื่อหลีกเลี่ยงสถานการณ์นี้ เราเลือกอัลกอริทึมอื่น—— SCM(Soft Cosine Measure) มันสามารถวัดความคล้ายคลึงกันระหว่างคำ ดังนั้นแม้ว่าข้อความสองข้อความจะไม่มีคำที่เหมือนกัน อัลกอริธึมนี้สามารถคำนวณความคล้ายคลึงของข้อความสองข้อความโดยการประเมินความคล้ายคลึงของคำ หลังจากที่เราใช้ SCM เพื่อวัดเวกเตอร์ ยิ่งค่าที่เราได้รับมากเท่าใดก็ยิ่งมีความคล้ายคลึงกันของข้อความระหว่างอิโมจิมากขึ้น และยิ่งมีความคล้ายคลึงของข้อความมากเท่าใด ความสัมพันธ์ก็จะยิ่งใกล้ชิดกันมากขึ้นเท่านั้น
บทสรุป
กราฟความสัมพันธ์ช่วยให้เราเข้าใจพฤติกรรมและความชอบของผู้คนในการใช้อีโมจิ และสำรวจแนวโน้มการใช้อีโมจิได้ คุณอาจแปลกใจที่พบว่าอีโมจิบางตัวที่คุณไม่ได้เชื่อมโยงกันนั้นมีความเกี่ยวข้องกันอย่างใกล้ชิดจริง ๆ และนั่นอาจเป็นการใช้อีโมจิรูปแบบใหม่ที่คุณยังไม่เคยรู้จัก! นอกจากนี้ หากคุณมีข้อเสนอแนะใด ๆ โปรดบอกเราในความคิดเห็น!