ယနေ့ခေတ်တွင် လက်တွေ့ကျပြီး စိတ်ဝင်စားစရာကောင်းသော အီမိုဂျီအသုံးပြုမှုများ ပိုမိုဖန်တီးလာပါသည်၊ ဥပမာ၊ ကွဲပြားခြားနားသော အီမိုဂျီအမျိုးအစားများကို Meme တစ်ခုဖြစ်လာစေရန် အတူတကွပေါင်းစပ်သွားပါမည်၊ သို့မဟုတ် မသက်ဆိုင်ဟုထင်ရသော အီမိုဂျီများကို တူညီသောအဓိပ္ပာယ်ကိုဖော်ပြရန် အမှန်တကယ်အသုံးပြုနိုင်သည်၊ ၎င်းသည် အီမိုဂျီများကြားတွင် ချိတ်ဆက်မှုကို တဖြည်းဖြည်းဖန်တီးပေးမည်ဖြစ်သည်။ သူတို့ကို။ အီမိုဂျီကြားရှိ ဆက်ဆံရေးကို အမြင်အာရုံဖြင့် ပြသလိုပြီး အီမိုဂျီအသုံးပြုမှုကို ပိုမိုနက်ရှိုင်းစွာ နားလည်နိုင်စေရန် သုံးစွဲသူများအား အီမိုဂျီဆိုင်ရာ ဆက်စပ်မှုကို တွက်ချက်ရန် စက်သင်ယူမှု အယ်လဂိုရီသမ်များကို အသုံးပြုကာ ရလဒ်ကို နားလည်ရလွယ်ကူသော ရုပ်ပုံအဖြစ်သို့ ဆွဲထုတ်ကာ Emoji Relationship ဖြစ်သည်။ ဂရပ်ဖစ်
Emoji Relationship Graph ဆိုတာ ဘာလဲ။
Emojis များကို များသောအားဖြင့် ရုပ်ပုံများအဖြစ် ဖော်ပြကြသည်ကို ကောင်းစွာသိရှိထားသော်လည်း Emoji များသည် ရုပ်ပုံများနှင့် emoji များကြား ဆက်စပ်မှုကို ပုံဖော်ရန် မဖြစ်နိုင်သောကြောင့် Emoji ၏ အဓိကအသုံးပြုမှုသည် သတင်းအချက်အလက်နှင့် စိတ်ခံစားမှုများကို ဖော်ပြရန်ဖြစ်ပြီး ၎င်းတို့သည် ဘာသာစကားတစ်ခုနှင့် ပို၍တူသောကြောင့် ဖြစ်လိမ့်မည်။ အီမိုဂျီ၏ အဓိပ္ပာယ်နှင့် အသုံးပြုမှုများမှတစ်ဆင့် ၎င်းတို့၏ ဆက်ဆံရေးကို စူးစမ်းရန် ပိုမိုတိကျသည်။ ထို့ကြောင့် ကျွန်ုပ်တို့သည် 2018 မှ 2021 ခုနှစ်အတွင်း အီမိုဂျီပါရှိသော tweets အားလုံးကို ရရှိခဲ့ပြီး စုစုပေါင်း 812 သန်း tweets များရှိသည်။ Emoji ၏အသုံးပြုမှုသည် မတူညီသောဘာသာစကားပတ်ဝန်းကျင်တွင် ကွဲပြားမည်ဟုယူဆသဖြင့်၊ ကျွန်ုပ်တို့သည် tweets များကို ဘာသာစကားအလိုက်ခွဲခြားပြီး ဘာသာစကား တစ်ခုစီရှိ emoji များကြားရှိ စာသား တူညီမှုကို machine learning algorithm ဖြင့်တွက်ချက်ကာ ဘာသာစကားတစ်ခုစီအတွက်သက်ဆိုင်ရာ Emoji Relationship Graph ကိုရရန်အတွက် ဘာသာစကားတစ်ခုစီ၏ Emoji Relationship Graph ကိုရရှိရန်အတွက်ဖြစ်သည်။
Emoji Relationship Graph ကို ဘယ်လိုနားလည်နိုင်မလဲ။
ဤသည်မှာ စပိန်အတွက် 👉 ၏ အီမိုဂျီဆက်ဆံရေးဂရပ်ဖစ်ဖြစ်သည်။ အနီရောင်အကွက်သည် ၎င်းနှင့်အနီးဆုံး အီမိုဂျီ 9 ခုကိုပြသသည်၊ ဓာတ်ရောင်ခြည်၏အရှည်သည် ဆက်နွယ်မှုအတိုင်းအတာကို ကိုယ်စားပြုသည်၊ ဓာတ်မှန်ရိုက်မှုတိုလေ၊ ဆက်ဆံရေးပိုမိုနီးကပ်လေဖြစ်သည်။ ထို့အပြင်၊ ဂရပ်သည် အခြားသော အီမိုဂျီ၏ ဆက်နွယ်မှုဂရပ်၏ အစိတ်အပိုင်းကိုလည်း ပြသထားသည်။ အနက်ရောင်သေတ္တာတွင် 👆 ဆက်ဆံရေးဂရပ်ဖစ်သည်၊ လိမ္မော်ရောင်ဘောက်စ်တွင် ⤵ ဆက်ဆံရေးဂရပ်ဖစ်ပါသည်။
ဆက်ဆံရေးဂရပ်တွင် ရောင်ပြန်ဟပ်သည့်ရလဒ်များက ကျွန်ုပ်တို့အား အီမိုဂျီအသုံးပြုမှုအပေါ် ပိုမိုနားလည်သဘောပေါက်လာစေပါသည်။ ဥပမာအားဖြင့်၊ ဤ emojis နှစ်ခု 👈 🥺 👉မကြာသေးမီနှစ်များအတွင်း ဝမ်းနည်းခြင်း ၊ ရှက်ရွံ့ခြင်း သို့မဟုတ် တောင်းပန်ခြင်းများကို ဖော်ပြရန်အတွက် နှင့် ပေါင်းစပ်ထားသောကြောင့် ၎င်းတို့ကို ဤဆက်ဆံရေးဂရပ်တွင် ပေါ်လာသည်-
ဤအီမိုဂျီနှစ်ခုသည် လင့်ခ်များကိုညွှန်ပြရန် မကြာခဏအသုံးပြုလေ့ရှိသည်၊ ဆိုလိုသည်မှာ ၎င်းတို့သည် အသုံးပြုမှုတွင် တူညီမှုများရှိသောကြောင့် ၎င်းတို့သည် ဆက်ဆံရေးဂရပ်တွင် တစ်ခုနှင့်တစ်ခု နီးကပ်နေပါသည်။
အီမိုဂျီဆက်ဆံရေးဇယားကို စေ့စေ့စပ်စပ်လေ့လာပါက၊ အချို့သော အီမိုဂျီများအပေါ် သင့်ခံယူချက်အား ပြန်လည်ဆန်းသစ်နိုင်မည်ဖြစ်သည်။
အီမိုဂျီများကြား ဆက်စပ်မှုကို မည်သို့ တွက်ချက်ရမည်နည်း။
နောက်တစ်ခုကတော့ တွက်နည်းအသေးစိတ် ဖော်ပြချက်တစ်ခု ပေးပါမယ်။ ၎င်းကို အောက်ပါ အဆင့်သုံးဆင့်ဖြင့် အကြမ်းဖျင်း ပိုင်းခြားနိုင်ပါသည်။
- ဦးစွာ၊ ကျွန်ုပ်တို့သည် tweets တစ်ခုစီမှ အီမိုဂျီတစ်ခုစီ၏ တဂ်များနှင့် တဂ်တစ်ခုစီအတွက် အလေးချိန်ကို ထုတ်ယူရန် TF-IDF algorithm ကို အသုံးပြုပါသည်။ တဂ်များသည် အီမိုဂျီနှင့် အနီးစပ်ဆုံးဆက်စပ်နေသည့် စကားလုံးများကို ရည်ညွှန်းသည်၊ အီမိုဂျီ၏လက္ခဏာများနှင့် ညီမျှသည်၊ နှင့် အလေးများသည် တဂ်များနှင့် အီမိုဂျီတို့ကြား ဆက်နွယ်မှု၏ နီးကပ်မှုကို ရည်ညွှန်းသည်၊ အလေးချိန် ပိုများလေ၊ ဆက်ဆံရေး ပိုနီးစပ်လေ ဖြစ်သည်။ တဂ်များရယူခြင်းဆိုင်ရာ အယ်လဂိုရီသမ်နှင့် တွက်ချက်မှုလုပ်ငန်းစဉ်များအကြောင်း၊ အသေးစိတ်မိတ်ဆက်ရန် ဆောင်းပါးတစ်ပုဒ်ကို ကျွန်ုပ်တို့ရေးသားထားပြီး၊ ၎င်းကိုဖတ်ရှုရန် ညာဘက်လင့်ခ်ကို သင်နှိပ်နိုင်သည်- ☁️Emoji Tag Cloud- Emoji ဆိုင်ရာ အသိပညာပိုမိုရရှိရန် သင့်အား ကူညီပါ။
- တံဆိပ်များရရှိပြီးနောက်၊ ပြဿနာအသစ်တစ်ခုပေါ်လာသည်။ တွက်ချက်မှုများနှင့်ပတ်သက်လာလျှင် ယေဘူယျအားဖြင့် ဂဏန်းတန်ဖိုးများကိုသာ တွက်ချက်နိုင်သည်ကို ကျွန်ုပ်တို့အားလုံးသိကြပြီးဖြစ်သော်လည်း tags များကို စာသားအဖြစ်တင်ပြထားသောကြောင့် ၎င်းတို့ကို အယ်လဂိုရီသမ်နည်းဖြင့် မည်သို့တွက်ချက်နိုင်မည်နည်း။ ထို့ကြောင့်၊ ကျွန်ုပ်တို့၏ ဒုတိယအဆင့်မှာ စာသားကို တွက်ချက်နိုင်သော ကိန်း ဂဏာန်း တန်ဖိုးများ— Vector . ဤလုပ်ငန်းစဉ်ကို Word Embedding ဟုခေါ်သည်။ စာလုံးတစ်လုံးစီကို vector အဖြစ်ပြောင်းလဲရန် word2vec algorithm (စကားလုံးထည့်သွင်းခြင်းနည်းလမ်းများထဲမှတစ်ခု) ကိုအသုံးပြု၍ tweet ဒေတာအများအပြားကို ဦးစွာဖတ်ရှုရန်လိုအပ်ပြီး မြင့်မားသောဘက်မြင် vector များပါ၀င်သည့် မက်ထရစ်ကို စာလုံးတစ်လုံးစီကို ရရှိနိုင်မည်ဖြစ်သည်။ စကားလုံးများ၏နောက်တွင်၊ ကျွန်ုပ်တို့ ပထမအဆင့်တွင် ကျွန်ုပ်တို့ရရှိသော tag တစ်ခုစီနှင့် သက်ဆိုင်သည့် စကားလုံးတစ်လုံးစီကို မက်ထရစ်ကို ထည့်သွင်းခြင်းဖြင့် အမြင့်ဘက်မြင် vector သို့ မြေပုံဆွဲပါ။ ထို့ကြောင့်၊ ကျွန်ုပ်တို့သည် text-to-vector ပြောင်းလဲခြင်းကို ပြီးမြောက်ခဲ့ပါသည်။ စကားလုံးတစ်လုံးစီ၏ အနှစ်သာရအချက်အလက်များကို ကောင်းစွာထိန်းသိမ်းထားနိုင်ပြီး စာသားဆင်တူခြင်း၏တိကျမှုကို သေချာစေသည့် ဤရွေ့လျားမှုမြင့်မားသော vector များကို စာသား၏အကြောင်းအရာကို ပိုင်းခြားစိတ်ဖြာခြင်းဖြင့် တွက်ချက်ပါသည်။ word2vec algorithm ကိုလည်း ကျွန်ုပ်တို့၏ဘလော့ဂ်တွင် အသေးစိတ်ရှင်းပြထားပြီး၊ အသေးစိတ်အချက်အလက်များကို သင်ဖတ်ရှုနိုင်သည်- 🔍 Emoji Sentiment Analysis
- နောက်ဆုံးအဆင့်မှာ emojis များကြားတွင် စာသားဆင်တူမှုကို တွက်ချက်ရန်ဖြစ်သည်။ စာသားဆင်တူယိုးမှားကို တွက်ချက်ရာတွင် အသုံးများသော algorithm မှာ VSM (Vector Space Model) ဖြစ်သည်။ ၎င်းသည် အသုံးများဆုံး ဆင်တူယိုးမှား တွက်ချက်မှုပုံစံများထဲမှ တစ်ခုဖြစ်သော်လည်း၊ ၎င်းသည် စာသားနှစ်ခုလုံးတွင် ပူးတွဲဖြစ်ပေါ်နေသော စကားလုံးများ (စာသားနှစ်ခုလုံးတွင် ပေါ်လာသည့် စကားလုံးများ) ကို တွက်ချက်ခြင်းဖြင့် ရလဒ်များကို ရရှိပါသည်။ ထို့ကြောင့် အဓိပ္ပါယ်တူသော်လည်း ကွဲပြားသော စကားလုံးများဖြင့် စာသားများကို ရင်ဆိုင်ရသည့်အခါ မတိကျပါ။ ဤအခြေအနေကိုရှောင်ရှားရန်၊ ကျွန်ုပ်တို့သည် အခြားသော algorithm— SCM(Soft Cosine Measure) ကို ရွေးချယ်ခဲ့သည်။ ၎င်းသည် စကားလုံးများကြား တူညီမှုကို တိုင်းတာနိုင်သည်၊ ထို့ကြောင့် စာသားနှစ်ခုတွင် တူညီသောစကားလုံးများမရှိလျှင်ပင်၊ ဤ algorithm သည် စကားလုံးဆင်တူကြောင်းကို အကဲဖြတ်ခြင်းဖြင့် စာသားနှစ်ခု၏တူညီမှုကို တွက်ချက်နိုင်သည်။ vector ကိုတိုင်းတာရန် SCM ကိုအသုံးပြုပြီးနောက်၊ ကျွန်ုပ်တို့ရရှိသည့်တန်ဖိုးသည် ကြီးမားလေလေ အီမိုဂျီများကြားတွင် စာသားဆင်တူမှု မြင့်မားလေ၊ စာသားဆင်တူမှု မြင့်မားလေ၊ ၎င်းတို့၏ ဆက်ဆံရေးသည် ပိုမိုနီးစပ်လေဖြစ်သည်။
နိဂုံး
ဆက်နွယ်မှုဂရပ်ဖြင့် ကျွန်ုပ်တို့သည် အီမိုဂျီအသုံးပြုခြင်း၏ အလေ့အထနှင့် နှစ်သက်မှုများကို နားလည်နိုင်ပြီး အီမိုဂျီအသုံးပြုမှုလမ်းကြောင်းကို စူးစမ်းလေ့လာနိုင်ပါသည်။ သင်တစ်ဦးနှင့်တစ်ဦး မပေါင်းဖက်နိုင်သော အချို့သော အီမိုဂျီများသည် အမှန်တကယ် အလွန်နီးကပ်စွာ ဆက်စပ်နေကြောင်း တွေ့ရှိရခြင်းဖြစ်ပြီး ၎င်းသည် သင်မသိသေးသော ခေတ်မီသော အီမိုဂျီအသုံးပြုမှုအသစ်တစ်ခုဖြစ်နိုင်သည် ။ ထို့အပြင်၊ သင့်တွင်အကြံပြုချက်များရှိပါက၊ ကျွန်ုပ်တို့ကို comment တွင်ပြောပြပါ။