Biểu tượng cảm xúc chứa đầy cảm xúc. Nó có thể nâng cao hoặc điều chỉnh âm điệu và tâm trạng của văn bản, đồng thời, cảm xúc được thể hiện bằng biểu tượng cảm xúc có thể rõ ràng hơn chỉ bằng lời nói.

Ví dụ: biểu tượng cảm xúc này 👿 (khuôn mặt giận dữ với sừng). Rõ ràng là nó ở dạng một nhân vật ma quỷ, vì vậy có thể có những suy nghĩ coi đó là một biểu tượng cảm xúc "xấu", giống như một số ý nghĩ xấu xa trong đầu của ai đó.

Tuy nhiên, kiểu mô tả này rất trừu tượng. Do đó, chúng ta có thể hình dung các loại và mức độ tình cảm được thể hiện bởi những biểu tượng cảm xúc này không?


Câu trả lời là "Có" tất nhiên! Chúng tôi đã thực hiện Xử lý ngôn ngữ tự nhiên (NLP) trên các mẫu công khai của không dưới 50 triệu tweet và chúng tôi sử dụng Phân tích cảm xúc văn bản (còn gọi là khai thác ý kiến) để liên kết cảm xúc biểu tượng cảm xúc với một bộ giá trị và hình dung nó. Chúng tôi đã dành rất nhiều thời gian, năng lượng và khả năng tính toán để làm cho phân tích cảm xúc biểu tượng cảm xúc của chúng tôi trở nên khoa học và chặt chẽ hơn, để mọi người có thể cảm nhận được sức hấp dẫn và hiểu rõ hơn về biểu tượng cảm xúc.

Biểu đồ trực quan để phân tích tình cảm biểu tượng cảm xúc

Dữ liệu như giá trị tình cảm biểu tượng cảm xúc được tính toán theo phân tích cảm xúc văn bản, thuộc về thống kê và lý thuyết xác suất. Sau khi chúng tôi giải quyết được vấn đề về thuật toán và khả năng tính toán, thì lại gặp phải khó khăn mới: làm thế nào để người dùng hiểu được những dữ liệu chuyên nghiệp này?

Một ý nghĩ lướt qua tâm trí chúng ta—— Này! Làm thế nào về việc chúng tôi hình dung các giá trị tình cảm của biểu tượng cảm xúc với một số thiết kế thú vị!

💡: Chúng tôi đã chuyển đổi dữ liệu được tính toán và phân tích (bên trái) thành một biểu đồ mà người dùng có thể hiểu rõ hơn (bên phải), có thể hiển thị trực quan hơn sự phân chia cảm xúc của biểu tượng cảm xúc;

Vì vậy, hãy để tôi giải thích biểu đồ sau, mô tả kết quả phân tích xu hướng tình cảm của biểu tượng cảm xúc trong giao tiếp thực tế.

💡: 2 loại biểu đồ để phân tích tình cảm của emoji 👿, ở đây chúng tôi chỉ phân tích biểu đồ trên.

Vòng cung hình bán nguyệt trong hình được chia thành ba màu, đại diện cho các khuynh hướng cảm xúc khác nhau của biểu tượng cảm xúc 👿 . Như chúng ta có thể thấy, tỷ lệ của ba cảm xúc này là khoảng 4: 1: 5, màu xanh lá cây và màu cam có tỷ lệ tương tự, có nghĩa là biểu tượng cảm xúc này là một biểu tượng trung tính hơn (ngạc nhiên !!).

  • Con trỏ màu xám là Mức độ tin cậy , một khái niệm thống kê. Vị trí và chiều rộng của nó cho biết: Expected Value ± Confidence .
  • Giá trị mong đợi : Là giá trị trung bình có trọng số của các biến ngẫu nhiên phân tán của giá trị cảm xúc biểu tượng cảm xúc, được sử dụng để biểu thị xác suất, c ∈ [−1, 0, +1] .
  • Độ tin cậy : Đây là bộ thông số phân bố giá trị cảm xúc của biểu tượng cảm xúc, hiển thị phạm vi sai số hợp lý dưới dạng khoảng âm và dương. Và số lượng mẫu ngữ liệu càng lớn thì sai số càng nhỏ.

Nói một cách đơn giản, con trỏ càng gần bên trái, cảm xúc của biểu tượng cảm xúc này càng tiêu cực. Ngược lại, con trỏ càng gần bên phải, biểu tượng cảm xúc này càng thể hiện cảm xúc tích cực hơn. Và con trỏ càng hẹp thì phán đoán của cảm xúc càng chính xác.


Bây giờ, bạn có thể hiểu biểu đồ phân tích tình cảm biểu tượng cảm xúc của chúng tôi không?

Phân tích cảm xúc là gì?

Tôi tin rằng bạn đã hiểu được biểu đồ dữ liệu của phân tích tình cảm biểu tượng cảm xúc, vì vậy hãy nói về phân tích tình cảm là gì.

Phân tích cảm xúc còn được gọi là khai thác ý kiến. Về mặt kỹ thuật, phân tích cảm xúc là một phần của nghiên cứu xử lý ngôn ngữ tự nhiên (NLP). Phương pháp phân tích cảm xúc được chia thành hai loại: Máy họcPhương pháp dựa trên từ điển . Nhưng với sự phát triển của công nghệ học sâu, việc sử dụng công nghệ này để phân tích tình cảm đã trở thành xu hướng chủ đạo.

Quá trình phân tích tình cảm bao gồm tiền xử lý dữ liệu, kỹ thuật tính năng và đào tạo mô hình. Nói chung, giai đoạn tiền xử lý dữ liệu chủ yếu chia văn bản thành các từ và loại bỏ các từ dừng và dấu chấm câu. Tuy nhiên, phân tích tình cảm của chúng tôi vẫn giữ lại các dấu câu và các từ dừng. Trong giai đoạn kỹ thuật tính năng, chúng tôi đã chọn đại diện nhúng từ (Word2Vec) do nhóm Google đề xuất vào năm 2013, được chia thành mô hình CBOW (túi từ liên tục) và mô hình Skip-gram . Kết quả mô hình như sau:

💡 : Bên trái là mô hình CBOW, bên phải là mô hình Skip-gram

CBOW dựa trên ngữ cảnh để dự đoán từ mục tiêu cần luyện để có được vector từ. Như trong hình, W (t) được dự đoán dựa trên bốn từ W(t-2), W(t-1), W(t+1), W(t+2) ; Còn bỏ qua gam là dự đoán các từ xung quanh theo từ mục tiêu cần luyện để thu được véc tơ từ. Như trong hình là dự đoán W(t-2),W(t-1),W(t+1),W(t+2) theo W (t) .

Trong giai đoạn dự đoán mô hình, chúng tôi chia dữ liệu thành hai phần: Tập huấn luyện được chia theo tỷ lệ 5: 1 và tập kiểm tra và tập huấn luyện được xử lý không theo thứ tự.

Ứng dụng phân tích tình cảm trong biểu tượng cảm xúc

Phân tích cảm xúc là một phương pháp phân tích toàn diện kết hợp giữa học sâu và thống kê. Chúng tôi đã thu được giá trị tình cảm của biểu tượng cảm xúc sau khi phân tích phức tạp và tính toán hàng loạt dữ liệu và quy trình phân tích cảm xúc biểu tượng cảm xúc hoàn chỉnh như sau:

Quá trình phân tích cảm xúc biểu tượng cảm xúc

  • Gắn nhãn kho dữ liệu mạng xã hội
  • Xử lý trước dữ liệu
  • Chia bộ dữ liệu: Bộ đào tạo (80%), Bộ kiểm tra (20%)
  • Sử dụng mạng nơ-ron LSTM để xây dựng mô hình
  • Theo hiệu suất của mô hình trên bộ thử nghiệm, điều chỉnh các siêu tham số để cải thiện khả năng tổng quát hóa của mô hình
  • Thực hiện cùng một hành động xử lý trước dữ liệu trên dữ liệu chưa được gắn nhãn
  • Sử dụng mô hình dự đoán tâm lý đã được đào tạo để dự đoán xu hướng tình cảm trên dữ liệu không được gắn nhãn

Chúng tôi thực hiện phân tích tình cảm trên biểu tượng cảm xúc và sử dụng công nghệ học sâu để đào tạo để có được bộ phân loại tình cảm văn bản biểu tượng cảm xúc. Đối với lớp đầu ra của bộ phân loại, chúng tôi chọn chức năng sigmoid để kích hoạt và chiếu kết quả của lớp đầu ra vào khoảng 0-1. Văn bản càng gần 0, nó càng âm, và càng gần 1, nó càng dương.

Công thức hàm sigmoid là: F(x)=1/(1+ex)

Chúng tôi sử dụng dữ liệu mẫu lớn gồm 50 triệu tweet có chứa biểu tượng cảm xúc làm kho dữ liệu phân tích, sau đó đưa kho dữ liệu cần phân tích vào bộ phân loại tình cảm được đào tạo để dự đoán tình cảm. Cuối cùng, kết quả dự đoán tình cảm của bộ phân loại được chia thành ba loại: tiêu cực, trung tính và tích cực. Các tiêu chí phân loại là:

Dù sao thì cũng khó, nhưng chúng tôi đã làm được !!

Việc sử dụng và triển vọng của Phân tích cảm xúc biểu tượng cảm xúc

Phân tích cảm xúc được sử dụng rộng rãi trong tiếp thị, quảng cáo, tâm lý học, y tế và các lĩnh vực khác. Chúng tôi quyết định phân tích tình cảm biểu tượng cảm xúc là để giúp mọi người hiểu sâu hơn về biểu tượng cảm xúc trong tương tác xã hội thực tế, loại bỏ sự mơ hồ và hiểu lầm về biểu tượng cảm xúc một cách hiệu quả hơn.

Ví dụ: khi bạn đang trò chuyện trực tuyến với bạn bè (hoặc người yêu của bạn), người kia đôi khi có thể gửi cho bạn những biểu tượng cảm xúc mà bạn không hiểu lắm. Trên thực tế, có rất nhiều tình huống như thế này, chẳng hạn như:

  • 🤒 có nghĩa là gì nếu ai đó trả lời ảnh của tôi?
  • Điều đó có nghĩa là gì khi một cô gái gửi 😊 cho tôi?
  • Nếu người yêu của tôi gửi cho tôi , đó có phải là một dấu hiệu tốt?

Như chúng ta đã biết, bạn không thể nói chính xác ý nghĩa của một biểu tượng cảm xúc, tuy nhiên, thông qua phân tích tình cảm của chúng tôi, bạn có thể phân tích tâm lý những biểu tượng cảm xúc này, chẳng hạn như "cô ấy đã gửi cho tôi một 💞, đó là một dấu hiệu tích cực, có lẽ tôi nên rủ cô ấy đi chơi" hoặc " Tại sao bạn trai của tôi lại gửi cho tôi một 😒? Đó là một loại tiêu cực, anh ấy có giận tôi không? " , một cái gì đó như thế này. Với Phân tích cảm xúc biểu tượng cảm xúc của chúng tôi, tôi tin rằng bạn có thể hiểu sâu hơn về biểu tượng cảm xúc.


Nói chung, chúng tôi đã phải trả rất nhiều cho dự án phân tích tình cảm biểu tượng cảm xúc này. Dù khó nhưng chúng tôi vẫn muốn làm sâu hơn. Hiện chúng tôi đang phân tích biểu tượng cảm xúc bằng các ngôn ngữ khác nhau, hiệu ứng tăng cảm xúc của biểu tượng cảm xúc trên văn bản thuần túy và một số nghiên cứu nâng cao khác cũng đã được xem xét. Tất cả những điều này là để khám phá thêm cách sử dụng biểu tượng cảm xúc và hy vọng bạn thấy biểu tượng cảm xúc thú vị và nhiều thông tin.

Tìm kiếm gần đây Gần đây Không sử dụng biểu tượng cảm xúc nào gần đây biểu tượng cảm xúc... Biểu tượng cảm xúc thành công