Vietnamese sentiment analysis on social media based on BERT architecture
Từ khóa:
Sentiment analysis, Social media, PhoBERT, ViBERT, ViBERT4News, XLM-RoBERTa,, LSTM, SVMTóm tắt
Nghiên cứu này thực hiện đánh giá so sánh hiệu quả của mô hình trong nhiệm vụ phân tích cảm xúc tiếng Việt: ViBERT4News, PhoBERT, XLM-RoBERTa, ViBERT, SVM và LSTM. Dữ liệu nghiên cứu bao gồm 10.169 mẫu được thu thập từ các bài đăng và bình luận trên trang Facebook liên quan đến sinh viên Phân hiệu tại Tp. HCM, Trường Đại học Giao thông vận tải, được gán nhãn thủ công thành ba loại: tích cực (33,5%), tiêu cực (36,3%) và trung lập (33,9%). Kết quả thực nghiệm cho thấy các mô hình dựa trên kiến trúc Transformer vượt trội so với phương pháp truyền thống, với ViBERT4News đạt hiệu suất cao nhất (độ chính xác 90,1%), tiếp theo là PhoBERT (89,12%). Tuy nhiên, PhoBERT thể hiện khả năng tổng quát hóa tốt hơn do có sự cân bằng giữa training loss và validation loss, phù hợp cho triển khai ứng dụng thực tế. Nghiên cứu không chỉ cung cấp phân tích toàn diện về khả năng ứng dụng các mô hình ngôn ngữ hiện đại trong phân tích cảm xúc cho dữ liệu mạng xã hội tiếng Việt, mà còn phát triển hệ thống trực quan hóa giúp nhà trường theo dõi và phản ứng kịp thời với phản hồi của sinh viên, từ đó cải thiện chất lượng đào tạo.
