Gom cụm bài báo theo chủ đề
PhoBERT, phân loại văn bản, tiền xử lý, softmax
Abstract
Trong hội nghị khoa học, Ban tổ chức chương trình phải dành thời gian để chọn lọc, sắp xếp chủ đề vào từng phiên hợp phù hợp. Với số lượng bài gửi về tham dự vô cùng lớn, việc sử dụng công cụ để giúp tối ưu hóa thời gian thực hiện công việc là việc cần thiết. Phạm vi của bài báo này được thực hiện dựa vào việc Gom cụm bài báo khoa học dựa vào mô hình học sâu PhoBERT được thử nghiệm trên bộ dữ liệu của hội nghị khoa học FAIR. Kết quả thử nghiệm cho thấy, PhoBERT cho kết quả trên bộ dữ liệu bài báo của hội nghị FAIR với F1-score là 100%.