Gom cụm bài báo theo chủ đề

PhoBERT, phân loại văn bản, tiền xử lý, softmax

Các tác giả

  • Nguyễn Lê Minh Hòa VBTech
  • Trần Văn Lăng

Tóm tắt

Trong hội nghị khoa học, Ban tổ chức chương trình phải dành thời gian để chọn lọc, sắp xếp chủ đề vào từng phiên hợp phù hợp. Với số lượng bài gửi về tham dự vô cùng lớn, việc sử dụng công cụ để giúp tối ưu hóa thời gian thực hiện công việc là việc cần thiết. Phạm vi của bài báo này được thực hiện dựa vào việc Gom cụm bài báo khoa học dựa vào mô hình học sâu PhoBERT được thử nghiệm trên bộ dữ liệu của hội nghị khoa học FAIR. Kết quả thử nghiệm cho thấy, PhoBERT cho kết quả trên bộ dữ liệu bài báo của hội nghị FAIR với F1-score là 100%.

Tải xuống

Đã Xuất bản

30-08-2023

Cách trích dẫn

Nguyễn, H., & Trần, V. L. (2023). Gom cụm bài báo theo chủ đề: PhoBERT, phân loại văn bản, tiền xử lý, softmax. Tạp Chí Khoa học HUFLIT, 7(4), 19. Truy vấn từ https://hjs.huflit.edu.vn/index.php/hjs/article/view/147

Số

Chuyên mục

Bài viết

##category.category##