Evaluating GPT-OSS-20B Model for Hate Speech Detection: Advances in Parameter-Efficient Adaptation

Các tác giả

  • Quang Hong Le quanglh@huflit.edu.vn
  • Tan Khoa Huynh Ly
  • Thanh Le

Tóm tắt

Việc phát hiện nội dung thù ghét tiếp tục đặt ra các thách thức về phương pháp do sự mơ hồ trong gán nhãn, sự mất cân bằng lớp và và yêu cầu phân biệt chi tiết giữa các biểu đạt mang tính xúc phạm và mang tính thù hận. Nghiên cứu này thực hiện một phương pháp điều chỉnh tiết kiệm tham số cho một mô hình ngôn ngữ lớn quy mô 20 tỷ tham số nhằm thực hiện phân loại nội dung thù ghét ba lớp. Cách tiếp cận đề xuất hợp nhất các quyết định của người gán nhãn thành một nhãn duy nhất cho mỗi mẫu, áp dụng lấy mẫu cân bằng để giảm mức độ thưa thớt của lớp thiểu số, và tích hợp các mẫu chỉ dẫn cùng siêu dữ liệu dựa trên mức độ đồng thuận nhằm ổn định dự đoán trong các trường hợp mơ hồ giữa các lớp. Mô hình sau điều chỉnh được đánh giá đối sánh với các mô hình nền dựa trên transformer encoder và các cấu hình mô hình ngôn ngữ lớn theo hướng prompting. Kết quả cho thấy hệ thống được tinh chỉnh đạt macro F1-score 80.66% và độ chính xác 83.37%, vượt trội hơn so với tất cả các mô hình nền so sánh, với mức cải thiện đặc biệt mạnh ở hạng mục Hate Speech. Phân tích bổ sung về mức sử dụng tính toán cho thấy mô hình được tinh chỉnh vận hành trong điều kiện tài nguyên ở mức vừa phải. Các kết quả này cho thấy điều chỉnh tiết kiệm tham số theo hướng gọn nhẹ là một lựa chọn khả thi cho phân loại nội dung thù ghét chi tiết khi việc finetuning toàn phần các mô hình ngôn ngữ lớn không khả thi.

Tiểu sử của Tác giả

Quang Hong Le, quanglh@huflit.edu.vn

Lê Hồng Quang tốt nghiệp chuyên ngành Hệ thống thông tin thuộc ngành Công nghệ thông tin tại Trường Đại học Ngoại ngữ - Tin học TP. Hồ Chí Minh (HUFLIT), Việt Nam vào năm 2021. Anh đang là học viên cao học ngành Công nghệ thông tin tại HUFLIT. Hiện anh đang công tác tại Phòng Chính trị - Công tác sinh viên HUFLIT. Lĩnh vực nghiên cứu, quan tâm bao gồm: ứng dụng công nghệ trí tuệ nhân tạo (AI) trong quản lý giáo dục và Xử lý ngôn ngữ tự nhiên (Natural Language Processing – NLP).

Tan Khoa Huynh Ly

Huỳnh Lý Tân Khoa đang là sinh viên năm cuối chuyên ngành Khoa học Dữ liệu thuộc ngành Công nghệ Thông tin tại Trường Đại học Ngoại ngữ - Tin học Thành phố Hồ Chí Minh (HUFLIT), Việt Nam. Lĩnh vực nghiên cứu, quan tâm bao gồm: Học sâu, Khoa học dữ liệu và Xử lý ngôn ngữ tự nhiên (Natural Language Processing – NLP)

Thanh Le

Lê Thanh tốt nghiệp ngành Công nghệ Thông tin tại Trường Đại học Công nghệ TP. Hồ Chí Minh (HUTECH), Việt Nam vào năm 2011. Anh nhận bằng thạc sĩ Công nghệ Thông tin tại HUTECH vào năm 2018. Sau đó, anh tiếp tục theo học chương trình tiến sĩ chuyên ngành Xử lý ngôn ngữ tự nhiên (Natural Language Processing – NLP) tại HUTECH. Hướng nghiên cứu chính của anh bao gồm: Học sâu, Khoa học dữ liệu và Xử lý ngôn ngữ tự nhiên. Hiện nay, anh đang công tác với vai trò giảng viên tại Trường Đại học Kinh tế – Tài chính TP. Hồ Chí Minh (UEF) …

Tải xuống

Đã Xuất bản

30-06-2026

Cách trích dẫn

Hong Le, Q., Huynh Ly, T. K., & Le, T. (2026). Evaluating GPT-OSS-20B Model for Hate Speech Detection: Advances in Parameter-Efficient Adaptation . Tạp Chí Khoa học HUFLIT, 10(3), 11. Truy vấn từ https://hjs.huflit.edu.vn/index.php/hjs/article/view/372

Số

Chuyên mục

Khoa học và Công nghệ