Nghiên cứu đa phương pháp cho phát hiện ý định trong tương tác Người–Máy
Từ khóa:
Intent Classification, Human-Robot Interaction, Transformer, Large Language Models, PromptingTóm tắt
Phát hiện ý định (Intent Classification) là một thành phần cốt lõi trong các hệ thống tương tác người–máy và người–robot, đóng vai trò quyết định trong việc hiểu và phản hồi chính xác yêu cầu của con người. Nghiên cứu này trình bày một phân tích so sánh toàn diện các nhóm phương pháp tiếp cận phổ biến cho bài toán phát hiện ý định, bao gồm các mô hình học máy truyền thống, học sâu, mô hình dựa trên Transformer với fine-tuning, và các Mô hình Ngôn ngữ Lớn (Large Language Models – LLMs) sử dụng kỹ thuật prompting. Thông qua việc đánh giá trên cùng một tập dữ liệu và thiết lập thực nghiệm thống nhất, nghiên cứu phân tích ưu nhược điểm của từng phương pháp dưới các khía cạnh hiệu suất, chi phí tính toán, độ phức tạp triển khai và khả năng tổng quát hóa, đặc biệt nhấn mạnh tiềm năng zero-shot của LLM trong bối cảnh HRI. Kết quả định tính cho thấy mỗi nhóm phương pháp có những thế mạnh riêng và phù hợp với các kịch bản triển khai khác nhau, từ hệ thống nhúng chi phí thấp đến các ứng dụng thông minh dựa trên dịch vụ đám mây.
