Cải tiến mô hình YOLOF bằng cơ chế chú ý nhằm nâng cao hiệu suất phát hiện đối tượng

Quang Toại Tôn; Khang Lưu

Các tác giả

Tôn Quang Toại 0947774847
Lưu Gia Khang

Tóm tắt

Phát hiện đối tượng (object detection) là một trong những vấn đề trọng tâm của thị giác máy tính, đặc biệt trong các lĩnh vực như robot và xe tự hành, nơi việc nhận thức và hiểu biết chính xác môi trường xung quanh là điều kiện tiên quyết để vận hành an toàn và hiệu quả. Theo hướng tiếp cận truyền thống, các mô hình phát hiện đối tượng thường đòi hỏi chi phí tính toán đáng kể và thời gian huấn luyện kéo dài, gây khó khăn cho việc triển khai thực tế. Để giải quyết những thách thức này, một phiên bản cải tiến của mô hình YOLOF (You Only Look One-level Feature) được đề xuất, tập trung vào việc nâng cao hiệu quả và độ chính xác trong phát hiện đối tượng. Phương pháp đề xuất tăng cường phần xương sống (backbone) bằng cơ chế chú ý (attention) nhằm tinh chỉnh biểu diễn đặc trưng, giúp mô hình tập trung tốt hơn vào các khu vực quan trọng trong ảnh. Cách tiếp cận này giữ được sự đơn giản và tốc độ vốn có của YOLOF, đồng thời cải thiện hiệu suất nhận diện. Mô hình được đánh giá trên hai tập dữ liệu tiêu chuẩn: MS COCO và BDD100K. Trên MS COCO, mô hình đạt mAP = 40.4%, nằm trong nhóm hiệu suất hàng đầu đối với các phương pháp phát hiện một giai đoạn. Trên BDD100K, tập dữ liệu thiết kế cho kịch bản lái xe tự động, mô hình đạt mAP = 24.2%, cho thấy khả năng thích ứng tốt trong môi trường phức tạp và đa dạng. Kết quả này chứng minh rằng phương pháp đề xuất có thể cân bằng giữa độ chính xác và hiệu quả, và là lựa chọn phù hợp cho các ứng dụng thực tế, nơi tài nguyên tính toán bị hạn chế.

Cải tiến mô hình YOLOF bằng cơ chế chú ý nhằm nâng cao hiệu suất phát hiện đối tượng

Các tác giả

Tóm tắt

Tải xuống

Đã Xuất bản

Cách trích dẫn

Số

Chuyên mục

##category.category##

Trang bìa

Ngôn ngữ

Thông tin