Khai thác các tập mục hữu ích cao dựa trên phương pháp tối ưu bầy đàn
Abstract
Khai thác các tập mục hữu ích cao (HUIs) là một chủ đề nóng hổi hiện nay về khai thác dữ liệu. Các thuật toán tiến hóa trong tự nhiên đang ngày càng thu hút chú ý, vì chúng có lợi thế tránh bùng nổ tổ hợp không gian tìm kiếm. Trong số các thuật toán tiến hóa trong tự nhiên được sử dụng để khai thác HUIs, thuật toán tối ưu bầy đàn (PSO) là phổ biến nhất. PSO khai thác HUI dựa trên sự chuyển đổi vị trí không ngừng theo hàm sigmoid cho vận tốc. Trong bài báo này, chúng tôi đề xuất một thuật toán HUIM dựa trên bộ PSO (S-PSO) được goi là HUIM_SPSO, trong đó chủ yếu xem xét các phần tử ở các vị trí có vận tốc lớn. Chúng tôi thực hiện mô hình hóa HUIM bằng S-PSO và giải thích HUIM-SPSO một cách chi tiết. Để phản ánh được sự đa dạng của các kết quả khai thác, chúng tôi đề xuất thước đo bit để chỉnh sửa khoảng cách. Kết quả thực nghiệm cho thấy thuật toán HUIM-SPSO hiệu quả và có thể khám phá nhiều HUI hơn với mức độ đa dạng cao.