Phương pháp khai thác tập mục hữu ích cao từ luồng dữ liệu dựa trên thuật toán bầy voi
Tóm tắt
Khai thác tập mục hữu ích cao (High Utility Itemset Mining - HUIM) là một hướng nghiên cứu nổi bật trong lĩnh vực khai phá dữ liệu. Các thuật toán HUIM truyền thống thường gặp khó khăn khi không thể xử lý sự bùng nổ theo cấp số mũ của không gian tìm kiếm, dẫn đến hạn chế về khả năng mở rộng. Để khắc phục vấn đề này, các thuật toán HUIM dựa trên phương pháp heuristic đã thu hút được nhiều sự quan tâm. Tuy nhiên, những phương pháp này lại dễ hội tụ sớm, gây ra hiện tượng bỏ sót các tập mục hữu ích tiềm năng. Nhằm khắc phục những hạn chế này, chúng tôi đề xuất một thuật toán mới có tên SHUIM_HE, dựa trên giải thuật bầy voi, để khai thác hiệu quả các tập mục có giá trị cao từ luồng dữ liệu trong môi trường tài nguyên hạn chế. Đổi mới cốt lõi của thuật toán là chiến lược tiến hóa vị trí dựa trên yếu tố voi cái, giúp giảm đáng kể không gian tìm kiếm và nâng cao hiệu suất thực thi của thuật toán. Các thí nghiệm thực hiện trên các tập dữ liệu thực tế cho thấy thuật toán đề xuất vượt trội hơn so với các thuật toán HUIM heuristic tiên tiến hiện nay.
