Song song hóa khai thác tập mục hữu ích cao Top-K trong luồng dữ liệu thời gian thực bằng giải thuật di truyền
Tóm tắt
Khai thác tập mục hữu ích cao (High-Utility Itemset Mining – HUIM) trong luồng dữ liệu thời gian thực là một thách thức lớn do đặc tính vô hạn, tốc độ cao và thay đổi liên tục. Các phương pháp truyền thống dựa trên ngưỡng hữu ích tối thiểu (minUtil) thường gặp khó khăn trong việc lựa chọn giá trị phù hợp, dễ dẫn đến mất các mẫu quan trọng và chi phí tính toán cao. Bài báo này đề xuất một phương pháp song song hóa giải thuật di truyền để khai thác tập mục hữu ích cao Top-K trong luồng dữ liệu. Phương pháp kết hợp mô hình cửa sổ trượt với cơ chế song song hóa quá trình tính toán hàm thích nghi, cho phép xử lý dữ liệu theo thời gian thực đồng thời đảm bảo độ chính xác cao. Dữ liệu được biểu diễn bằng bitmap và bảng băm nhằm tối ưu sử dụng bộ nhớ và giảm đánh giá lặp trong quá trình tiến hóa. Thực nghiệm trên các bộ dữ liệu chuẩn (Retail, Mushroom, Chess, Accidents) cho thấy phương pháp đề xuất cải thiện đáng kể thời gian thực thi, hiệu quả bộ nhớ và khả năng mở rộng so với GA tuần tự và các thuật toán HUIM hiện có. Kết quả nghiên cứu khẳng định tiềm năng của giải thuật di truyền song song hóa trong khai phá dữ liệu hữu ích quy mô lớn và thời gian thực.
