CSPM-DBV: Khai thác hiệu quả mẫu tuần tự đóng dựa trên cấu trúc vector bit động

Authors

  • Minh Thái Trần
  • Đức Thành Phạm

Abstract

Khai thác mẫu tuần tự đang được nghiên cứu rộng rãi do chúng có nhiều ứng dụng rộng rãi trong thực tiễn. Phần lớn các nghiên cứu trên khai thác dữ liệu tuần tự tập trung vào khai thác tất cả các mẫu tuần tự. Điều này sẽ sinh ra các kết quả dư thừa, làm gia tăng không gian lưu trữ và thời gian thực thi không cần thiết. Trong khi đó, khai thác mẫu tuần tự đóng có thể giúp duy trì số lượng mẫu nhỏ hơn mà vẫn đảm bảo được những thông tin đầy đủ khi trích xuất luật. Chính vì vậy các thuật toán khai thác mẫu tuần tự đóng được ra đời. Các thuật toán này thông thường sử dụng chiến lược duy trì và kiểm tra mẫu nên không hiệu quả trên tập dữ liệu tuần tự lớn. Nhằm giải quyết vấn đề trên, bài báo này đề xuất một thuật toán, với tên gọi CSPM-DBV (Closed Sequential Pattern Mining Based on Dynamic Bit Vectors), nhằm khai thác hiệu quả mẫu tuần tự đóng thông qua cấu trúc vector bit động. Thuật toán áp dụng nhiều kỹ thuật nhằm giảm không gian lưu trữ và thời gian thực thi. Các kết quả thực nghiệm cho thấy rằng CSPM-DBV hiệu quả hơn thuật toán BIDE về mặt thời gian thực thi và bộ nhớ sử dụng.

Published

14-03-2022

How to Cite

Trần M. T., & Phạm Đức T. (2022). CSPM-DBV: Khai thác hiệu quả mẫu tuần tự đóng dựa trên cấu trúc vector bit động. HUFLIT Journal of Science, 6(1), 90. Retrieved from https://hjs.huflit.edu.vn/index.php/hjs/article/view/95

Issue

Section

Articles