Khai thác tập phổ biến từ dữ liệu luồng bằng cách sử dụng thuật toán di truyền

Các tác giả

  • Phạm Đức Thành Khoa CNTT
  • Lê Thị Minh Nguyện

Tóm tắt

Bài báo này trình bày một nghiên cứu về việc khai thác các tập phổ biến từ dữ liệu giao dịch luồng trong bối cảnh có sự thay đổi khái niệm. Dữ liệu luồng, với tính chất không ổn định, đặt ra nhiều thách thức trong việc khai thác. Bài báo này sử dụng phương pháp thuật toán di truyền, mối quan hệ giữa sự thay đổi khái niệm, kích thước cửa sổ trượt và ràng buộc của thuật toán di truyền. Sự thay đổi khái niệm được xác định thông qua sự thay đổi trong các tập phổ biến. Sự độc đáo của đề tài này nằm ở việc xác định sự thay đổi khái niệm bằng cách sử dụng các tập phổ biến để khai thác dữ liệu luồng, với việc sử dụng khung là thuật toán di truyền. Công thức được trình bày để tính toán số lần của độ hỗ trợ tối thiểu trong dữ liệu luồng bằng cách sử dụng cửa sổ trượt. Việc thử nghiệm đã chỉ ra rằng tỷ lệ giữa kích thước cửa sổ và số giao dịch cho mỗi thay đổi là yếu tố quan trọng để đạt hiệu suất tốt. Việc đạt được kết quả tốt khi kích thước cửa sổ trượt quá nhỏ là một thách thức vì những biến động bình thường trong dữ liệu có thể xuất hiện như là sự thay đổi khái niệm. Kích thước cửa sổ phải được quản lý cùng với giá trị của độ hỗ trợ và độ tin cậy để đạt được kết quả hợp lý. Phương pháp này trong việc phát hiện sự thay đổi khái niệm đã hoạt động tốt khi sử dụng kích thước cửa sổ lớn hơn

Tải xuống

Đã Xuất bản

15-01-2024

Cách trích dẫn

Phạm, Đức T., & Lê Thị Minh, N. (2024). Khai thác tập phổ biến từ dữ liệu luồng bằng cách sử dụng thuật toán di truyền. Tạp Chí Khoa học HUFLIT, 8(1), 1. Truy vấn từ https://hjs.huflit.edu.vn/index.php/hjs/article/view/162

Số

Chuyên mục

Bài viết

##category.category##