Khảo sát phương pháp ẩn luật kết hợp trong dữ liệu giao dịch
Từ khóa:
Ẩn luật kết hợp, Bảo toàn tính riêng tư, Khai thác dữ liệu, Ẩn luật nhạy cảmTóm tắt
Khai thác dữ liệu bảo toàn tính riêng tư (Privacy-Preserving Data Mining - PPDM) là một lĩnh vực nghiên cứu tương đối mới trong cộng đồng khai thác dữ liệu và đã tồn tại khoảng hơn một thập kỷ. PPDM nghiên cứu các tác dụng phụ của phương pháp khai thác dữ liệu có nguồn gốc từ sự xâm nhập vào sự riêng tư của các cá nhân và tổ chức. Một số phương pháp tiếp cận để giải quyết vấn đề này đã được nghiên cứu và áp dụng. Các phương pháp được đề xuất có thể được phân loại theo hai hướng nghiên cứu chính đó là ẩn dữ liệu và ẩn tri thức. Ẩn dữ liệu là hướng nghiên cứu về tính riêng tư trong các dữ liệu thô hay thông tin, có thể được đảm bảo trong quá trình khai thác dữ liệu. Các phương pháp của nhóm này tác động vào bản thân dữ liệu nhằm mục đích làm ẩn các loại thông tin nhạy cảm bằng các phương pháp khác nhau. Ẩn tri thức liên quan đến các phương pháp nhằm bảo vệ các kết quả khai thác dữ liệu nhạy cảm chứ không phải chính dữ liệu thô. Đây là hướng ứng dụng chính của các công cụ và thuật toán khai thác dữ liệu. Trong đó, ẩn luật kết hợp là một hướng nghiên cứu trong nhóm ẩn tri thức. Trong bài báo này, chúng tôi tập trung vào khảo sát các kỹ thuật ẩn luật kết hợp và đánh giá hiệu quả của các phương pháp đã được đề xuất.