Cải tiến thuật toán Hminer cho việc khai thác tập hữu ích cao trên dữ liệu thao tác thưa
Từ khóa:
Dữ liệu giao tác, Luật kết hợp, Khai thác dữ liệu, Tập hữu ích caoTóm tắt
Khai thác tập hữu ích cao đóng vai trò quan trọng trong khai thác dữ liệu. Việc khai thác này giúp khám phá ra các tập mục có nhiều hữu ích, tức là có tầm quan trọng hoặc là lợi nhuận cao, trong cơ sở dữ liệu giao tác. Điều đó giúp cho các công ty, siêu thị có thể định hướng và đưa ra chiến lược kinh doanh cho phù hợp nhằm đem lại lợi nhuận cao nhất. Tùy thuộc vào dạng dữ liệu dày hoặc thưa, những thuật toán khai thác sẽ có chiến lược khai thác phù hợp và có những hiệu quả nhất định. Nội dung bài báo tập trung vào nghiên cứu và đề xuất phương pháp khai thác đối với tập dữ liệu thưa thông qua một số cách thức tổ chức dữ liệu và kỹ thuật cắt tỉa. Kết quả đánh giá thực nghiệm đã chứng tỏ được tính khả thi của giải pháp được đề xuất.