Tiến bộ và thách thức của lĩnh vực học máy trong Hóa tin

Các tác giả

Tóm tắt

Học máy (Machine Leaning - ML) đã trở thành một trong những kỹ thuật mạnh mẽ trong Hóa tin hay Hoá tin học (Cheminformatics) còn gọi là hoá học tính toán, nó đã được ứng dụng trong nhiều bài toán khác nhau. Chẳng hạn, trong Hoá học, học máy được dùng trong việc khám phá thuốc, dự đoán độc tính và thiết kế vật liệu. Trong bài báo này, nhằm mục đích cung cấp một khảo sát chung về ML trong hóa tin. Chúng tôi bắt đầu bằng cách thảo luận về các khái niệm cơ bản của ML, sau đó xem xét các loại thuật toán ML khác nhau đã được áp dụng cho các bài toán Hóa tin. Qua đó cung cấp cho các nhà nghiên cứu và những người thực hành trong ngành Hoá tin hiểu biết thấu đáo về việc áp dụng những kỹ thuật, phương pháp của Tin học; đồng thời đưa ra một số thách thức cũng như cơ hội để nghiên cứu pháp triển. Phần cuối cùng trình bày một nghiên cứu thử nghiệm qua việc xác định hoạt tính dựa trên tập mẫu chứa các xét nghiệm sàng lọc do tổ chức Burnham Center for Chemical Genomics thực hiện, nhằm ức chế biểu hiện bề mặt tế bào VCAM-1 do gen TNFa gây ra. Đây là một tập mẫu có tỷ lệ chênh lệch rất cao giữa số lượng mẫu của hợp chấp có hoạt tính và không có hoạt tính. Kết quả cho thấy mô hình phân loại được lựa chọn tương đối phù hợp thông qua thước đo AUC và F1-Score

Tải xuống

Đã Xuất bản

30-08-2023

Cách trích dẫn

Trần, V. L. (2023). Tiến bộ và thách thức của lĩnh vực học máy trong Hóa tin. Tạp Chí Khoa học HUFLIT, 7(4), 70. Truy vấn từ https://hjs.huflit.edu.vn/index.php/hjs/article/view/161