Giảm chiều dữ liệu là gì? Chi tiết về Giảm chiều dữ liệu mới nhất 2022

Tiến độ giảm con số những biến bất cứ có cân nhắcBản mẫu:SHORTDESC:Tiến độ giảm con số những biến bất cứ có Để ý đến

Nếu như với giảm chiều trong vật lý, xem giảm kích cỡ.

Giảm chiều dữ liệu (tiếng Anh: dimensionality reduction, hay dimension reduction), là sự biến hóa dữ liệu từ khoảng không chiều-cao thành khoảng không chiều-thấp để màn trình diễn ở dạng chiều-thấp cùng theo đó giữ lại một số trong những thuộc tính có ý nghĩa sâu sắc của dữ liệu gốc, có sáng kiến là gần với chiều nội tại (intrinsic dimension).

Xem:  Top 10 công ty cho thuê thiết bị xây dựng uy tín, giá tốt ở Hà Nội mới 2022

Nghiên cứu dữ liệu trong khoảng không chiều-cao rất có thể vất vả vì nhiều nguyên do; dữ liệu thô thông thường có tính thưa thớt (sparse matrix) là một hậu quả của lời nguyền chiều, and cho nên vì vậy việc nghiên cứu và phân tích thường khó đo lường và thống kê; hơn thế nữa những thuật toán rất có thể mất không hề ít thời điểm để giải quyết và xử lý dữ liệu. Giảm chiều dữ liệu là thông dụng trong số nghành có con số quan sát to and/hoặc con số biến to, ví dụ điển hình như giải quyết và xử lý dấu hiệu, nhận dạng lời nói, thông báo học thần kinh (tin học thần kinh, neuroinformatics), and tin sinh học.[1]

Những cách giảm chiều dữ liệu thỉnh thoảng đc tạo thành cách thức tiếp cận tuyến tính and phi tuyến tính.[1] Những phương pháp tiếp cận cũng khá được tạo thành chọn đặc tính (feature selection) and trích chọn đặc thù (feature extraction).[2] Giảm chiều dữ liệu rất có thể đc dùng cho giảm nhiễu (noise reduction), trực quan hóa dữ liệu (data visualization), nghiên cứu và phân tích cụm, hoặc là một bước trung gian để có thể tạo trường hợp tiện lợi cho những nghiên cứu và phân tích khác.

Trích chọn đặc thù[sửa | sửa mã nguồn]

Bài chi tiết: Trích chọn đặc thù

Tham khảo thêm: Gia Công hóa phối hợp

Những phương pháp tiếp cận trích chọn đặc thù cố gắng nỗ lực tìm kiếm được một tập hợp con của rất nhiều biến nguồn vào (nói một cách khác là chức năng hoặc thuộc tính). Ba kế hoạch đó là: kế hoạch lọc (filter, ví dụ thông báo sở hữu được trong cây đưa ra quyết định), kế hoạch bao quanh (wrapper, ví dụ tìm kiếm ra chỉ dẫn theo độ đúng cách), and kế hoạch nhúng (embedded, những chức năng đã chọn rất có thể đc thêm hoặc bị xóa trong lúc thiết kế và xây dựng loại hình dựa vào những lỗi Dự kiến).

Nghiên cứu dữ liệu ví dụ điển hình như nghiên cứu và phân tích hồi quy hay phân chia bằng đo lường rất có thể đc triển khai trong khoảng không giảm chiều đúng cách hơn trong khoảng không lúc đầu (gốc).[3]

Những phần mềm[sửa | sửa mã nguồn]

Một kỹ thuật giảm chiều dữ liệu nhiều lúc đc dùng trong khoa học thần kinh là kích cỡ thông báo tối đa (maximally informative dimensions),[cần dẫn nguồn] trong các số ấy tìm cảm nhận thấy màn trình diễn theo chiều-thấp hơn của 1 tập dữ liệu, ví dụ điển hình như thông báo and cũng về dữ liệu gốc đc dữ gìn và bảo vệ.

Ghi chú[sửa | sửa mã nguồn]

  1. ^ aă

    van der Maaten, Laurens; Postma, Eric; van den Herik, Jaap (ngày 26 tháng 10 năm 2009). “Dimensionality Reduction: A Comparative Đánh Giá” (PDF). J Mach Learn Res. 10: 66–71.

  2. ^ Pudil, Phường.; Novovičová, J. (1998). “Novel Methods for Feature Subset Selection with Respect lớn Problem Knowledge”. Trong Liu, Huan; Motoda, Hiroshi (cân chỉnh). Feature Extraction, Construction và Selection. tr. 101. doi:10.1007/978-1-4615-5725-8_7. ISBN 978-1-4613-7622-4.
  3. ^ Rico-Sulayes, Antonio (2017). “Reducing Vector Space Dimensionality in Automatic Classification for Authorship Attribution”. Revista Ingeniería Electrónica, Automática y Comunicaciones. 38 (3): 26–35.

Tham khảo thêm[sửa | sửa mã nguồn]

  • Boehmke, Brad; Greenwell, Brandon M. (2019). “Dimension Reduction”. Hands-On Machine Learning with R. Chapman & Hall. tr. 343–396. ISBN 978-1-138-49568-5.

Fodor, I. (2002). A survey of dimension reduction techniques (Bản giải trình kỹ thuật). Center for Applied Scientific Computing, Lawrence Livermore National.

Cunningham, Phường. (2007). Dimension Reduction (Bản giải trình kỹ thuật). University College Dublin.

  • Lakshmi Padmaja, Dhyaram; Vishnuvardhan, B (2016). “Comparative Study of Feature Subset Selection Methods for Dimensionality Reduction on Scientific Data”. 2016 IEEE 6th International Conference on Advanced Computing (IACC). tr. 31–34. doi:10.1109/IACC.2016.16. ISBN 978-1-4673-8286-1.

Kết nối ngoài[sửa | sửa mã nguồn]

  • JMLR Special Issue on Variable và Feature Selection
  • ELastic MAPs
  • Locally Linear Embedding
  • A Global Geometric Framework for Nonlinear Dimensionality Reduction

Bài Viết: Giảm chiều dữ liệu là gì? Chi tiết về Giảm chiều dữ liệu mới nhất 2022

Nguồn: blogsongkhoe365.vn

Trả lời

Email của bạn sẽ không được hiển thị công khai.