Skip to main content

Thực hiện trên hệ thống theo các bước hướng dẫn sau:

-        Bước 1: Vào hệ thống chọn module Explore, chọn tập dữ liệu cần tổng hợp và tạo mới một tập dữ liệu tổng hợp từ COLUMNAR.


-        Bước 2: “COLUMN FIELD” chọn cột dữ liệu cần định dạng "dòng" sang "cột".


-        Bước 3: “COLUMN VALUE” chọn giá trị cột cần tổng hợp


-        Bước 4: “GROUP FUNCTION” chọn các hàm tính toán, xử lý dữ liệu cho cột giá trị cần tổng hợp.


Lưu ý:

Để hiểu và sử dụng từng hàm có thể tham khảo tài liệu chi tiết theo đường dẫn: …

-        Bước 5: “COLUMN KEYS” chọn cột trường thuộc tính là khóa xử lý

 

-        Bước 6: “IMPUTER ALGORITHM” chọn thuật toán điền giá trị thiếu.


Trong đó:

o   Thuật toán nội suy (interpolation) được sử dụng để ước lượng giá trị tại các điểm trung gian dựa trên các giá trị đã biết của một tập dữ liệu.

o   Thuật toán Simple được dùng để xử lý các bài toán như tìm kiếm tuyến tính, sắp xếp nổi bọt, hoặc tính giai thừa.

o   Thuật toán KNN là một thuật toán dựa trên khoảng cách để phân loại hoặc dự đoán giá trị của một điểm dữ liệu mới dựa trên các điểm dữ liệu đã biết trong không gian đa chiều.

o   Thuật toán Payesian là một trong những thuật toán phân loại phổ biến nhất trong học máy, đặc biệt là đối với các bài toán phân loại văn bản và lọc thư rác.

Lưu ý: Để hiểu và sử dụng từng hàm có thể tham khảo tài liệu chi tiết theo đường dẫn: …

-        Bước 7: Ấn RUN để xem kết quả dữ liệu thêm mới vào tập dữ liệu.


-        Bước 8: Nhập tên cho tập dữ liệu mới được tổng hợp, chọn Lưu thông tin tập dữ liệu được tổng hợp bằng công cụ COLUMNAR