4. OUTLIER

Mục tiêu OUTLIER: giúp xác định các điểm dữ liệu không phù hợp hoặc không bình thường so với phần còn lại của tập dữ liệu.

Thực hiện trên hệ thống theo các bước hướng dẫn sau:

-        Bước 1:  Vào hệ thống chọn module Explore, chọn tập dữ liệu cần tổng hợp và tạo mới một tập dữ liệu tổng hợp từ OUTLIER.


-        Bước 2: Chọn cột dữ liệu dữ liệu cần xác định các điểm không phù hợp hoặc không bình thường so với phần còn lại của tập dữ liệu.


-        Bước 3: Chọn thuật toán để xử lý


Trong đó:

o   Thuật toán Z-Scores được sử dụng để xác định các giá trị ngoại lệ trong tập dữ liệu.

o   Thuật toán IQR được sử dụng chủ yếu để phát hiện và xử lý các giá trị ngoại lệ trong tập dữ liệu

-        Bước 4: Điều chỉnh giá trị xác định, so sánh


-        Bước 5: “RUN” chạy test dữ liệu được tổng hợp


-        Bước 6: Nhập tên cho tập dữ liệu mới được tổng hợp, chọn Lưu thông tin tập dữ liệu được tổng hợp bằng công cụ OUTLIER