# 4.	OUTLIER

Mục tiêu OUTLIER: giúp xác định các điểm dữ liệu không phù hợp hoặc không bình thường so với phần còn lại của tập dữ liệu.

# Thực hiện trên hệ thống theo các bước hướng dẫn sau:

<span style="mso-fareast-font-family: 'Times New Roman';"><span style="mso-list: Ignore;">-<span style="font: 7.0pt 'Times New Roman';"> </span></span></span>Bước 1:<span style="mso-spacerun: yes;"> </span>Vào hệ thống chọn module Explore, chọn tập dữ liệu cần tổng hợp và tạo mới một tập dữ liệu tổng hợp từ OUTLIER.

<span style="mso-no-proof: yes;">![](https://book.inetcloud.vn/uploads/images/gallery/2024-07/embedded-image-ee9tmdcu.png)  
</span>

<span style="mso-fareast-font-family: 'Times New Roman';"><span style="mso-list: Ignore;">-<span style="font: 7.0pt 'Times New Roman';"> </span></span></span>Bước 2: Chọn cột dữ liệu dữ liệu cần xác định các điểm không phù hợp hoặc không bình thường so với phần còn lại của tập dữ liệu.

<span style="mso-no-proof: yes;">![](https://book.inetcloud.vn/uploads/images/gallery/2024-07/embedded-image-rtfo6tls.png)  
</span>

<span style="mso-fareast-font-family: 'Times New Roman';"><span style="mso-list: Ignore;">-<span style="font: 7.0pt 'Times New Roman';"> </span></span></span>Bước 3: Chọn thuật toán để xử lý

<span style="mso-no-proof: yes;">![](https://book.inetcloud.vn/uploads/images/gallery/2024-07/embedded-image-zqdhi0gx.png)  
</span>

Trong đó:

<span style="font-family: 'Courier New'; mso-fareast-font-family: 'Courier New';"><span style="mso-list: Ignore;">o<span style="font: 7.0pt 'Times New Roman';"> </span></span></span>Thuật toán Z-Scores được sử dụng để xác định các giá trị ngoại lệ trong tập dữ liệu.

<span style="font-family: 'Courier New'; mso-fareast-font-family: 'Courier New';"><span style="mso-list: Ignore;">o<span style="font: 7.0pt 'Times New Roman';"> </span></span></span>Thuật toán IQR được sử dụng chủ yếu để phát hiện và xử lý các giá trị ngoại lệ trong tập dữ liệu

<span style="mso-fareast-font-family: 'Times New Roman';"><span style="mso-list: Ignore;">-<span style="font: 7.0pt 'Times New Roman';"> </span></span></span>Bước 4: Điều chỉnh giá trị xác định, so sánh

<span style="mso-no-proof: yes;">![](https://book.inetcloud.vn/uploads/images/gallery/2024-07/embedded-image-wmuivmjc.png)  
</span>

<span style="mso-fareast-font-family: 'Times New Roman';"><span style="mso-list: Ignore;">-<span style="font: 7.0pt 'Times New Roman';"> </span></span></span>Bước 5: “RUN” chạy test dữ liệu được tổng hợp

<span style="mso-no-proof: yes;">![](https://book.inetcloud.vn/uploads/images/gallery/2024-07/embedded-image-omiskatj.png)  
</span>

<span style="mso-fareast-font-family: 'Times New Roman';"><span style="mso-list: Ignore;">-<span style="font: 7.0pt 'Times New Roman';"> </span></span></span>Bước 6: Nhập tên cho tập dữ liệu mới được tổng hợp, chọn Lưu thông tin tập dữ liệu được tổng hợp bằng công cụ OUTLIER

<span style="mso-no-proof: yes;">![](https://book.inetcloud.vn/uploads/images/gallery/2024-07/embedded-image-pge1kmar.png)  
</span>