NộI Dung
Trong thống kê, phân tích phương sai (ANOVA) là một cách phân tích các nhóm dữ liệu khác nhau với nhau để xem chúng có liên quan hay tương tự nhau không. Một thử nghiệm quan trọng trong ANOVA là lỗi bình phương trung bình gốc (MSE). Đại lượng này là cách ước tính sự khác biệt giữa các giá trị được dự đoán bởi mô hình thống kê và giá trị đo được từ hệ thống thực tế. Tính toán MSE gốc có thể được thực hiện trong một vài bước đơn giản.
Tổng các lỗi bình phương (SSE)
Tính giá trị trung bình tổng thể của từng nhóm tập dữ liệu. Ví dụ: giả sử có hai nhóm dữ liệu, tập A và tập B, trong đó tập A chứa các số 1, 2 và 3 và tập B chứa các số 4, 5 và 6. Giá trị trung bình của tập A là 2 (được tìm thấy bởi cộng 1, 2 và 3 lại với nhau và chia cho 3) và giá trị trung bình của tập B là 5 (được tìm thấy bằng cách cộng 4, 5 và 6 lại với nhau và chia cho 3).
Trừ giá trị trung bình của dữ liệu từ các điểm dữ liệu riêng lẻ và bình phương giá trị tiếp theo. Ví dụ: trong tập dữ liệu A, trừ 1 bằng giá trị trung bình của 2 sẽ cho giá trị -1. Bình phương số này (nghĩa là nhân nó với số đó) cho 1. Lặp lại quy trình này cho phần còn lại của dữ liệu từ tập A cho 0 và 1, và đối với tập B, các số cũng là 1, 0 và 1 .
Tổng hợp tất cả các giá trị bình phương. Từ ví dụ trước, tổng hợp tất cả các số bình phương tạo ra số 4.
Tính toán MSE gốc trong ANOVA
Tìm mức độ tự do cho lỗi bằng cách trừ tổng số điểm dữ liệu theo mức độ tự do để xử lý (số lượng tập dữ liệu). Trong ví dụ của chúng tôi, có sáu điểm dữ liệu và hai bộ dữ liệu khác nhau, cho 4 mức độ tự do cho lỗi.
Chia tổng bình phương lỗi cho các bậc tự do cho lỗi. Tiếp tục ví dụ, chia 4 cho 4 cho 1. Đây là lỗi bình phương trung bình (MSE).
Lấy căn bậc hai của MSE. Kết luận về ví dụ, căn bậc hai của 1 là 1. Do đó, MSE gốc cho ANOVA là 1 trong ví dụ này.