NộI Dung
- Loại dữ liệu cần thiết
- Bài kiểm tra mức độ phù hợp
- Tính toán thống kê Chi-Square
- Giải thích thống kê Chi-Square
Thí nghiệm kiểm tra dự đoán. Những dự đoán này thường là số, có nghĩa là, khi các nhà khoa học thu thập dữ liệu, họ hy vọng các con số sẽ bị phá vỡ theo một cách nhất định. Dữ liệu trong thế giới thực hiếm khi khớp chính xác với dự đoán của các nhà khoa học, vì vậy các nhà khoa học cần một bài kiểm tra để cho họ biết liệu sự khác biệt giữa các số được quan sát và dự kiến là do cơ hội ngẫu nhiên hay do một số yếu tố không lường trước sẽ buộc nhà khoa học phải điều chỉnh lý thuyết cơ bản . Một bài kiểm tra chi bình phương là một công cụ thống kê mà các nhà khoa học sử dụng cho mục đích này.
Loại dữ liệu cần thiết
Bạn cần dữ liệu phân loại để sử dụng kiểm tra chi bình phương. Một ví dụ về dữ liệu phân loại là số người trả lời câu hỏi "có" so với số người trả lời câu hỏi "không" (hai loại) hoặc số lượng ếch trong quần thể có màu xanh lá cây, vàng hoặc xám ( ba loại). Bạn không thể sử dụng kiểm tra chi bình phương trên dữ liệu liên tục, chẳng hạn như có thể được thu thập từ một cuộc khảo sát hỏi mọi người họ cao bao nhiêu. Từ một cuộc khảo sát như vậy, bạn sẽ có được một phạm vi chiều cao rộng. Tuy nhiên, nếu bạn chia chiều cao thành các loại như "cao dưới 6 feet" và "cao hơn 6 feet", thì bạn có thể sử dụng kiểm tra chi bình phương trên dữ liệu.
Bài kiểm tra mức độ phù hợp
Một bài kiểm tra mức độ phù hợp là một bài kiểm tra phổ biến và có lẽ là đơn giản nhất được thực hiện bằng cách sử dụng thống kê chi bình phương. Trong một bài kiểm tra mức độ phù hợp, nhà khoa học đưa ra dự đoán cụ thể về những con số mà cô dự kiến sẽ thấy trong mỗi loại dữ liệu của mình. Sau đó, cô thu thập dữ liệu trong thế giới thực - được gọi là dữ liệu quan sát - và sử dụng kiểm tra chi bình phương để xem liệu dữ liệu quan sát có phù hợp với mong đợi của cô không.
Ví dụ, hãy tưởng tượng một nhà sinh vật học đang nghiên cứu các kiểu di truyền ở một loài ếch. Trong số 100 con của một bộ bố mẹ ếch, mô hình di truyền của các nhà sinh vật học khiến cô mong đợi 25 con vàng, 50 con xanh và 25 con xám. Những gì cô thực sự quan sát là 20 đứa con màu vàng, 52 đứa con màu xanh lá cây và 28 đứa con màu xám. Dự đoán của cô ấy được hỗ trợ hay mô hình di truyền của cô ấy không chính xác? Cô ấy có thể sử dụng một bài kiểm tra chi bình phương để tìm hiểu.
Tính toán thống kê Chi-Square
Bắt đầu tính toán thống kê chi bình phương bằng cách trừ từng giá trị mong đợi khỏi giá trị quan sát tương ứng của nó và bình phương mỗi kết quả. Tính toán cho ví dụ về con cái ếch sẽ như thế này:
vàng = (20 - 25) ^ 2 = 25 xanh = (52 - 50) ^ 2 = 4 xám = (28 - 25) ^ 2 = 9
Bây giờ chia mỗi kết quả cho giá trị dự kiến tương ứng của nó.
vàng = 25 25 = 1 xanh = 4 50 = 0,08 xám = 9 25 = 0,36
Cuối cùng, thêm các câu trả lời từ bước trước.
chi bình phương = 1 + 0,08 + 0,36 = 1,44
Giải thích thống kê Chi-Square
Thống kê chi bình phương cho bạn biết các giá trị quan sát của bạn khác với các giá trị dự đoán của bạn như thế nào. Con số càng cao, sự khác biệt càng lớn. Bạn có thể xác định xem giá trị chi bình phương của bạn quá cao hay đủ thấp để hỗ trợ dự đoán của bạn bằng cách xem liệu nó có dưới mức nhất định không giá trị quan trọng trên một bảng phân phối chi-vuông. Bảng này khớp giá trị chi bình phương với xác suất, được gọi là giá trị p. Cụ thể, bảng cho bạn biết xác suất rằng sự khác biệt giữa các giá trị được quan sát và dự kiến của bạn chỉ đơn giản là do cơ hội ngẫu nhiên hoặc liệu một số yếu tố khác có mặt hay không. Đối với bài kiểm tra mức độ phù hợp, nếu giá trị p là 0,05 trở xuống, thì bạn phải từ chối dự đoán của mình.
Bạn phải xác định bậc tự do (df) trong dữ liệu của bạn trước khi bạn có thể tra cứu giá trị chi bình phương quan trọng trong bảng phân phối. Độ tự do được tính bằng cách trừ 1 từ số lượng danh mục trong dữ liệu của bạn. Có ba loại trong ví dụ này, vì vậy có 2 bậc tự do. Nhìn lướt qua bảng phân phối chi bình phương này cho bạn biết rằng, với 2 bậc tự do, giá trị tới hạn cho xác suất 0,05 là 5,99. Điều này có nghĩa là miễn là giá trị chi bình phương tính toán của bạn nhỏ hơn 5,99, các giá trị dự kiến của bạn và do đó, lý thuyết cơ bản, là hợp lệ và được hỗ trợ. Vì thống kê chi bình phương cho dữ liệu của con ếch là 1,44, nhà sinh học có thể chấp nhận mô hình di truyền của cô.