NộI Dung
Biểu đồ phân tán là biểu đồ cho thấy mối quan hệ giữa hai bộ dữ liệu. Đôi khi thật hữu ích khi sử dụng dữ liệu chứa trong một biểu đồ phân tán để có được mối quan hệ toán học giữa hai biến. Phương trình của biểu đồ phân tán có thể thu được bằng tay, sử dụng một trong hai cách chính: kỹ thuật đồ họa hoặc kỹ thuật gọi là hồi quy tuyến tính.
Tạo một biểu đồ phân tán
Sử dụng giấy vẽ đồ thị để tạo ra một biểu đồ phân tán. Vẽ các trục x và y, đảm bảo chúng giao nhau và dán nhãn gốc. Đảm bảo rằng các trục x và y cũng có tiêu đề chính xác. Tiếp theo, vẽ đồ thị từng điểm dữ liệu trong biểu đồ. Bất kỳ xu hướng nào giữa các tập dữ liệu được vẽ bây giờ sẽ rõ ràng.
Dòng phù hợp nhất
Khi một biểu đồ phân tán đã được tạo, giả sử có một mối tương quan tuyến tính giữa hai tập dữ liệu, chúng ta có thể sử dụng một phương pháp đồ họa để có được phương trình. Lấy một thước kẻ và vẽ một đường càng gần càng tốt với tất cả các điểm. Cố gắng đảm bảo rằng có nhiều điểm phía trên đường kẻ như bên dưới đường kẻ. Khi đường đã được vẽ, sử dụng các phương pháp tiêu chuẩn để tìm phương trình của đường thẳng
Phương trình đường thẳng
Khi một dòng phù hợp nhất đã được đặt trên một biểu đồ phân tán, thật đơn giản để tìm phương trình. Phương trình tổng quát của một đường thẳng là:
y = mx + c
Trong đó m là độ dốc (độ dốc) của đường và c là giao điểm y. Để có được độ dốc, tìm hai điểm trên đường thẳng. Vì lợi ích của ví dụ này, hãy giả sử rằng hai điểm là (1,3) và (0,1). Độ dốc có thể được tính bằng cách lấy chênh lệch trong tọa độ y và chia cho chênh lệch trong tọa độ x:
m = (3 - 1) / (1 - 0) = 2/1 = 2
Độ dốc trong trường hợp này bằng 2. Cho đến nay, phương trình của đường thẳng là
y = 2x + c
Giá trị cho c có thể đạt được bằng cách thay thế trong các giá trị cho một điểm đã biết. Theo ví dụ, một trong những điểm được biết là (1,3). Cắm cái này vào phương trình và sắp xếp lại cho c:
3 = (2 * 1) + c
c = 3 - 2 = 1
Phương trình cuối cùng trong trường hợp này là:
y = 2x + 1
Hồi quy tuyến tính
Hồi quy tuyến tính là một phương pháp toán học có thể được sử dụng để thu được phương trình đường thẳng của đồ thị phân tán. Bắt đầu bằng cách đặt dữ liệu của bạn vào một bảng. Trong ví dụ này, chúng ta hãy giả sử rằng chúng ta có dữ liệu sau:
(4.1, 2.2) (6.5, 4.5) (12.6, 10.4)
Tính tổng các giá trị x:
x_sum = 4,1 + 6,5 + 12,6 = 23,2
Tiếp theo, tính tổng các giá trị y:
y_sum = 2.2 + 4.4 + 10.4 = 17
Bây giờ tổng hợp các sản phẩm của từng bộ điểm dữ liệu:
xy_sum = (4.1 * 2.2) + (6.5 * 4.4) + (12.6 * 10.4) = 168.66
Tiếp theo, tính tổng của các giá trị x bình phương và bình phương giá trị y:
x_sapes_sum = (4.1 ^ 2) + (6.5 ^ 2) + (12.6 ^ 2) = 217.82
y_sapes_sum = (2.2 ^ 2) + (4.5 ^ 2) + (10,4 ^ 2) = 133,25
Cuối cùng, đếm số lượng điểm dữ liệu bạn có. Trong trường hợp này, chúng tôi có ba điểm dữ liệu (N = 3). Độ dốc cho dòng phù hợp nhất có thể được lấy từ:
m = (N * xy_sum) - (x_sum * y_sum) / (N * x_sapes_sum) - (x_sum * x_sum) = (3 * 168.66) - (23.2 * 17) / (3 * 217.82) - (23.2 * 23.2) = 0,968
Chặn cho dòng phù hợp nhất có thể được lấy từ:
c = (x_sapes_sum * y_sum) - (x_sum * xy_sum) / (N * x_sapes_sum) - (x_sum * x_sum)
= (217.82 17) - (23.2 168.66) / (3 * 217.82) - (23.2 * 23.2) = -1.82
Do đó phương trình cuối cùng là:
y = 0,968x - 1,82