Ktl-icon-tai-lieu

Ứng dụng tin học trong CNTP

Được đăng lên bởi MyTuyet Ho
Số trang: 8 trang   |   Lượt xem: 641 lần   |   Lượt tải: 0 lần
PHÂN TÍCH HỒI QUI TUYẾN TÍNH ĐƠN GIẢN
(Simple Linear Regression Analysis)
Phân tích hồi qui tuyến tích đơn giản là tìm sự liên hệ giữa 1 biến số độc lập
(biến dự đoán) trên trục hoành x với 1 biến số phụ thuộc (biến kết cục) trên
trục tung y. Sau đó vẻ 1 đường thẳng hồi qui và từ phương trình đường thẳng
này ta có thể dự đoán được biến y (ví dụ: cân nặng) khi đã có x (ví dụ: tuổi)
Ví dụ 1: Ta có 1 mẫu gồm 6 trẻ từ 1-6 tuổi, có cân nặng như bảng sau:

Tuổi

Cân nặng (kg)

1

10

2

12

3

14

4

16

5

18

6

20

Nối các cặp (x,y) này ta thấy có dạng 1 phương trình bậc nhất: y=2x+8
(trong đó 2 là độ dốc và 8 là điểm cắt trên trục tung y khi x=0). Trong thống kê
phương trình đường thẳng (bậc nhất) này được viết dưới dạng:

y= x +  [1]
D6ay là phương trình hối qui tuyến tính, trong đó  gọi là slope (độ dốc) và 
là intercept (điểm cắt trên trục tung)
Thực ra phương trình hồi qui tuyến tính này chỉ có trên lý thuyết, nghĩa là các
trị số của xi (i=1,2,3,4,5,6) và yi tương ứng liên hệ 100% (hoặc hệ số tương
quan R=1)
Trong thực tế hiếm khi có sư liên hệ 100% này mà thường có

sự sai lệch

giữa trị số quan sát yi và trị số yi’ ước đoán nằm trên đường hối qui.
Ví dụ 2: Ta có 1 mẫu gồm 6 trẻ em khác có cân nặng theo bảng sau:

Tuổi

Cân nặng (kg)

1

11

2

11

3

14

4

16

5

18

6

20

Khi vẽ đường thẳng hồi qui, ta thấy các trị số quan sát y3, y4, y5, y6 nhưng y1
và y2 không nằm trên trên đường thẳng này và sự liên hệ giữa xi và yi không
còn là 100% mà chỉ còn 97% vì có sự sai lệch tại y1 và y2. Sự sai lệch này
trong thống kê gọi là phần dư (Residual) hoặc Errors.
Gọi y1, y2, y3, y4, y5, y6 là trị số quan sát và y’1, y’2, y’3, y’4, y’5, y’6 là trị số
ước đoán nằm trên đường hồi qui, 1, 2, 3, 4, 5, 6 là phần dư.
Như vậy

1= y1 –y’1
2 = y2 –y’2
3 = y3 –y’3
4 = y4 –y’4
5 = y5 – y’5
6 = y6 –y’6

Khi đó phương trình hồi qui tuyến tính được viết dưới dạng tổng quát như
sau:

y’= βxi + i+ i [2]
Như vậy nếu phần dư i càng nhỏ sự liên hệ giữa x,y càng lớn và ngược lại.
Phần liên hệ còn đượi gọi là phần hồi qui. Mô hình hồi qui tuyến tích được mô
tả:

Dữ liệu= Hồi qui (Regression) + Phần dư (Residual)

Ví dụ 3: Nếu chúng ta chọn một mẫu thực tế gồm 30 em từ 1-6 tuổi và kết
quả cân nặng tương ứng của 30 em được vẻ trong biểu đồ sau:

Lúc này ta không thể nối 30 điểm trên biểu đồ mà phải vẽ 1 đường thẳng đi
càng gần với tất cả các điểm càng tốt. Như vậy 3 đường thẳng ở biểu đồ ta
chọn đường thẳng nào?. Nguyên tắc chọn đường thẳng nào đi gần cả 30
điểm,...
PHÂN TÍCH HỒI QUI TUYẾN TÍNH ĐƠN GIẢN
(Simple Linear Regression Analysis)
Phân tích hồi qui tuyến tích đơn giản là tìm sliên hgiữa 1 biến số đc lập
(biến dự đoán) trên trục hoành x với 1 biến số phụ thuộc (biến kết cục) trên
trục tung y. Sau đó vẻ 1 đường thẳng hồi qui và từ phương trình đường thẳng
này ta có thể dự đoán được biến y (ví dụ: cân nặng) khi đã có x (ví dụ: tuổi)
Ví d 1: Ta có 1 mẫu gồm 6 trẻ từ 1-6 tuổi, có cân nặng như bảng sau:
Tui Cân nặng (kg)
1 10
2 12
3 14
4 16
5 18
6 20
Nối các cặp (x,y) này ta thấy có dạng 1 phương trình bậc nhất: y=2x+8
(trong đó 2 là độ dốc và 8 là điểm cắt trên trục tung y khi x=0). Trong thống kê
phương trình đường thẳng (bậc nhất) này được viết dưới dạng:
Ứng dụng tin học trong CNTP - Trang 2
Để xem tài liệu đầy đủ. Xin vui lòng
Ứng dụng tin học trong CNTP - Người đăng: MyTuyet Ho
5 Tài liệu rất hay! Được đăng lên bởi - 1 giờ trước Đúng là cái mình đang tìm. Rất hay và bổ ích. Cảm ơn bạn!
8 Vietnamese
Ứng dụng tin học trong CNTP 9 10 501