Ktl-icon-tai-lieu

Phân tích hồi quy tuyến tinh

Được đăng lên bởi tranquocbao1993
Số trang: 29 trang   |   Lượt xem: 2941 lần   |   Lượt tải: 0 lần
10
Phân tích hồi qui tuyến tính
Phân tích hồi qui tuyến tính (linear regression analysis) có lẽ là một trong những
phương pháp phân tích số liệu thông dụng nhất trong thống kê học. Anon từng viết “Cho
con người 3 vũ khí – hệ số tương quan, hồi qui tuyến tính và một cây bút, con người sẽ
sử dụng cả ba”! Trong chương này, tôi sẽ giới thiệu cách sử dụng R để phân tích hồi qui
tuyến tính và các phương pháp liên quan như hệ số tương quan và kiểm định giả thiết
thống kê.
Ví dụ 1. Để minh họa cho vấn đề, chúng ta thử xem xét nghiên cứu sau đây, mà
trong đó nhà nghiên cứu đo lường độ cholestrol trong máu của 18 đối tượng nam. Tỉ
trọng cơ thể (body mass index) cũng được ước tính cho mỗi đối tượng bằng công thức
tính BMI là lấy trọng lượng (tính bằng kg) chia cho chiều cao bình phương (m2). Kết quả
đo lường như sau:
Bảng 1. Độ tuổi, tỉ trọng cơ thể và cholesterol
Mã số ID
(id)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18

Độ tuổi
(age)
46
20
52
30
57
25
28
36
22
43
57
33
22
63
40
48
28
49

BMI
(bmi)
25.4
20.6
26.2
22.6
25.4
23.1
22.7
24.9
19.8
25.3
23.2
21.8
20.9
26.7
26.4
21.2
21.2
22.8

Cholesterol
(chol)
3.5
1.9
4.0
2.6
4.5
3.0
2.9
3.8
2.1
3.8
4.1
3.0
2.5
4.6
3.2
4.2
2.3
4.0

Nhìn sơ qua số liệu chúng ta thấy người có độ tuổi càng cao độ cholesterol cũng
càng cao. Chúng ta thử nhập số liệu này vào R và vẽ một biểu đồ tán xạ như sau:
> age <- c(46,20,52,30,57,25,28,36,22,43,57,33,22,63,40,48,28,49)

> bmi <-c(25.4,20.6,26.2,22.6,25.4,23.1,22.7,24.9,19.8,25.3,23.2,
21.8,20.9,26.7,26.4,21.2,21.2,22.8)
> chol <- c(3.5,1.9,4.0,2.6,4.5,3.0,2.9,3.8,2.1,3.8,4.1,3.0,
2.5,4.6,3.2, 4.2,2.3,4.0)

2.0

2.5

3.0

chol

3.5

4.0

4.5

> data <- data.frame(age, bmi, chol)
> plot(chol ~ age, pch=16)

20

30

40

50

60

age

Biểu đồ 10.1. Liên hệ giữa độ tuổi và cholesterol.
Biểu đồ 10.1 trên đây gợi ý cho thấy mối liên hệ giữa độ tuổi (age) và cholesterol là một
đường thẳng (tuyến tính). Để “đo lường” mối liên hệ này, chúng ta có thể sử dụng hệ số
tương quan (coefficient of correlation).

10.1 Hệ số tương quan
Hệ số tương quan (r) là một chỉ số thống kê đo lường mối liên hệ tương quan giữa
hai biến số, như giữa độ tuổi (x) và cholesterol (y). Hệ số tương quan có giá trị từ -1 đến
1. Hệ số tương quan bằng 0 (hay gần 0) có nghĩa là hai biến số không có liên hệ gì với
nhau; ngược lại nếu hệ số bằng -1 hay 1 có nghĩa là hai biến số có một mối liên hệ tuyệt
đối. Nếu giá trị của hệ số tương quan là âm (r <0) có nghĩa là khi x tăng cao thì y giảm
(và ngược lại, khi x giảm thì y tăng);...
10
Phân tích hi qui tuyến tính
Phân tích hi qui tuyến tính (linear regression analysis) có l là mt trong nhng
phương pháp phân tích s liu thông dng nht trong thng kê hc. Anon tng viết “Cho
con người 3 vũ khí – h s tương quan, hi qui tuyến tính và mt cây bút, con người s
s dng c ba”! Trong chương này, tôi s gii thiu cách s dng R để phân tích hi qui
tuyến tính và các phương pháp liên quan như h s tương quan và kim định gi thiết
thng kê.
Ví d 1. Để minh ha cho vn đề, chúng ta th xem xét nghiên cu sau đây, mà
trong đó nhà nghiên cu đo lường độ cholestrol trong máu ca 18 đối tượng nam. T
trng cơ th (body mass index) cũng được ước tính cho mi đối tượng bng công thc
tính BMI là ly trng lượng (tính bng kg) chia cho chiu cao bình phương (m
2
). Kết qu
đo lường như sau:
Bng 1. Độ tui, t trng cơ th và cholesterol
Mã s ID
(id)
Độ tui
(age)
BMI
(bmi)
Cholesterol
(chol)
1 46 25.4 3.5
2 20 20.6 1.9
3 52 26.2 4.0
4 30 22.6 2.6
5 57 25.4 4.5
6 25 23.1 3.0
7 28 22.7 2.9
8 36 24.9 3.8
9 22 19.8 2.1
10 43 25.3 3.8
11 57 23.2 4.1
12 33 21.8 3.0
13 22 20.9 2.5
14 63 26.7 4.6
15 40 26.4 3.2
16 48 21.2 4.2
17 28 21.2 2.3
18 49 22.8 4.0
Nhìn sơ qua s liu chúng ta thy người có độ tui càng cao độ cholesterol cũng
càng cao. Chúng ta th nhp s liu này vào R và v mt biu đồ tán x như sau:
> age <- c(46,20,52,30,57,25,28,36,22,43,57,33,22,63,40,48,28,49)
Phân tích hồi quy tuyến tinh - Trang 2
Để xem tài liệu đầy đủ. Xin vui lòng
Phân tích hồi quy tuyến tinh - Người đăng: tranquocbao1993
5 Tài liệu rất hay! Được đăng lên bởi - 1 giờ trước Đúng là cái mình đang tìm. Rất hay và bổ ích. Cảm ơn bạn!
29 Vietnamese
Phân tích hồi quy tuyến tinh 9 10 78