Ktl-icon-tai-lieu

Luật kết hợp

Được đăng lên bởi Queenvi Nguyen
Số trang: 27 trang   |   Lượt xem: 707 lần   |   Lượt tải: 0 lần
1. Khai phá luật kết hợp:

Mục đích chính của khai phá dữ liệu là các tri thức được kiết xuất ra sẽ được sử
dụng trong dự báo thông tin trợ giúp trong sản xuất kinh doanh và nghiên cứu
khoa học.
Trong hoạt động sản xuất kinh doanh, ví dụ kinh doanh các mặt hàng tại siêu
thị, các nhà quản lý rất thích có được các thông tin mang tính thống kê như: “
90% phụ nữ có xe máy màu đỏ và đeo đồng hồ Thuỵ Sỹ thì dùng nước hoa
hiệu Chanel ” hoặc “ 70% khách hàng là công nhân khi mua TV thường mua
loại TV 21 inches ”. Những thông tin như vậy rất hữu ích trong việc định
hướng kinh doanh. Vậy vấn đề đặt ra là liệu có tìm được các luật như vậy
bằng các công cụ khai phá dữ liệu hay không? Câu trả lời là hoàn toàn có thể.
Đó chính là nhiệm vụ khai phá luật kết hợp.
Giả sử chúng ta có một CSDL D. Luật kết hợp cho biết phạm vi mà trong
đó sự xuất hiện của tập các mục X nào đó trong các bản ghi của D sẽ kéo
theo sự xuất hiện của một tập những mục T cũng trong những bản ghi đó.
Mỗi luật kết hợp được đặc trưng bởi một cặp tỉ lệ. Mỗi tỉ lệ hỗ trợ được
biểu diễn bằng tỉ lệ % những bản ghi trong D chứa cả X và T.
Vấn đề khám phá luật kết hợp được phát biểu như sau: Cho trước tỉ lệ hỗ
trợ a và độ tin cậy b. Đánh số tất cả các luật trong D có các giá trị tỉ lệ hỗ trợ
và tin cậy lớn hơn a và b tương ứng.
Giả thiết D là CSDL giao dịch và với a = 40%, b = 90%. Vấn đề phát hiện
luật kết hợp được thực hiện như sau:
Liệt kê, đếm tất cả những qui luật chỉ ra sự xuất hiện một số các mục sẽ kéo
theo một số mục khác.
Chỉ xét những qui luật mà tỉ lệ hỗ trợ lớn hơn 40% và độ tin cậy lớn hơn
90%.
Hãy tưởng tượng, một công ty bán hàng qua mạng Internet. Các khách hàng
được yêu cầu điền vào các mẫu bán hàng để công ty có được một CSDL về các

yêu cầu của khách hàng. Giả sử công ty quan tâm đến mối quan hệ "tuổi, giới
tính, nghề nghiệp và sản phẩm". Khi đó có thể có rất nhiều câu hỏi tương ứng
với luật trên. Ví dụ trong lứa tuổi nào thì những khách hàng nữ là công nhân
đặt mua mặt hàng gì đó, ví dụ áo dài chẳng hạn là nhiều nhất, thoả mãn một
ngưỡng nào đó ?
2. Lý thuyết về luật kết hợp
2.1. Định nghĩa luật kết hợp
Một luật kết hợp có dạng R: X => Y, trong đó, X, Y là các tập mục, X,Y 
I và X ∩ Y=
 X được gọi là tiền đề và
 Y được gọi là hệ quả của luật.

2.2 Khái niệm
 Cho một tập I = {I1, I2, ..., Im} các tập m mục, một giao dịch T được
định nghĩa như một tập con của các mục trong I (T  I).
 Gọi D là CSDL của n giao dịch và mỗi giao dịch được đánh nhãn với một
định danh duy nhất. Nói rằng,...
1. Khai phá luật kết hợp:
Mục đích chính của khai phá dữ liệu là các tri thức được kiết xuất ra sẽ được sử
dụng trong dự báo thông tin trợ giúp trong sản xuất kinh doanh nghiên cứu
khoa học.
Trong hoạt động sản xuất kinh doanh, dụ kinh doanh các mặt hàng tại siêu
thị, các nhà quản rất thích được các thông tin mang tính thống như:
90% phụ nữ xe máy màu đỏ đeo đồng hồ Thuỵ Sỹ thì dùng nước hoa
hiệu Chanel hoặc 70% khách hàng công nhân khi mua TV thường mua
loại TV 21 inches ”. Những thông tin như vậy rất hữu ích trong việc định
hướng kinh doanh. Vậy vấn đề đặt ra liệu tìm được c luật như vậy
bằng các công cụ khai phá dữ liệu hay không? Câu trả lời hoàn toàn thể.
Đó chính là nhiệm vụ khai phá luật kết hợp.
Giả sử chúng ta một CSDL D. Luật kết hợp cho biết phạm vi trong
đó sự xuất hiện của tập các mục X o đó trong các bản ghi của D sẽ kéo
theo sự xuất hiện của một tập những mục T cũng trong những bản ghi đó.
Mỗi luật kết hợp được đặc trưng bởi một cặp tỉ lệ. Mỗi tỉ lệ h trợ được
biểu diễn bằng tỉ lệ % những bản ghi trong D chứa cả X và T.
Vấn đề khám phá luật kết hợp được phát biểu như sau: Cho trước tỉ lệ h
trợ a độ tin cậy b. Đánh số tất cả các luật trong D các giá trị tỉ lệ hỗ trợ
và tin cậy lớn hơn a và b tương ứng.
Giả thiết D CSDL giao dịch với a = 40%, b = 90%. Vấn đề phát hiện
luật kết hợp được thực hiện như sau:
Liệt kê, đếm tất cả những qui luật chỉ ra sự xuất hiện một số các mục sẽ kéo
theo một số mục khác.
Chỉ xét những qui luật mà tỉ l hỗ trợ lớn hơn 40% độ tin cậy lớn hơn
90%.
Hãy tưởng tượng, một công ty bán hàng qua mạng Internet. Các khách hàng
được yêu cầu điền vào các mẫu bán hàng để công ty có được một CSDL về các
Luật kết hợp - Trang 2
Để xem tài liệu đầy đủ. Xin vui lòng
Luật kết hợp - Người đăng: Queenvi Nguyen
5 Tài liệu rất hay! Được đăng lên bởi - 1 giờ trước Đúng là cái mình đang tìm. Rất hay và bổ ích. Cảm ơn bạn!
27 Vietnamese
Luật kết hợp 9 10 985