Ktl-icon-tai-lieu

Thuật toán apriori

Được đăng lên bởi cuongd12cn5
Số trang: 27 trang   |   Lượt xem: 205 lần   |   Lượt tải: 0 lần
- 37 -

CHƯƠNG III
MỘT SỐ THUẬT TOÁN KHAI PHÁ DỮ LIỆU
3.1. Gom cụm trên cơ sở dữ liệu chuỗi thời gian
Phân tích chuỗi thời gian được nghiên cứu và sử dụng trong một thời gian dài.
Một trong những mục tiêu hàng đầu của việc phân tích chuỗi thời gian là nhằm dự
đoán phản ứng trong tương lai của tín hiệu dựa trên các quan sát trong quá khứ. Nói
cách khác, việc phân tích chuỗi thời gian chính là xác định giá trị tương lai dựa trên
chuỗi thời gian đã có cho đến thời điểm hiện tại. Trong thống kê, các mô hình Moving
average (MA), Autoregressive (AR), . . . để phân tích sự tương quan về dự đoán, đây là
các kỹ thuật xử lý trên chuỗi thời gian tập trung vào tính tổng quát, quan tâm đến xu
hướng trên toàn chuỗi thời gian. Các nghiên cứu gần đây thường khám phá các mẫu
mang tính cục bộ trên chuỗi thời gian vì vậy gom cụm bắt đầu được quan tâm nhiều
hơn. Tuy nhiên gom cụm chuỗi thời gian gần đây được mọi người nghiên cứu nhiều
hơn, người ta bắt đầu nhận thấy gom cụm quan trọng hơn phân tích tương quan trong
việc tìm các quan hệ bền vững trên dữ liệu chuỗi thời gian.
Gom cụm các chuỗi thời gian thành từng nhóm sao cho độ tương đồng của các
chuỗi thời gian trong cùng nhóm cao nhất và các chuỗi thời gian trong các nhóm khác
nhau thì độ tương đồng thấp. Nói cách khác gom cụm dữ liệu là tạo ra một phép phân
hoạch trên cơ sở dữ liệu chuỗi thời gian, mỗi một chuỗi thời gian chỉ thuộc về một
nhóm duy nhất. Việc gom cụm trên các tập dữ liệu phải thỏa được yêu cầu sau
đây:[2][9]
- Cho T là một tập các chuỗi thời gian và C1, C2, . . ., Ck là các nhóm thu được
sau khi thực hiện gom cụm thì các nhóm phải thỏa các tính chất:

- 38 -

1.i, j  [1,..., k ], Ci  C j  
k

2.  Ci  T
i 1

(a)

(b)
Hình 3.1 Gom cụm dữ liệu

Ví dụ trên về gom cụm dữ liệu. Dữ liệu vào thể hiện trên hình (a) và kết quả
gom cụm mong muốn trên hình (b). Các phần tử trên cùng một nhóm được gán cùng
một nhãn.
Ta phải duyệt qua toàn bộ cơ sở dữ liệu và sử dụng một độ đo tương đồng thích
hợp gom cụm các đối tượng. Có nhiều phương pháp gom cụm có thể thực hiện trên cơ
sở dữ liệu chuỗi thời gian cho ra kết quả tốt. Các chuỗi thời gian trong cùng một nhóm
thể hiện cùng một kiểu biến thiên, mỗi nhóm có một phần tử đại diện mà ta gọi là mẫu
đặc trưng. Kết quả của giai đoạn gom cụm là cơ sở dữ liệu ban đầu chuyển về cơ sở dữ
liệu các mẫu đặc trưng cho từng nhóm.
Các phương pháp gom cụm được chia thành hai loại: Phương pháp biệt số dựa
trên độ tương đồng và phương pháp tổng quát dựa trên mô hình. Luận văn này tập...
- 37 -
CHƯƠNG III
MỘT SỐ THUẬT TOÁN KHAI PHÁ DỮ LIỆU
3.1. Gom cụm trên cơ sở dữ liệu chuỗi thời gian
Phân tích chuỗi thời gian được nghiên cứu sử dụng trong một thời gian dài.
Một trong những mục tiêu hàng đầu của việc phân tích chuỗi thời gian nhằm dự
đoán phản ứng trong tương lai của tín hiệu dựa trên các quan sát trong quá khứ. Nói
cách khác, việc phân tích chuỗi thời gian chính xác định giá trị tương lai dựa trên
chuỗi thời gian đã có cho đến thời điểm hiện tại. Trong thống kê, các hình Moving
average (MA), Autoregressive (AR), . . . để phân tích sự tương quan về dự đoán, đây
các kỹ thuật xử trên chuỗi thời gian tập trung vào tính tổng quát, quan tâm đến xu
hướng trên toàn chuỗi thời gian. Các nghiên cứu gần đây thường khám phá các mẫu
mang tính cục bộ trên chuỗi thời gian vậy gom cụm bắt đầu được quan tâm nhiều
hơn. Tuy nhiên gom cụm chuỗi thời gian gần đây được mọi người nghiên cứu nhiều
hơn, người ta bắt đầu nhận thấy gom cụm quan trọng hơn phân tích tương quan trong
việc tìm các quan hệ bền vững trên dữ liệu chuỗi thời gian.
Gom cụm các chuỗi thời gian thành từng nhóm sao cho độ tương đồng của các
chuỗi thời gian trong cùng nhóm cao nhất các chuỗi thời gian trong các nhóm khác
nhau thì độ tương đồng thấp. i cách khác gom cụm dữ liệu tạo ra một phép phân
hoạch trên sở dữ liệu chuỗi thời gian, mỗi một chuỗi thời gian chỉ thuộc về một
nhóm duy nhất. Việc gom cụm trên các tập dữ liệu phải thỏa được yêu cầu sau
đây:[2][9]
- Cho T một tập các chuỗi thời gian C
1
, C
2
, . . ., C
k
các nhóm thu được
sau khi thực hiện gom cụm thì các nhóm phải thỏa các tính chất:
Thuật toán apriori - Trang 2
Để xem tài liệu đầy đủ. Xin vui lòng
Thuật toán apriori - Người đăng: cuongd12cn5
5 Tài liệu rất hay! Được đăng lên bởi - 1 giờ trước Đúng là cái mình đang tìm. Rất hay và bổ ích. Cảm ơn bạn!
27 Vietnamese
Thuật toán apriori 9 10 236