Ktl-icon-tai-lieu

Nghiên cứu giải thuật học cộng tác (Co-training) và ứng dụng vào bài toán khai phá quan điểm

Được đăng lên bởi ky-thuat
Số trang: 16 trang   |   Lượt xem: 2074 lần   |   Lượt tải: 7 lần
Nghiên cứu giải thuật học cộng tác (Cotraining) và ứng dụng vào bài toán khai phá
quan điểm
Võ Văn Thưởng
Trường Đại học Công nghệ
Luận văn ThS. ngành: Hệ thống thông tin; Mã số: 60 48 05
Người hướng dẫn: TS. Nguyễn Trí Thành
Năm bảo vệ: 2012
Abstract. Trình bày các kiến thức cơ sở liên quan đến nghiên cứu giải thuật học
công tác và ứng dụng vào bài toán khai phá quan điểm. Nghiên cứu khai phá quan
điểm và ứng dụng: Khai phá quan điểm (Opinion mining); các thuật toán học có
giám sát và phương pháp đánh giá bộ phân lớp. Trình bày ứng dụng học bán giám
sát vào bài toán khai phá quan điểm: Cách tiếp cận và giải quyết bài toán; lựa chọn
dữ liệu; trích chọn đặc trưng và xác định nhãn; tiền xử lý dữ liệu cũng như chuẩn bị
dữ liệu. Đưa ra kết quả và thực nghiệm.
Keywords. Hệ thống thông tin; Bài toán; Khai phá dữ liệu; Giải thuật học

Content
MỞ ĐẦU
Ý kiến đánh giá của khách hàng, người dùng, cá nhân về một sản phẩm, dịch vụ, chính
sách hay một vấn đề nào đó tồn tại với số lượng lớn trong kho lưu trữ của các công ty, trên
mạng internet. Đối với các công ty, việc khai thác lượng thông tin này giúp họ hiểu rõ hơn về
khách hàng, sản phẩm, dịch vụ của mình. Với các tổ chức, chính phủ thì đây cũng là một
nguồn cung cấp thông tin hữu ích hỗ trợ cho việc ra quyết định, điều chỉnh chính sách.
Bên cạnh các thuật toán học có giám sát, thì các thuật toán học bán giám sát cũng là một
hướng nghiên cứu có nhiều ứng dụng trong thực tế. Đề tài này hướng tới tìm hiểu một thuật
toán học cộng tác - một trong các thuật toán học bán giám sát - và ứng dụng vào bài toán khai
phá quan điểm. Do đặc điểm chỉ cần lượng nhỏ dữ liệu đã được gắn nhãn cùng với lượng lớn
dữ liệu chưa được gắn nhãn làm dữ liệu huấn luyện. Điều này giúp cho việc thu thập, gắn
nhãn cho tập dữ liệu huấn luyện ít tốn kém hơn.
Những nghiên cứu, luận văn liên quan đến phân tích tính chủ quan và phân tích cảm nghĩ
ở nhiều các mức khác nhau cũng như liên quan đến kỹ thuật Co-training cũng đã xuất hiện
nhiều. Tuy nhiên việc kết hợp chúng lại với nhau, dùng kỹ thuật Co-training vào phân tích
tính chủ quan và phân tích cảm nghĩ, thì chưa được phổ biến nhiều qua các bài báo, bằng cả
tiếng Việt và tiếng Anh, được công khai trên mạng. Ngoài ra việc phân tích ở mức câu cũng
là một trở ngại so với ở mức tài liệu [5].
Đề tài luận văn này định hướng giải quyết bài toán phân lớp các câu cảm nghĩ như sau:
Cho một tập văn bản gồm nhiều câu văn tiếng Anh. Phân lớp xem câu nào là câu mô tả cảm

nghĩ, câu nào không. Đối với những câu ...
Nghiên cứu gii thut hc cộng tác (Co-
training) và ứng dụng vào bài toán khai phá
quan điểm
Võ Văn Thưởng
Trường Đại hc Công nghệ
Luận văn ThS. ngành: H thống thông tin; Mã số: 60 48 05
Người hướng dn: TS. Nguyễn Trí Thành
Năm bảo v: 2012
Abstract. Trình y các kiến thức sở liên quan đến nghiên cứu gii thut hc
công tác ng dụng vào bài toán khai phá quan điểm. Nghiên cứu khai phá quan
điểm ng dụng: Khai phá quan điểm (Opinion mining); c thuật toán học
giám sát phương pháp đánh giá bộ phân lớp. Trình bày ng dng học bán giám
sát o bài toán khai phá quan điểm: Cách tiếp cận giải quyết bài toán; lựa chn
d liệu; trích chọn đặc trưng và xác định nhãn; tin x dữ liệu cũng như chuẩn b
d liệu. Đưa ra kết qu và thực nghim.
Keywords. H thống thông tin; Bài toán; Khai phá dữ liu; Gii thut hc
Content
M ĐẦU
Ý kiến đánh giá của khách hàng, người dùng, nhân về một sản phẩm, dịch vụ, chính
sách hay một vấn đề nào đó tồn tại với số lượng lớn trong kho lưu trữ của các công ty, trên
mạng internet. Đối với các công ty, việc khai thác lượng thông tin này giúp họ hiểu rõ hơn về
khách hàng, sản phẩm, dịch vụ của mình. Với các tổ chức, chính phủ thì đây cũng một
nguồn cung cấp thông tin hữu ích hỗ trợ cho việc ra quyết định, điều chỉnh chính sách.
Bên cạnh các thuật toán học có giám sát, thì các thuật toán học bán giám sát cũng một
hướng nghiên cứu nhiều ứng dụng trong thực tế. Đề tài này hướng tới tìm hiểu một thuật
toán học cộng tác - một trong các thuật toán học bán giám sát - và ứng dụng vào bài toán khai
phá quan điểm. Do đặc điểm chỉ cần lượng nhỏ dữ liệu đã được gắn nhãn cùng với lượng lớn
dữ liệu chưa được gắn nhãn làm dữ liệu huấn luyện. Điều y giúp cho việc thu thập, gắn
nhãn cho tập dữ liệu huấn luyện ít tốn kém hơn.
Những nghiên cứu, luận văn liên quan đến phân tích tính chủ quan và phân tích cảm nghĩ
nhiều các mức khác nhau cũng như liên quan đến kỹ thuật Co-training cũng đã xuất hiện
nhiều. Tuy nhiên việc kết hợp chúng lại với nhau, dùng kthuật Co-training vào phân tích
tính chủ quan phân tích cảm ng, thì chưa được phổ biến nhiều qua các bài báo, bằng c
tiếng Việt tiếng Anh, được công khai trên mạng. Ngoài ra việc phân tích mức u cũng
là một trở ngại so với ở mức tài liệu [5].
Đề tài luận văn này định hướng giải quyết bài toán phân lớp các câu cảm nghĩ như sau:
Cho một tập văn bản gồm nhiều câu văn tiếng Anh. Phân lớp xem câu nào câu tả cảm
Nghiên cứu giải thuật học cộng tác (Co-training) và ứng dụng vào bài toán khai phá quan điểm - Trang 2
Để xem tài liệu đầy đủ. Xin vui lòng
Nghiên cứu giải thuật học cộng tác (Co-training) và ứng dụng vào bài toán khai phá quan điểm - Người đăng: ky-thuat
5 Tài liệu rất hay! Được đăng lên bởi - 1 giờ trước Đúng là cái mình đang tìm. Rất hay và bổ ích. Cảm ơn bạn!
16 Vietnamese
Nghiên cứu giải thuật học cộng tác (Co-training) và ứng dụng vào bài toán khai phá quan điểm 9 10 815