Ktl-icon-tai-lieu

Quét rác hệ thống

Được đăng lên bởi Tâm Tồ
Số trang: 22 trang   |   Lượt xem: 275 lần   |   Lượt tải: 0 lần
XÂY DỰNG HỆ THỐNG QUÉT THƯ RÁC TRÊN MÔI
TRƯỜNG PHÂN TÁN

Nhóm thực hiện:
Trần Kinh Lý – 0612252
Phạm Quốc Mỹ – 0612271
Giáoviên hướng dẫn:
GVC.Cao ĐăngTân
ThS. Đào Anh Tuấn

Nội dung

1

2

3

Tổngquanvềthưrác

Cáckỹthuậtquétthưrácsửdụngtronghệthống

4

Hệthốngthửnghiệm

5

Cáckếtquảđạtđược

6

Page2

Tổngquanvềluậnvăn.

Hướngpháttriển

Tổngquanvềluậnvăn

 Mục đích chọn luận văn
•

Thư rác là một trong những thách thức lớn nhất hiện nay.

•

Đa số các phần mềm chống thư rác là dựa trên header của thư hoặc địa chỉ từ người gửi
=> luận văn dựa vào nội dung của thư
=> tốc độ quét thư chậm
=> quét thư trên môi trường song song

Vì những lý do trên đề tài “Xây dựng hệ thống quét thư rác trên môi trường phân tán” được hình
thành.

Page3

Tổngquanvềthưrác

 Địnhnghĩathưrác:

thư rác là thư điện tử không theo mong muốn của người nhận và trong số đó các thư điện tử quảng cáo, thương mại
chiếm đa số

Page4

Tổngquanvềthưrác

 Các đặc tính của thư rác:

Page5

•

Thư rác mang tính tương đối.

•

Tính bất biến trong một thư rác.

Cáckỹthuậtlọcthưrác

 Blacklisting:danhsáchđịachỉkhôngtincậy.
 Whitelisting:danhsáchđịachỉtincậy.
 Heuristic filtering:dựavàotậpluật.
 Challenge/ Response:xácthựcngườidùng.
 Throttling:khốngchếsốlượngemailđượcgửi.
 Address obfuscation:thayđổiđịnhdạngchốngthuthậpemail.
 Collaborative filtering:nhómngườidùngtincậy.

Page6

Các kỹ thuật quét thư rác sử dụng trong hệ thống xây dựng

 Kỹ thuật thống kê
 Kỹ thuật so khớp

Page7

Các kỹ thuật quét thư rác sử dụng trong hệ thống xây dựng

 Kỹ thuật thống kê
Thưđiệntử
Thưđiệntử

Tậpdữliệu
Tậpdữliệu

Bộtáchtừ
Bộtáchtừ

lịchsử
lịchsử

Huấnluyện
Huấnluyện

Máyphântích
Máyphântích

Sai

Làspam ?

Gửitớingườidùng
Gửitớingườidùng

Ngườidùng
Ngườidùng

Đúng

phảnhồi
phảnhồi
Đánhdấu
Đánhdấu

Bộlọcxác
địnhđúng?

PHÂN LOẠI
Page8

HUẤN LUYỆN

Không

Các kỹ thuật quét thư rác sử dụng trong hệ thống xây dựng

 Kỹ thuật thống kê
BỘTÁCH TỪ

MÁYPHÂN TÍCH

HUẤN LUYỆN

-TáchthôngđiệpthànhcáctừdựatrênvnTokenizer.

-

-

-Tínhgiátrịchocáctừ

Tínhxácxuấtchungcủathôngđiệpđ

Họclạicácthôngđiệpmàngườidù

ểxácđịnhthôngđiệpđócóphảilàspa

ngbáođãphânloạisai

m haykhông.

Chứcnăng

-Bỏ các tag HTML,các dấu chấm câu, các ký hiệu
không có nghĩa.
-Đối với tiếng Việt nên bỏ các hư từ (thì, là, mà..).

Cảitiến

-Quét các tập tin đính kèm để trích văn bản nội dung
cho bộ tách từ (word, excel, power point và pdf).

Page9

Kiểmtrađộchínhxáccủabộlọcthưrác

Page10

Các kỹ thuật quét thư rác sử dụng trong h...
XÂY DỰNG HỆ THỐNG QUÉT THƯ RÁC TRÊN MÔI
TRƯỜNG PHÂN TÁN
Nhóm thực hiện:
Trần Kinh Lý – 0612252
Phạm Quốc Mỹ – 0612271
Giáoviên hướng dẫn:
GVC.Cao ĐăngTân
ThS. Đào Anh Tuấn
Quét rác hệ thống - Trang 2
Để xem tài liệu đầy đủ. Xin vui lòng
Quét rác hệ thống - Người đăng: Tâm Tồ
5 Tài liệu rất hay! Được đăng lên bởi - 1 giờ trước Đúng là cái mình đang tìm. Rất hay và bổ ích. Cảm ơn bạn!
22 Vietnamese
Quét rác hệ thống 9 10 51