Ktl-icon-tai-lieu

Đồ án Nhận dạng đối tượng dùng SURF và BoW

Được đăng lên bởi winev52
Số trang: 4 trang   |   Lượt xem: 947 lần   |   Lượt tải: 4 lần
NHẬN DẠNG ĐỐI TƯỢNG TRONG ẢNH
SỬ DỤNG BAG OF FEATURES VÀ SUPPORT VECTOR MACHINE
Lý Quốc Thắng
MSSV: 1112298
Bộ môn Nhập môn Thị giác máy tính
Khoa Công nghệ thông tin
Trường Đại học Khoa học Tự nhiên
Đại học Quốc gia thành phố Hồ Chí Minh
Email: 1112298@student.hcmus.edu.vn

Tóm tắt: Bài toán nhận dạng đối tượng đang được quan tâm
hiện nay và có nhiều hướng tiếp cận. Hướng tiếp cận sử dụng
Bag of Features được xem là có nhiều ưu điểm và đang được
phát triển. Bag of Features là một biến thể của mô hình Bag of
Words, mô hình được sử dụng trong xử lí văn bản và có hiệu
quả tốt. Chúng em tiến hành cài đặt thuật toán nhận dạng đối
tượng bằng cách dùng đặc trưng SIFT trong mô hình Bag of
Features và sau đó dùng mô hình học SVM để huấn luyện tập
dữ liệu. Bài toán được kiểm tra trên tập dữ liệu có 4 loại đối
tượng, mỗi loại đối tượng có 60 ảnh để học và 60 ảnh để kiểm
tra, sau đó làm ngược lại. Kết quả thu được là tỉ lệ nhận dạng
sai là 15,1855%. Hướng tiếp cận này mang lại hiệu quả tốt và
có thể áp dụng lên nhiều loại đối tượng khác nhau.
Từ khóa: nhận dạng đối tượng, bag of features, SIFT, SVM

I. GIỚI THIỆU
Nhận dạng đối tượng là một trong những bài toán chính
trong lĩnh vực thị giác máy tính và khoa học robot. Nhận
dạng đối tượng được áp dụng rất nhiều vào các vấn đề của xã
hội và kinh tế, ví dụ như việc điều khiển robot tự động, nhận
dạng các loại hàng hóa, nhận dạng khung cảnh… Các vấn đề
này thường theo một kiểu chung là dựa vào một hay nhiều
ảnh đầu vào và xác định xem các đầu vào đó thể hiện đối
tượng gì.
Nhận dạng đối tượng là một thuật ngữ chung cho nhiều
bài toán con khác. Các bài toán con này có nhiều dạng, và có
thể được giải quyết bằng nhiều hướng tiếp cận khác nhau.
Các bài toán này được áp dụng trong các lĩnh vực khác nhau
như trong công nghiệp, trong bảo mật, trong y tế,v.v. Trong
sách của tác giả Macro Treiber [1] đã phân chia các ứng
dụng như sau: bài toán tính khoảng cách của vật được dùng
trong các ứng dụng công nghiệp; bài toán kiểm tra sản phầm;
sắp xếp hay đếm các đồ vật; phát hiện vật thể; phân loại
cảnh; hay dùng ảnh để tìm kiếm.
Các ứng dụng trên đã thể hiện được tầm quan trong của
bài toán nhận dạng đối tượng. Vì thế, có rất nhiều hướng tiếp
cận cho bài toán này. Không có một hướng tiếp cận cụ thể
nào được xem là tốt nhất hay cơ bản nhất, tùy theo từng bài
toán mà chúng ta có những hướng tiếp cận khác nhau. Các
hướng tiếp cận này chủ yếu khác nhau ở những điểm cơ bản
sau [1]: việc thể hiện đối tượng (thể hiện đối tượng bằng mô

hình hì...
NHN DẠNG ĐỐI TƯỢNG TRONG NH
S DNG BAG OF FEATURES VÀ SUPPORT VECTOR MACHINE
Lý Quc Thng
MSSV: 1112298
B môn Nhp môn Th giác máy tính
Khoa Công ngh thông tin
Trường Đại hc Khoa hc T nhiên
Đại hc Quc gia thành ph H Chí Minh
Email: 1112298@student.hcmus.edu.vn
m tt: Bài toán nhn dạng đối tượng đang được quan tâm
hin nay nhiều hướng tiếp cận. Hướng tiếp cn s dng
Bag of Features được xem nhiều ưu điểm đang được
phát trin. Bag of Features là mt biến th ca mô hình Bag of
Words, hình được s dng trong x văn bản và hiu
qu tt. Chúng em tiến hành cài đặt thut toán nhn dạng đối
ng bằng cách ng đặc trưng SIFT trong mô hình Bag of
Features sau đó dùng hình hc SVM để hun luyn tp
d liu. Bài toán được kim tra trên tp d liu có 4 loại đối
ng, mi loại đối tượng 60 ảnh để hc và 60 ảnh để kim
tra, sau đó làm ngược li. Kết qu thu được t l nhn dng
sai 15,1855%. Hướng tiếp cn này mang li hiu qu tt
có th áp dng lên nhiu loại đối tượng khác nhau.
T khóa: nhn dạng đối tượng, bag of features, SIFT, SVM
I. GII THIU
Nhn dng đối tượng mt trong nhng i toán cnh
trong lĩnh vc th giác máy tính và khoa hc robot. Nhn
dạng đối tượng đưc áp dng rt nhiu vào các vấn đề ca xã
hi và kinh tế, d như việc điều khin robot t động, nhn
dng các loi hàng hóa, nhn dng khung cnh Các vấn đề
này thường theo mt kiu chung là da vào mt hay nhiu
ảnh đầu vào xác định xem các đầu vào đó thể hin đối
ng gì.
Nhn dng đối tượng mt thut ng chung cho nhiu
bài toán con khác. Các bài toán con này có nhiu dng, có
th đưc gii quyết bng nhiều hướng tiếp cn khác nhau.
Các bài toán này được áp dụng trong các lĩnh vực khác nhau
như trong ng nghiệp, trong bo mt, trong y tế,v.v. Trong
sách ca tác gi Macro Treiber [1] đã phân chia các ng
dụng như sau: bài toán nh khong cách ca vt được dùng
trong các ng dng công nghip; bài toán kim tra sn phm;
sp xếp hay đếm các đồ vt; phát hin vt th; phân loi
cnh; hay dùng ảnh để tìm kiếm.
Các ng dụng trên đã thể hin được tm quan trong ca
bài toán nhn dạng đối tượng. Vì thế, có rt nhiu hướng tiếp
cn cho bài toán này. Không có một ng tiếp cn c th
nào được xem tt nhất hay bản nht, tùy theo tng i
toán mà cng ta những ng tiếp cn khác nhau. Các
hướng tiếp cn này ch yếu khác nhau những đim bản
sau [1]: vic th hin đối tượng (th hin đối tượng bng mô
hình hình hc hay bng v b ngoài); phm vi biu din ca
d liệu đối tượng (d liu th hin toàn b đối tượng hay ch
mt phn ca đối tượng); s bt biến ca thuật toán đối vi
các phép biến đổi hình học (như phép quay, phép tịnh tiến, t
lệ,…); nh chất ca d liu nh (có b nhiu hay che
khuất hay không,…); phương thức so khp gia nh
hình của đối tượng; phm vi ca d liệu dùng để so sánh.
Trong báo cáo này, chúng em ch tp trung tìm hiu v
bài toán nhn dng đối tượng trong ảnh sau khi đã hc t tp
đối tượng hc. Và thut ng nhn dạng đối tượng ng được
s dng cho i toán này. Ni dung chính s dng
hình Bag of Features (da trên nh Bag of Words [2])
được xây dng da trên việc rút trích đặc trưng cc b ca
nh. Việc rút trích đặc trưng cục b nhiu loại đặc trưng
như đặc trưng SIFT [3], đặc trưng SURF [4] nhng đặc
trưng ph biến và ra đời trước đó hay những đặc trưng
FREAK [5] BRISK [6] ra đơi sau này. Do nh ph biến
d s dng nên chúng em s dng đặc trưng SURF. Sau
đó dùng mô hình phân lớp SVM [7] để hc và kim tra thut
toán. ng tiếp cn này s đưc nói chi tiết hơn phn III -
ng tiếp cn ca bài báo cáo này.
Trong phn II Các công trình liên quan s trình bày chi
tiết v mt s hướng tiếp cn khác trong bài toán nhn dng
đối tượng. Hướng tiếp cn chính ca nhóm s được gii
thiu trong phn III. Việc đánh giá thực nghim, và kết qu
được nêu c th trong phn IV. Phn V là kết luận hướng
phát trin ca bài báo.
II. CÁC NGHIÊN CU LIÊN QUAN
Trước tiên, cn hiu các khái nim bản trong i
toán nhn dạng đối tượng (terminology):
Recognition (nhn dng): được dùng trong nhiu
trường hợp khác nhau như ng để đnh danh, pn
loi, phân bit các đối tượng. Trong báo cáo này,
recognition thiên v vic pn loại đối tượng (nga
chúng ta cho biết đối tượng đầu vào thuc loi đối
ng nào).
Object (đối tượng): các đối tượng để nhn dng
nhiu loi như khuôn mặt người, đng vt, đồ vt
hng ngày, sn phm ng nghip hay mt cnh vt
(như cnh rừng, cánh đồng, thành ph,…). Trong i
Đồ án Nhận dạng đối tượng dùng SURF và BoW - Trang 2
Đồ án Nhận dạng đối tượng dùng SURF và BoW - Người đăng: winev52
5 Tài liệu rất hay! Được đăng lên bởi - 1 giờ trước Đúng là cái mình đang tìm. Rất hay và bổ ích. Cảm ơn bạn!
4 Vietnamese
Đồ án Nhận dạng đối tượng dùng SURF và BoW 9 10 56