Ktl-icon-tai-lieu

ỨNG DỤNG MÔ HÌNH MARKOV ẨN ĐỂ NHẬN DẠNG TIẾNG NÓI TRÊN FPGA

Được đăng lên bởi Thanhcan Aomori
Số trang: 7 trang   |   Lượt xem: 1208 lần   |   Lượt tải: 2 lần
Tạp chí Khoa học Trường Đại học Cần Thơ

Phần A: Khoa học Tự nhiên, Công nghệ và Môi trường: 25 (2013): 1-7

ỨNG DỤNG MÔ HÌNH MARKOV ẨN ĐỂ NHẬN DẠNG TIẾNG NÓI TRÊN FPGA
Nguyễn Cao Quí1
1

Bộ môn Điện tử Viễn thông, Khoa Công nghệ, Trường Đại học Cần Thơ

Thông tin chung:
Ngày nhận: 11/10/2011
Ngày chấp nhận: 25/03/2013
Title:
Speech recognition using hidden
Markov model on FPGA
Từ khóa:
Nhận dạng, tiếng nói, mô hình
Markov ẩn, FPGA
Keywords:
Speech recognition, hidden Markov
model, FPGA

ABSTRACT
Hidden Markov Model (HMM) is a statistical model, well suited for
pattern recognition: speech, image, handwriting,... HMM has widely
used in the last several years because of the two reasons. First it can
perform with high accuracy in a wide range of application, second the
model structure can be changed easily to fit practical applications.
This paper focused on studying of HMM for speech recognition and
installing it on FPGA. HMM has many parameters, so choosing
appropriate parameters of the model for the FPGA is included in the
project. The selection is very important and must balance between time
and accuracy.

TÓM TẮT
Mô hình Markov ẩn (HMM) là một mô hình thống kê, thích hợp ứng
dụng trong việc nhận dạng mẫu: tiếng nói, hình ảnh và chữ viết…
HMM được ứng dụng rộng rãi trong những năm gần đây vi hai lý do.
Thứ nhất, mô hình có độ chính xác cao trong nhiều ứng dụng; Thứ hai,
cấu trúc mô hình có thể thay đổi dễ dàng cho phù hợp với từng ứng
dụng cụ thể.
Bài báo này tập trung nghiên cứu mô hình Markov ẩn theo hướng ứng
dụng nhận dạng tiếng nói và cài đặt mô hình này lên chip FPGA. HMM
có nhiều tham số, vì vậy việc lựa chọn tham số sao cho tốt nhất cũng
được thực hiện trong đề tài. Việc lựa chọn này rất quan trọng, nó phải
đạt được sự cân bằng giữa tốc độ xử lý và độ chính xác.
Hệ thống nhận dạng này được cài đặt trên FPGA để nhận dạng các từ
đơn, số lượng từ trong bộ từ vựng có thể thay đổi nhờ khả năng có thể
huấn luyện của HMM.
Do hệ thống nhận dạng này được cài đặt trên FPGA nên nó chiếm
khoảng không nhỏ, thích hợp ứng dụng trong giao tiếp người-máy,
robot, điều khiển bằng tiếng nói hay hỗ trợ người khuyết tật…

lĩnh vực nhận dạng. Do đạt được độ chính xác
cao và có khả năng thay đổi cấu trúc dễ dàng
nên mô hình này ngày càng được sử dụng rộng
rãi trong nhiều lĩnh vực, đặc biệt là trong lĩnh
vực nhận dạng tiếng nói.

1 GIỚI THIỆU
HMM được bắt đầu xây dựng và công bố từ
những năm 1960, đây là mô hình toán học về
thống kê. Nhiều năm sau đó (từ 1980), mô hình
nà...
Tp chí Khoa hc Trường Đại hc Cn Thơ Phn A: Khoa hc T nhiên, Công ngh và Môi trường: 25 (2013): 1-7
1
NG DNG MÔ HÌNH MARKOV N ĐỂ NHN DNG TING NÓI TRÊN FPGA
Nguyn Cao Quí
1
1
B môn Đin t Vin thông, Khoa Công ngh, Trường Đại hc Cn Thơ
Thông tin chung:
Ngày nhn: 11/10/2011
Ngày chp nhn: 25/03/2013
Title:
Speech recognition using hidden
Markov model on FPGA
T khóa:
Nhn dng, tiếng nói, mô hình
Markov n, FPGA
Keywords:
Speech recognition, hidden Markov
model, FPGA
ABSTRACT
H
idden Markov Model (HMM) is a statistical model, well suited for
pattern recognition: speech, image, handwriting,... HMM has widely
used in the last several years because of the two reasons. First it can
perform with high accuracy in a wide range of application, second the
model structure can be changed easily to fit practical applications.
This paper focused on studying of HMM for speech recognition and
installing it on FPGA. HMM has many parameters, so choosing
appropriate parameters of the model for the FPGA is included in the
project. The selection is very important and must balance between time
and accuracy.
TÓM TT
Mô hình Markov n (HMM) là mt mô hình thng kê, thích hp ng
dng trong vic nhn dng mu: tiếng nói, hình nh và ch viết…
HMM đưc ng dng rng rãi trong nhng năm gn đây vi hai lý do.
Th nht, mô hình có độ chính xác cao trong nhiu ng dng; Th hai,
cu trúc mô hình có th thay đổi d dàng cho phù hp vi tng ng
dng c th.
Bài báo này tp trung nghiên cu mô hình Markov n theo hướng ng
dng nh
n dng tiếng nói và cài đặt mô hình này lên chip FPGA. HM
M
có nhiu tham s, vì vy vic la chn tham s sao cho tt nht cũng
được thc hin trong đề tài. Vic la chn này rt quan trng, nó phi
đạt được s cân bng gia tc độ x lý và độ chính xác.
H thng nhn dng này được cài đặt trên FPGA để nhn dng các t
đơn, s lượng t trong b t vng có th thay đổi nh kh
năng có th
hun luyn ca HMM.
Do h thng nhn dng này được cài đặt trên FPGA nên nó chiếm
khong không nh, thích hp ng dng trong giao tiếp người-máy,
robot, điu khin bng tiếng nói hay h tr người khuyết tt…
1 GII THIU
HMM được bt đầu xây dng và công b t
nhng năm 1960, đây là mô hình toán hc v
thng kê. Nhiu năm sau đó (t 1980), mô hình
này được bt đầu nghiên cu để ng dng trong
lĩnh vc nhn dng. Do đạt được độ chính xác
cao và có kh năng thay đổi cu trúc d dàng
nên mô hình này ngày càng được s dng rng
rãi trong nhiu lĩnh vc, đặc bi
t là trong lĩnh
vc nhn dng tiếng nói.
ỨNG DỤNG MÔ HÌNH MARKOV ẨN ĐỂ NHẬN DẠNG TIẾNG NÓI TRÊN FPGA - Trang 2
Để xem tài liệu đầy đủ. Xin vui lòng
ỨNG DỤNG MÔ HÌNH MARKOV ẨN ĐỂ NHẬN DẠNG TIẾNG NÓI TRÊN FPGA - Người đăng: Thanhcan Aomori
5 Tài liệu rất hay! Được đăng lên bởi - 1 giờ trước Đúng là cái mình đang tìm. Rất hay và bổ ích. Cảm ơn bạn!
7 Vietnamese
ỨNG DỤNG MÔ HÌNH MARKOV ẨN ĐỂ NHẬN DẠNG TIẾNG NÓI TRÊN FPGA 9 10 996