Sử dụng SVM trong OpenCV để nhận dạng ký tự

03/11/2016

SVM là một kỹ thuật hay, đơn giản nhưng hiệu quả cao. Các bạn có thể đọc bài LIBSVM – giới thiệu tổng quan và ví dụ để có thể hiểu khái quát SVM là gì. Nhận diện ký tự hay là dự đoán nhãn của ảnh input, ở đây là ảnh ký tự.

Bài này sẽ hướng dẫn các bạn dùng SVM có sẵn trong lib OpenCV để nhận diện ký tự. Bài này khá đơn giản với mục đích cho các bạn thấy tính ứng dụng thực tế của SVM. Sau đó có thể đọc các bài viết nâng cao để hiểu sâu và nâng cao độ chính xác bằng các tham số phù hợp

Các bước thực hiện

Chuẩn bị bộ dữ liệu ký tự
Train SVM
Test (predict) kết quả

Chuẩn bị bộ dữ liệu ký tự

Mình đã chuẩn bị sẵn cho các bạn, bao gồm 2 bộ dữ liệu (nằm chung trong source code cuối bài):

Train set:

Test set:

Mình vẽ ký tự màu đỏ vì màu đen – trắng khá là khó nhìn, còn thực tế là sẽ làm với ảnh xám – gray scale. Link download ở cuối bài.

Train SVM

Thuật toán như sau: với mỗi ảnh 2D chuyển thành ảnh 1D. Sau đó ghép các ảnh 1D thành ảnh 2D dùng để huấn luyện.

Ảnh 1D là ảnh có height = 1, có thể xem nó là mảng 1 chiều. Còn ảnh 2D có height > 1 và cũng xem như là mảng 2 chiều.
Thí dụ: ảnh 2D có kích thước 10 x 10 pixels chuyển thành ảnh 1D có kích thước là 100 x 1 pixels.

Ảnh ký tự 2D và chuyển sang 1D (mình tăng height cho các bạn dễ nhìn)

Minh họa cho việc duỗi thẳng ảnh, các dòng được nối với nhau thành 1 dòng duy nhất.

Sau khi ghép các ký tự từ 0 – 9 được hình như sau:

Tiếp theo là tạo 1 danh sách các nhãn của ảnh train, danh sách nhãn cũng là ảnh 1D theo thứ tự. Do đó danh sách nhãn là 0123456789

Code để train nằm ở cuối bài. Sau khi train thì được 1 file text.

Test (predict) kết quả

Lấy 1 ảnh bất kỳ chưa được train để dự đoán kết quả. Kết quả là nhãn mà chương trình dự đoán dựa trên tập dữ liệu mà các bạn đã cho học.

Source code

Source code SVM OpenCV nằm trong repo các example về Machine Learning. Bạn checkout branch SvmOpenCV để sử dụng.

Trong source code chứa sẵn 2 bộ dữ liệu Train set và Test set. Các bạn build SvmOpenCV_Training.sln để traning file model. Sau khi training model thành công build SvmOpenCV_Classifier.sln để phân lớp hình ảnh.

Các hàm cần thiết của SVM viết sẵn trong file TGMTsvm.cpp. Chúc các bạn thành công.

SvmOpenCV (GitHub)

37 thoughts on “Sử dụng SVM trong OpenCV để nhận dạng ký tự”

Tuan Ngo van says:

15/12/2017 at 8:03 AM

em tải về cho chạy nó báo Error 1 error C1083: Cannot open include file: ‘stdafx.h’: No such file or directory
và không tìm dc nhiều nữa
em phải thay đổi cái gì để nó chạy dc ak

Log in to Reply
1. vohungvi says:
  
  15/12/2017 at 8:13 AM
  
  bạn build solution nào bị lỗi vậy? Mình thử download về build được bình thường.
  
  Lỗi mà bạn cung cấp là do thiếu file stdafx.h, bạn kiểm tra xem có lỡ tay xóa mất không
Tuan Ngo van says:

15/12/2017 at 8:33 AM

nó báo thiếu hết các file trong TGMT
mà trong project em thấy vẫn có

Log in to Reply
1. vohungvi says:
  
  15/12/2017 at 8:40 AM
  
  Mình nghĩ trong quá trình download về source code bị sửa xóa gì rồi, bạn chịu khó download rồi build lại
Tuan Ngo van says:

15/12/2017 at 8:50 AM

anh làm một video hướng dẫn code bài này thì tốt quá

Log in to Reply
1. vohungvi says:
  
  15/12/2017 at 9:01 AM
  
  ok bạn, mình sẽ sắp xếp thời gian để làm video hướng dẫn
Tuan Ngo van says:

15/12/2017 at 9:15 AM

theo như anh nói thì chỉ cần chạy file tranning vs predict
thế file class không phải chạy hả a

Log in to Reply
1. vohungvi says:
  
  15/12/2017 at 9:20 AM
  
  Solution training dùng để huấn luyện, predict dùng để dự đoán 1 ảnh, còn Classifier dùng để dự đoán hàng loạt ảnh
Tuan Ngo van says:

15/12/2017 at 9:28 AM

thực ra em ms học nên không hiểu lắm nhưng bh em muốn phân loại bộ ảnh biển báo giao thông của anh thì có phải thay đổi nhiều không ak

Log in to Reply
1. vohungvi says:
  
  15/12/2017 at 9:31 AM
  
  Nếu bộ data input có kích thước tương tự nhau, vị trí biển báo trong ảnh tương tự nhau về góc chụp, tỉ lệ width/height,… thì chương trình này đã có thể phân loại được rồi.
  
  Còn nếu bộ dữ liệu khác nhau khá nhiều về góc chụp, kích thước,… thì phải qua bước tiền xử lý nữa để cho dữ liệu được tương đồng.
Tuan Ngo van says:

15/12/2017 at 9:34 AM

bộ ảnh biển báo giao thông trong bài phân loại ảnh bằng knn của anh thì có cần tiền xử lí không ak

Log in to Reply
1. vohungvi says:
  
  15/12/2017 at 9:40 AM
  
  bộ nào vậy? mình chưa upload bộ ảnh biển báo giao thông
Tuan Ngo van says:

15/12/2017 at 9:49 AM

Bộ ảnh có 16.000 ảnh, chia ra làm 5 loại:

Phía trước xe hơi
Phía sau xe hơi
Phía trước xe máy
Phía sau xe máy
Ảnh không chứa biển số (ảnh rác)
bộ này ak
vì em cũng đang làm về đề tài này

Log in to Reply
1. vohungvi says:
  
  15/12/2017 at 9:51 AM
  
  Bộ này là hình ảnh xe máy, xe hơi, biển số chứ không hề có biển báo giao thông
Tuan Ngo van says:

15/12/2017 at 9:56 AM

SvmOpenCV_Classifierd.exe has triggered a breakpoint.
lỗi này là gì ak

Log in to Reply
1. vohungvi says:
  
  15/12/2017 at 10:01 AM
  
  oh search breakpoint là gì nhé, cái này của Visual Studio
Tuan Ngo van says:

15/12/2017 at 9:56 AM

vâng em nhầm
thế bộ ảnh này thì có phải tiền xử lý không ak

Log in to Reply
1. vohungvi says:
  
  15/12/2017 at 10:00 AM
  
  Hiện tại thì mình chỉ chuyển qua ảnh xám mà thôi, cho nên độ chính xác chưa cao. Do ví dụ này chỉ là để giới thiệu thuật toán nên không đi sâu vào code tiền xử lý.
Tuan Ngo van says:

15/12/2017 at 10:07 AM

ak cho em hỏi các file TGMT
các file ah lập trình sẵn đó có chức năng gì ak
vì em đọc nhưng không hiểu lắm

Log in to Reply
1. vohungvi says:
  
  15/12/2017 at 10:12 AM
  
  Mỗi file có 1 chức năng riêng, không hiểu thì ráng đọc cho hiểu thôi
Tuan Ngo van says:

15/12/2017 at 10:14 AM

vâng e sẽ cố gắng hì hì

Log in to Reply
Tuan Ngo van says:

16/12/2017 at 9:26 AM

em có ngồi lập trình lại nhưng mắc 1 vài lỗi em không sửa dc
em khai báo
void _tmain(int argc, _TCHAR*argv[]) thì nó lỗi ở -TCHAR và em tìm ra là tại em không có module tchar.h
nhưng module em tưởng khi mình built dât nó có sẵn nhưng sao của em không có như của a
mông a chỉ hộ e

Log in to Reply
1. vohungvi says:
  
  16/12/2017 at 9:35 AM
  
  bạn thay _TCHAR bằng char là được, build bằng Visual Studio bản bao nhiêu?
Tuan Ngo van says:

17/12/2017 at 11:13 AM

bản 2015 ak

Log in to Reply
Tuan Ngo van says:

15/01/2018 at 5:10 AM

Anh VĨ cho em hỏi anh gán địa chỉ của data ở như thế nào ak.em tìm hoài không thấy

Log in to Reply
Tuan Ngo van says:

15/01/2018 at 5:34 AM

sao em built nó toàn báo lỗi thư mục không tồn tại vậy anh chỉ giúp em cái

Log in to Reply
1. vohungvi says:
  
  15/01/2018 at 6:56 AM
  
  chụp hình gửi lên đây
Tuan Ngo van says:

15/01/2018 at 7:07 AM

Directory \”%s\” does not exist nó chỉ nháy dòng chữ này rồi thoát luôn thôi ak

Log in to Reply
1. vohungvi says:
  
  15/01/2018 at 7:13 AM
  
  download source code lại rồi chạy lại từ đầu
Tuan Ngo van says:

15/01/2018 at 7:24 AM

em cũng làm như vậy rồi nhưng chạy Solution training thì nó đã bị như vậy rồi

Log in to Reply
Tuan Ngo van says:

15/01/2018 at 7:38 AM

anh có thể teamview sửa giúp em cho nó chạy với

Log in to Reply
1. vohungvi says:
  
  15/01/2018 at 7:40 AM
  
  chat fb đi
Tuan Ngo van says:

15/01/2018 at 7:44 AM

nick em là là Tuannobitom .Em vừa gửi tin nhắn cho anh rồi

Log in to Reply
HOÀNG Oai says:

15/01/2018 at 4:06 PM

anh ơi, anh dùng phần mềm gì để cắt ảnh vậy!!! em tìm không có phần mềm nào cắt ảnh!! Mong được anh giúp đỡ 🙂

Log in to Reply
1. vohungvi says:
  
  15/01/2018 at 4:13 PM
  
  tự viết thôi bạn, đây nhé: https://thigiacmaytinh.com/su-dung-floodfill-de-tim-ky-tu/
2. HOÀNG Oai says:
  
  18/01/2018 at 4:45 AM
  
  Anh có face không ạ!! cho em hỏi anh kỹ hơn!! 🙂
3. vohungvi says:
  
  18/01/2018 at 5:23 AM
  
  Ở footer nhé