Tổng hợp data

Mình tổng hợp data thị giác máy tính giúp các bạn test chương trình. Trong mỗi bài hướng dẫn đã có link data cho các bạn test, mình tổng hợp tất cả data vào bài này.

Trong thị giác máy tính, Data và thuật toán đều quan trọng, không thể xem nhẹ cái nào. Đây chỉ là data sample, muốn kết quả tốt hơn các bạn phải tìm bộ dữ liệu phù hợp hơn.

  1. Bộ clip quay cảnh lửa cháy (29 MB)
  2. Bộ ảnh biển số xe máy của cty GreenParking (186 MB)
  3. Bộ ảnh biển số xe hơi, bao gồm biển dài, biển vuông và biển vàng mới ra.
  4. Bộ video gốc cảnh xe chạy quay từ trên cao lúc trời nắng. Quay bằng điện thoại Samsung J5 và máy ảnh Canon 750D
  5. Bộ video gốc cảnh xe chạy quay từ trên cao lúc trời mát
  6. Bộ ký tự biển số xe máy chưa được sắp xếp: Bộ 1Bộ 2
  7. Bộ ký tự biển số xe máy đã được sắp xếp dùng để training các mô hình nhận diện
  8. Các model cascade đã huấn luyện sẵn
  9. Bộ ảnh âm (negative) dùng để huấn luyện Cascade. Trong đó có file _create_bg_file.bat, khi chạy file này sẽ tạo ra file bg.txt chứa đường dẫn tuyệt đối đến các file ảnh. Giúp hạn chế lỗi không tìm thấy file ảnh âm khi huấn luyện.
  10. Bộ ảnh phía trước xe hơi
  11. Video quay cảnh xe chạy vào bãi xe (61 MB)
  12. Bộ ảnh mặt người nổi tiếng Việt Nam Nguồn: viblo.asia
  13. Bộ ảnh khuôn mặt đã phân loại sẵn: gender_dataset_face.zip
  14. Bộ ảnh khuôn mặt có khẩu trang và không có khẩu trang: facemask.zip
  15. Video xe chạy trên đường cao tốc dùng để test thuật toán đếm xe (Google Drive) Xem preview tại Youtube