Hướng dẫn training custom model YOLO v8 phát hiện xe trên đường cao tốc

Hiện nay, các phương tiện tham gia giao thông ngày càng nhiều, đặc biệt việc quản lý giao thông trên đường cao tốc càng trở nên quan trọng. VD như đếm số lượng xe nhân với từng loại xe để thời điểm hoàn vốn BOT cao tốc. Bài viết này hướng cách sử dụng mô hình Yolov8 để phát hiện xe trên đường cao tốc.

Mô hình được test trên Windows với GPU NVIDIA RTX 2060.

Video cảnh xe chạy dùng làm dataset

Bước 1: cài đặt VS code và Python

Bước 2: cài đặt CUDA và cuDNN

Download CUDA 12.1 (3.1 GB) và cuDNN v8.9.7 (1.01 GB). Lưu ý phải đăng ký tài khoản NVIDIA developer.

Chi tiết các bước cài đặt đọc tại bài: Hướng dẫn cài đặt Tensorflow GPU với CUDA 11.2 trên Windows 10

Bước 3: clone repository và cài đặt package

Download source code cuối bài viết

Cài đặt các thư viện bằng lệnh

pip install torch==2.4.0 torchvision==0.19.0 torchaudio==2.4.0 --index-url https://download.pytorch.org/whl/cu121

pip install ultralytics

Bước 4: Training

Tập dữ liệu đã được đánh nhãn sẵn, vào Notebook Yolov8.ipynb để train model.

Với cấu hình máy yếu, GPU có hiệu suất thấp, cần giảm số lượng epoch xuống (100 epoch), giảm batch size xuống (8 batch), giảm kích thước ảnh xuống (imgzs = 224) hoặc giảm số lượng worker xuống 1

Lựa chọn mô hình YOLOv8 phù hợp:

  • YOLOv8n (Nano): Nhẹ nhất, phù hợp cho máy yếu, tốc độ nhanh nhưng độ chính xác thấp.
  • YOLOv8s (Small): Cân bằng giữa tốc độ và độ chính xác, thích hợp cho dự án nhỏ.
  • YOLOv8m (Medium): Độ chính xác cao hơn, yêu cầu nhiều tài nguyên hơn.
  • YOLOv8l (Large): Độ chính xác cao, dành cho máy có GPU mạnh.
  • YOLOv8x (Extra Large): Lớn nhất, độ chính xác cao nhất, yêu cầu phần cứng mạnh.

Có thể tải các mô hình tại YOLOv8 models

Chạy câu lệnh bên dưới để training

!yolo train model=yolov8n.pt data='./datasets/data.yaml' batch=32 epochs=300 imgsz=640 device=0

Sau khi quá trình huấn luyện hoàn tất, bạn có thể tìm thấy file best.pt trong thư mục runs/detect/trainXXX/weights/, với XXX là số tăng dần. Đây là kết quả của quá trình huấn luyện.

Để kiểm tra độ chính xác, chạy block Val và đảm bảo truyền đúng đường dẫn file model và file data.
!yolo val model='./runs/detect/train/weights/best.pt' data='datasets/data.yaml'

Bước 5: Detect

Chạy lệnh trong block Predict
!yolo predict model='./runs/detect/train/weights/best.pt' source='highway.mp4' device=0

Trong đó, model là đường dẫn đến file model, source là đường dẫn đến hình ảnh hoặc video cần detect, device là thiết bị sẽ được sử dụng: cpu hoặc 0 cho GPU.
Lưu ý cần truyền đúng đường dẫn model và ảnh hoặc video cần detect. Kết quả detect sẽ được lưu vào folder runs/detect/predict/

Lưu ý

Để sử dụng GPU CUDA 12.1 cần xóa torch CPU và tải lại torch 2.4.0+cu121
Để kiểm tra, các bạn mở CMD (bấm Windows+R gõ cmd và nhấn enter) nhập lệnh pip show torch Nếu kết quả trả về Version: 2.4.0+cu121 là đã có CUDA, nếu không các bạn cần gỡ torch hiện tại và cài lại phiên bản hỗ trợ CUDA
pip uninstall torch torchvision torchaudio

pip install torch==2.4.0 torchvision==0.19.0 torchaudio==2.4.0 --index-url https://download.pytorch.org/whl/cu121

Source code

Chúc các bạn thành công!

Leave a Reply