Công cụ đánh nhãn Paddle text detection – Paddle Polygon

Mục lục

  1. Giới thiệu
  2. Format của file label (annotation)
  3. Chức năng của chương trình Paddle Polygon
  4. Download

Giới thiệu

Paddle OCR là bộ toolkit cung cấp các chức năng về nhận diện ký tự OCR của cty PaddlePaddle (Trung Quốc). Trong Paddle OCR có PP-OCR là thư viện phát hiện vị trí text và nhận diện cho kết quả rất tốt.

PP-OCR có 2 thuật toán chính là Detect (Det) và Recognition (Rec). Bài viết này chia sẻ tool đánh nhãn giúp bạn training model detect vị trí text trong ảnh.

Paddle Polygon là công cụ đánh nhãn (labeling) dành riêng cho việc tạo dữ liệu huấn luyện trong Paddle Detection. Công cụ hỗ trợ người dùng tạo các vùng bao bằng đa giác bốn điểm (tứ giác) và xuất dữ liệu đúng chuẩn Format của Paddle.

Ưu điểm

  • Đơn giản – dễ sử dụng: dạng portable, không cần cài đặt thư viện khác
  • Nhẹ – không yêu cầu cấu hình mạnh

Format của file label (annotation)

PP-OCR sử dụng file annotation cho mỗi ảnh theo định dạng JSON, mỗi file chứa một mảng (array), trong đó mỗi phần tử là một vùng text:

  • points: thườnglà tứ giác, mỗi điểm là giá trị x,y (số nguyên)
  • transcription nội dung text, có thể set null nếu chỉ training detection
  • ignore: đánh dấu bỏ qua khi training (optional)

VD:

Chức năng của chương trình Paddle Polygon

  • Vẽ và chỉnh sửa tứ giác (Quadrilateral Annotation)
  • Lưu dữ liệu theo đúng format Paddle
  • File chưa đánh nhãn có màu đỏ

Download

Leave a Reply