Giải thích các phương pháp giả mạo nhận diện khuôn mặt

Hiện nay nhận diện khuôn mặt là 1 phương pháp phổ biến trong sinh trắc học vì nhiều ưu điểm mang lại như: dễ trang bị thiết bị, khuôn mặt dễ đối chiếu bằng mắt thường nếu phần mềm/thiết bị bị hư,… Tuy nhiên kẻ xấu cũng có những phương pháp để qua mặt phần mềm nhận diện khuôn mặt để lừa đảo.

Bài viết này giải thích phương pháp mà kẻ xấu đã thực hiện, giúp mọi người nâng cao cảnh giác nếu gặp giả mạo khuôn mặt. Bài viết này giới hạn trong hiểu biết của tác giả, mời mọi người chỉnh sửa, góp ý.

Mục lục

  • Nguyên lý của nhận diện khuôn mặt
  • Liveness detection – phát hiện người thật
  • Phương pháp giả mạo 1: Generative AI – tạo sinh ảnh đơn
  • Phương pháp giả mạo 2: Generative AI – tạo sinh video
  • Phương pháp giả mạo 3: Tái tạo khuôn mặt 3D

Nguyên lý của nhận diện khuôn mặt

Tương tự mắt người, phần mềm nhận diện khuôn mặt cũng tìm các đặc trưng trên khuôn mặt để so sánh 2 khuôn mặt có phải cùng 1 người không. Nếu tỷ lệ giống của 2 khuôn mặt vượt qua ngưỡng cài đặt thì nhận diện đó là cùng 1 người.

Các phần mềm – hệ thống hiện đại bổ sung thêm nhiều phương pháp để nâng cao độ chính xác trong nhận diện. VD như iPhone với Camera Truedepth sử dụng chùm tia sáng để tạo dựng bản đồ 3D của khuôn mặt, phương pháp này cực kỳ an toàn, cực kỳ khó qua mặt.

Liveness detection – phát hiện người thật

Nếu chỉ so sánh đặc trưng của khuôn mặt 2D thì phương pháp đó dễ dàng bị qua mặt bởi 1 tấm ảnh, vì vậy các nhà phát triển phần mềm đã bổ sung thêm các phương pháp phát hiện người thật. Các phương pháp đó bắt buộc người dùng phải tương tác theo yêu cầu, nếu làm đúng thì đó là khuôn mặt thật:

  • Xoay trái phải lên xuống
  • Nhắm mắt, cười, há miệng,…
  • Đọc số, nói theo yêu cầu

Tuy nhiên nếu kẻ xấu dựng được model 3D của khuôn mặt thì sẽ dễ dàng hơn trong việc qua mặt phần mềm.

Phương pháp giả mạo 1: Generative AI – tạo sinh

Với việc sử dụng các phần mềm như Stable Diffusion, ComfyUI người dùng có thể từ 1 tấm ảnh ban đầu tạo ra rất nhiều ảnh tương tự.

Quá trình trích xuất đặc trưng khuôn mặt được gọi là training LORA, từ 1 vài tấm ảnh nhìn trực diện có thể học ra được đặc trưng. Từ đó tạo ra khuôn mặt với người gốc.

Ví dụ ảnh bên dưới là của người mẫu Ngọc Trinh được tạo ra từ LORA bằng phần mềm ComfyUI

Tới đây bạn đọc sẽ thắc mắc: vậy thì giả mạo được cái gì? Đoạn này chỉ để giải thích rằng phần mềm có thể học được đặc trưng của khuôn mặt. Trong một số trường hợp có thể lừa người không có nhiều kinh nghiệm, kiến thức vì dễ dàng tạo ảnh với prompt tùy ý.

Phương pháp giả mạo 2: Generative AI – tạo sinh video

Để có thể tạo video giả như các cuộc gọi video “Dép Lào” thì chỉ cần sử dụng các công cụ text2video. Các video này thường là các đoạn ngắn, lặp đi lặp lại và thể hiện như đường truyền yếu.

VD ảnh bên dưới của 1 người

Dùng công cụ Text2Video-Zero có thể tạo ra các clip tương tự như bên dưới. Từ đó có thể giả mạo như đang nói chuyện với người thật.

Phương pháp giả mạo 3: tạo dựng model 3D của khuôn mặt

Sau khi học được đặc trưng của khuôn mặt có thể tạo ra rất nhiều ảnh của người đó, từ đó tạo dựng ra model 3D của khuôn mặt.

Từ đó, có thể vượt qua các bài test Liveness Detection bằng cách cười, nói, nhắm mắt theo yêu cầu. Phương pháp này được đánh giá là không tự nhiên, dễ phát hiện bằng mắt thường. Tuy nhiên, phương pháp này vẫn thành công để qua mặt được các phần mềm Face KYC.

Đối với người mắt kém thì khó phân biệt được thật giả từ 2 hình như bên dưới

Tổng kết

Phần mềm cũng chỉ là công cụ, hiểu được quy luật/phương pháp nhận diện của phần mềm là có thể qua mặt được. Các phương pháp Liveness detection cần nâng cấp, cải tiến để chống hack, tuy nhiên chặt chẽ quá lại khó cho cho người dùng thật.

Các công nghệ hiện nay có thể giả mạo khuôn mặt, tuy nhiên vẫn khó qua mắt được giám sát thủ công. Do đó cần kết hợp kèm theo sự giám sát của con người, không nên phó mặc hoàn toàn cho phần mềm.

Leave a Reply