Lập trình đa luồng (multithread) trong Python

Lập trình đa luồng trong Python sẽ rất hữu dụng khi chương trình của bạn có nhiều chức năng. VD bạn có thể predict nhiều hình ảnh cùng lúc để tiết kiệm thời gian.

Multithread có công dụng là khai thác tối đa tài nguyên của máy tính để tiết kiệm thời gian. VD như bạn chạy 1 function chưa dùng hết CPU thì gọi nhiều function cùng lúc để khai thác 100% CPU.

Bài này hướng dẫn các bạn cách dễ dàng hơn để tìm hiểu về multi-threading. Thread trong giáo trình CNTT còn gọi là “tiểu trình”.

Lý thuyết

  • Một chương trình được gọi là process, khi bạn chạy 1 file *.py tức là bạn đã tạo 1 process
  • Trong 1 process bạn có thể tạo nhiều thread, mỗi thread độc lập nhau
  • Khi 1 thread chạy xong mặc định nó sẽ kết thúc
  • 1 thread chạy 1 function

Bài toán 1: download nhiều files

Bài toán đặt ra là bạn cần download file và lưu vào ổ cứng. Cách thông thường là dùng vòng lặp để download từng file, file này xong thì tới file kia. Nếu có 1 server bị chậm thì tổng thời gian bị kéo dài, do đó download cùng lúc nhiều file sẽ giảm tổng thời gian.

Function Download() có tham số truyền vào là url của file, công việc là download file rồi save vào disk là xong.

Code bên dưới có 3 thread: 1 thread chính và 2 thread để download. Thread download sau khi chạy không quay lại thread chính báo kết quả còn gọi là “fire and forget“.

Lưu ý khi bạn chỉ truyền 1 tham số vào args thì bạn nên có dấu , để tránh gây ra lỗi.

Bài toán 2: chạy nhiều function và báo kết quả về thread chính

Giả sử bạn có 2 model predict các loài hoa, 2 model này thường cho ra kết quả khác nhau nên cần chạy cả 2. Sau đó so sánh kết quả rồi lấy độ chính xác cao hơn trả về cho user.

Để đơn giản hóa bài toán thì function predict có chứa hàm sleep() để giả lập thời gian chạy.

Trong đoạn code trên có class ThreadWithReturnValue, đây là class được viết riêng để dễ dùng. Sau khi start 2 thread thì cần join() lại và lấy kết quả, kết quả nào cao hơn thì lấy và print.

2 hàm predict giống nhau, đều sleep 1 khoảng thời gian và trả về kết quả % ngẫu nhiên. Sau khi join thì 2 thread cũng kết thúc, chỉ còn thread chính chạy và so sánh kết quả.

Tổng kết

Các bạn có thể tải notebook có các đoạn code trên ở link: https://github.com/thigiacmaytinh/TGMTpython/tree/main/multithreading

Hy vọng rằng với 2 example rất đơn giản ở trên các bạn sẽ biết được cách dùng thread. Nếu có gì thắc mắc các bạn có thể hỏi tại forum: https://thigiacmaytinh.com/forum/