Ứng dụng của Thị giác Máy tính và Trí tuệ nhân tạo trong cuộc chiến Nga

Trải qua hơn 4 năm xung đột kể từ 2022 cho đến nay, các thiết bị công nghệ đều có những bước tiến nhảy vọt, điều đó làm thay đổi học thuyết quân sự của nhiều quốc gia. Từ tàu to súng lớn chuyển sang thiết bị bay không người lái (UAV) với độ chính xác cao, khả năng ra quyết định độc lập để né tránh đối phương gây nhiễu. Đồng thời với sự kết hợp đa dạng các nguồn tín hiệu, bộ xử lý và phương pháp tính toán mới đã làm thay đổi cục diện chiến trường.

Bài viết này được dịch lại từ website CSIS, giải thích về cách mà Thị giác Máy tính và Trí tuệ nhân tạo được áp dụng như thế nào. Nó đã trải qua những bước tiến gì để trở thành vũ khí chủ lực trong cuộc chiến, thay thế vũ khí “cổ điển” như xe tăng – tên lửa.

Mục lục

Vì sao cần tích hợp AI trực tiếp lên UAV?
Phương pháp thực hiện

Thiết kế UAV dạng module
Thu thập và xử lý dữ liệu
Huấn luyện mô hình CNN và RNN
Chống tác chiến điện tử gây nhiễu
Trinh sát âm thanh
Phân tích thông tin văn bản
Dữ liệu đóng góp từ cộng đồng
Nhận dạng mục tiêu tự động
Tự chủ công nghệ Thị giác Máy tính
Mã hóa phần mềm

Nguồn

1. Vì sao cần tích hợp AI trực tiếp lên UAV?

Trong quá trình tác chiến, việc điều khiển trực tiếp thiết bị bằng con người đã bộc lộ rất nhiều nhược điểm.

Tâm lý mệt mỏi, căng thẳng của binh sĩ và khó có thể xử lý và tổng hợp lượng lớn dữ liệu từ nhiều nguồn.
Độ chính xác thấp, phát hiện mục tiêu không nhạy bằng các hệ thống AI hiện đại. Sau khi tích hợp, hệ thống điều hướng tự động giúp tăng khả năng thành công của các cuộc tấn công bằng máy bay không người lái lên gấp ba đến bốn lần.
Khó bị gây nhiễu, tầm bay không hạn chế vì không phụ thuộc GPS hay hệ thống dẫn đường khác. Nhờ vào năng lực xử lý thông minh mà UAV có thể tấn công mục tiêu ở xa 800km, điều đó đã được kiểm nghiệm trong thực tế.
Có khả năng nhân lên số lượng lớn mà không cần thêm nhiều nhân sự. Nhờ tích hợp “bộ não” thông minh, việc huấn luyện vận hành UAV có thể hoàn thành chỉ trong vòng 30 phút đến một ngày.

2. Phương pháp thực hiện

2.1. Thiết kế UAV dạng module

Vào đầu năm 2022, máy bay không người lái FPV có đường kính cánh quạt 7 inch là phổ biến nhất do dễ lắp ráp, pin nhỏ hơn và dễ kiếm hơn. Tuy nhiên, theo thời gian, nhu cầu ngày càng tăng về tải trọng nặng hơn và tầm bay xa hơn đã dẫn đến sự chuyển hướng sang các máy bay bốn cánh quạt lớn hơn có đường kính 9-10 inch, hiện đang chiếm tỷ lệ lớn nhất.

Với đa dạng thiết bị như vậy, nhu cầu đòi hỏi phải tạo ra các mô-đun – các thành phần điện tử và phần mềm được phát triển độc lập với bất kỳ nền tảng phần cứng cụ thể nào. Các mô-đun này thường bao gồm một chip với phần mềm nhúng (và đôi khi là một camera. Chúng cho phép các chức năng tự hành quan trọng, chẳng hạn như nhận biết môi trường, nhận dạng mục tiêu và khả năng tấn công mục tiêu mà không cần điều khiển bay trực tiếp của con người (còn gọi là điều hướng chặng cuối).

2.2. Thu thập và xử lý dữ liệu

Ngoài hình ảnh vệ tinh truyền thống, Ukraine gần đây đã có thêm hai lớp thông tin tình báo trên không mới. Cả hai lớp đều được thu thập thông qua máy bay không người lái thực hiện các nhiệm vụ trinh sát, giám sát và thu thập thông tin (ISR). Lớp thông tin thứ nhất được thu thập bởi các máy bay không người lái trinh sát tầm cao, do các công ty tư nhân của Ukraine thực hiện. Lớp hình ảnh thứ hai đến từ các nhiệm vụ được thực hiện ở độ cao thấp bởi các máy bay không người lái thương mại như DJI Mavic và các máy bay không người lái ISR nội địa của Ukraine.

Tất cả hình ảnh từ vệ tinh và máy bay không người lái đều cần được xử lý, phân tích và gắn nhãn. Thị giác máy tính sử dụng học máy là cốt lõi của nhiều hệ thống phân tích video và ảnh dựa trên trí tuệ nhân tạo. Nó giải quyết hiệu quả thách thức phát hiện và phân loại đối tượng trong dữ liệu hình ảnh bằng cách sử dụng các thuật toán học sâu. Bằng cách xác định và gán nhãn các đối tượng như thiết bị quân sự hoặc vũ khí, các thuật toán này là nền tảng cho các nhiệm vụ bổ sung như theo dõi đối tượng và chú thích hình ảnh .

2.3. Huấn luyện mô hình CNN và RNN

Để xử lý tính chất không gian và thời gian của video, hai loại mạng nơ-ron chính thường được sử dụng: mạng nơ-ron tích chập 3D (CNN) và mạng nơ-ron hồi quy (RNN). CNN hoạt động bằng cách phân tích các mẫu trong không gian và thời gian, nắm bắt cách một đối tượng hoặc hành động phát triển từ khung hình video này sang khung hình tiếp theo, trong khi RNN theo dõi và diễn giải dữ liệu tuần tự, giúp chúng hiệu quả cho các nhiệm vụ như nhận dạng các chuyển động cụ thể hoặc các hoạt động lặp đi lặp lại. Các phương pháp này huấn luyện máy móc phát hiện các đối tượng bất kể tư thế hoặc góc độ thay đổi, phản ánh cách con người nhận dạng đồ vật.

Xử lý thời gian thực làm phức tạp thêm nhiệm vụ nhận dạng đối tượng, vì nó đòi hỏi phải phân tích 30 khung hình trở lên mỗi giây. Với mỗi khung hình chứa hàng triệu pixel, nhiệm vụ này trở nên rất tốn kém về mặt tính toán, dẫn đến chi phí cao cho việc xử lý video như vậy.

Vì vậy, một nhóm tình nguyện viên, sau này phát triển thành đội Avengers trong dự án hệ thống Delta của Bộ Quốc phòng Ukraina, đã bắt đầu phát triển riêng một nền tảng phân tích video và hình ảnh. Họ đã thực hiện các bước sau:

Chuẩn hóa quy trình gắn nhãn: Việc gắn nhãn dữ liệu là một nhiệm vụ tốn nhiều công sức và đòi hỏi sự nỗ lực đáng kể của con người. Do Bộ Quốc phòng thiếu nguồn lực nội bộ, nhiều nhóm khác nhau, bao gồm cả tình nguyện viên và các nhóm thuộc khu vực tư nhân, đã hỗ trợ nỗ lực gắn nhãn dữ liệu của Bộ. Để đảm bảo tính nhất quán, nhóm Avengers đã đưa ra các tiêu chuẩn và quy trình gắn nhãn chính thức. Các hướng dẫn này nêu rõ các thông số cần xem xét trong quá trình gắn nhãn dữ liệu, chẳng hạn như độ phân giải, biến đổi theo mùa, siêu dữ liệu và các yếu tố liên quan khác.
Do đó, nhóm Avengers đã tạo ra một “bộ dữ liệu quân sự phổ quát”, tuân thủ các hướng dẫn ghi nhãn chính thức này, làm cho bộ dữ liệu trở nên nhất quán và được chuẩn hóa. Bộ dữ liệu này đủ lớn để đảm bảo độ chính xác cao trong hiệu suất của mô hình AI và có thể được lọc để tạo ra các bộ dữ liệu nhỏ hơn, cụ thể hơn cho các trường hợp sử dụng khác nhau.
Tạo bộ dữ liệu kiểm chứng: Để đánh giá hiệu suất của mô hình AI, nhóm đã tạo một bộ dữ liệu kiểm chứng riêng biệt chứa nội dung không trùng lặp với bộ dữ liệu quân sự chung. Ví dụ, nếu một mô hình được huấn luyện để phát hiện một loại xe tăng cụ thể của Nga, bộ dữ liệu kiểm chứng sẽ bao gồm các biến thể màu sắc và hình ảnh của xe tăng được ngụy trang, ẩn trong bụi rậm hoặc có lưới chống máy bay không người lái. Cách tiếp cận này cho phép mô hình đưa ra đánh giá chính xác về các kết quả dương tính giả và cải thiện độ tin cậy tổng thể của mô hình.
Phát triển các mô hình AI nhỏ, chuyên biệt: Kinh nghiệm vận hành đã chứng minh rằng các mô hình nhỏ, chuyên biệt có thể đạt được độ chính xác cao hơn nhiều trong việc phân tích cảnh quay từ máy bay không người lái so với một mô hình AI toàn diện duy nhất. Do đó, nhóm Avengers và các nhóm bên ngoài đã bắt đầu tạo ra nhiều mô hình nhỏ hơn, mỗi mô hình được thiết kế riêng cho các loại dữ liệu cụ thể (ví dụ: cảnh quay từ các máy bay không người lái cụ thể và hình ảnh vệ tinh). Cách tiếp cận này giúp tăng cường độ chính xác và tính phù hợp cho các kịch bản hoạt động khác nhau, tập trung chủ yếu vào những trường hợp khó nhận biết nhất đối với mắt người và sự chú ý của con người: các vật thể nhỏ ở độ phân giải thấp và cảnh quay chất lượng kém.
Hỗ trợ đào tạo mô hình AI bên ngoài: Avengers cho phép các nhà phát triển đã được kiểm duyệt đào tạo mô hình của họ một cách an toàn, sử dụng các phần được chọn lọc từ tập dữ liệu chung mà không làm lộ dữ liệu nhạy cảm. Ví dụ, một nhà sản xuất máy bay không người lái có thể yêu cầu dữ liệu từ các máy bay không người lái phù hợp với đặc điểm sản phẩm của họ, chẳng hạn như độ cao bay cụ thể, loại camera hoặc yêu cầu độ phân giải, và đào tạo thuật toán của họ trong môi trường được bảo vệ của nền tảng.
Hướng tới phân tích tự động dữ liệu quay phim thời gian thực: Nền tảng này tích hợp với hệ thống phát trực tiếp có tên VEZHA, một phần của hệ sinh thái Delta và được thiết kế để phân tích dữ liệu quay phim bằng máy bay không người lái theo thời gian thực. Mặc dù người vận hành vẫn thực hiện hầu hết các nhiệm vụ phân tích như phân loại và ghi nhật ký sự kiện, nhưng những cải tiến về hiệu suất mô hình AI và sự tích hợp với dịch vụ phát trực tuyến đã dẫn đến vai trò ngày càng tăng của phân tích hỗ trợ AI. Phân tích này có thể được chia thành hai trường hợp sử dụng chính:

Phân tích thời gian thực: Trong kịch bản này, các thuật toán AI giúp ưu tiên video dựa trên số lượng và cường độ của các sự kiện có thể quan sát được, chẳng hạn như giao tranh đang diễn ra hoặc sự di chuyển đáng kể của quân đội và trang thiết bị. Các đoạn video từ máy bay không người lái trong các nhiệm vụ trinh sát trên các khu vực tương đối trống trải sẽ được ưu tiên thấp hơn. VEZHA cũng cho phép nhiều người vận hành xem cùng một luồng video đồng thời và cùng nhau ghi lại các sự kiện được phát hiện (ví dụ: vị trí xe tăng, phương tiện bị phá hủy và các cuộc tấn công pháo binh). Sau đó, các sự kiện này được kết nối với bản đồ kỹ thuật số (ví dụ: thông qua màn hình Delta) và được bổ sung bằng ảnh chụp màn hình và chi tiết để nâng cao nhận thức tình huống.
Phân tích hậu kỳ: Nhóm VEZHA chỉ áp dụng phân tích hậu kỳ cho những trường hợp khó khăn nhất, chẳng hạn như cảnh quay có độ phân giải thấp hoặc ở độ cao lớn. Vì phân tích hỗ trợ bởi AI tiêu tốn đáng kể tài nguyên tính toán, hệ thống ưu tiên các cảnh quay khó hơn so với các video rõ nét hơn, chẳng hạn như video được quay bởi máy bay không người lái Mavic bay thấp, trong đó các vật thể dễ nhìn thấy hơn đối với con người. Kết quả là, tài nguyên phát hiện tự động được bảo toàn cho những tình huống cần thiết nhất.

2.4. Chống tác chiến điện tử gây nhiễu

Quantum Systems, một công ty công nghệ máy bay không người lái có trụ sở tại Đức, Hoa Kỳ và Úc—với một cơ sở mới được thành lập tại Kyiv — đã thử nghiệm và cung cấp hệ thống của mình cho Ukraine từ tháng 3 năm 2022. Máy bay không người lái Vector của Quantum Systems đảm nhiệm các chức năng trinh sát, giám sát và thu thập thông tin (ISR) trong các nhiệm vụ tấn công của Ukraine.

Hoạt động như những trinh sát cơ động, chúng định vị mục tiêu và truyền dữ liệu chính xác đến các máy bay không người lái tấn công hạng nặng hơn như Nemesis do Ukraine sản xuất. Sự phối hợp này đảm bảo hỗ trợ hỏa lực hiệu quả và hiệu chỉnh pháo binh. Quantum Systems đã giải quyết vấn nạn gây nhiễu Hệ thống Định vị Toàn cầu (GPS) trên diện rộng bằng cách sử dụng sợi quang và các liên kết dữ liệu tiên tiến được cung cấp bởi phần mềm tránh nhiễu Silvus. Hệ thống này cho phép quét tự động và chuyển sang các tần số thay thế khi một tần số bị gây nhiễu, duy trì liên lạc quan trọng cho nhiệm vụ.

Điểm nổi bật trong thiết kế máy bay không người lái Vector là kiến trúc mô-đun của nó. Các đầu mũi và hệ thống hình ảnh có thể thay thế cho phép tùy chỉnh tùy theo nhu cầu nhiệm vụ. Được trang bị camera Boson hoạt động cả ngày lẫn đêm và được hỗ trợ bởi máy tính AI Nvidia Jetson Orin tích hợp , những máy bay không người lái này thu thập hình ảnh độ phân giải cao và xử lý chúng trong thời gian thực, ngay cả trong điều kiện không có tín hiệu GPS.

2.5. Trinh sát âm thanh

Trinh sát âm thanh là việc sử dụng âm thanh để thu thập thông tin tình báo và giám sát môi trường. Đây không phải là một khái niệm mới, tuy nhiên việc tích hợp trí tuệ nhân tạo (AI) đã cách mạng hóa lĩnh vực này bằng cách tự động hóa việc phân loại và nhận dạng âm thanh với độ chính xác và tốc độ cao. Công nghệ AI cho phép các hệ thống xử lý dữ liệu âm thanh trong thời gian thực, giúp phát hiện và phân biệt các mẫu âm thanh mà thính giác con người khó có thể nhận biết được.

Công nghệ trinh sát âm thanh dựa trên trí tuệ nhân tạo (AI) sử dụng một tập hợp các kỹ thuật gần như giống hệt với các kỹ thuật được sử dụng để phân tích video. Nó sử dụng các kỹ thuật học máy tiên tiến và mạng nơ-ron, chẳng hạn như CNN và RNN, để phân tích tín hiệu âm thanh. Các mạng nơ-ron này được huấn luyện để trích xuất các đặc điểm từ sóng âm và phân loại chúng một cách phù hợp. Các công cụ như phân tích phổ tần, được tăng cường bởi Deep Learning, cho phép hệ thống hình dung và diễn giải các tín hiệu âm thanh, phân biệt giữa âm thanh của máy bay không người lái, phương tiện giao thông, tiếng bước chân và thậm chí cả các tiếng ồn môi trường cụ thể.

Các công cụ như phân tích phổ âm, được tăng cường bởi Deep Learning, cho phép các hệ thống hình dung và diễn giải các tín hiệu âm thanh, phân biệt giữa âm thanh của máy bay không người lái, xe cộ, tiếng bước chân và thậm chí cả các tiếng ồn môi trường cụ thể.

Trường hợp nghiên cứu hệ thống trinh sát âm thanh Zvook dưới đây minh họa cách các công nghệ này được triển khai trong thực tế tại Ukraine. Việc Ukraine sử dụng các hệ thống phát hiện âm thanh đã thúc đẩy đáng kể không chỉ khả năng trinh sát, giám sát và thu thập thông tin (ISR) mà còn cả khả năng phòng không. Zvook sử dụng phân tích âm thanh để phát hiện và nhận dạng các mối đe dọa trên không ở độ cao thấp hơn, nơi radar hoạt động kém hiệu quả. Nó sử dụng micro chất lượng cao và gương phản xạ âm thanh cong để tập trung sóng âm, và sử dụng một máy tính có kích thước bằng hộp giày đặt phía sau ăng-ten để xử lý âm thanh thu được. Hiện tại, Zvook bao phủ khoảng 20.000 km vuông lãnh thổ Ukraine với hệ thống cảm biến âm thanh được bố trí theo dạng lưới.

So với radar, các hệ thống này rẻ hơn, mỗi trạm có giá khoảng 500 đô la. Chúng cũng là hệ thống thụ động (tức là không phát ra tín hiệu có thể phát hiện được) và đặc biệt hiệu quả trong việc chống lại máy bay không người lái bay thấp, với phạm vi phát hiện lên đến 4,8 km đối với máy bay không người lái và 6,9 km đối với tên lửa hành trình. Zvook xử lý dữ liệu nhanh chóng, các phát hiện thường xuất hiện trong hệ thống nhận thức tình huống Delta trong vòng 12 giây. Tỷ lệ cảnh báo sai chỉ là 1,6% . Thông tin được chia sẻ bao gồm loại mục tiêu và âm thanh của nó, vị trí và hướng di chuyển.

Đầu tiên, hệ thống phân tích dựa trên trí tuệ nhân tạo (AI) lọc bỏ các mối đe dọa trên không tiềm tàng khỏi tất cả các âm thanh khác, chẳng hạn như tiếng xe cộ, chim chóc và con người. Thứ hai, hệ thống AI được huấn luyện để phân loại các loại mối đe dọa trên không khác nhau dựa trên đặc điểm âm thanh riêng biệt của chúng. Ví dụ, nó có thể phân biệt giữa máy bay trực thăng, tên lửa hành trình, máy bay không người lái động cơ xăng và máy bay cánh quạt bằng âm thanh.

Thế hệ cảm biến âm thanh và mô hình trí tuệ nhân tạo mới nhất mang đến một tính năng đột phá: khả năng phát hiện hướng của nguồn âm thanh, bao gồm cả góc phương vị và góc nâng. Điều này có nghĩa là nhiều cảm biến giờ đây có thể hoạt động song song, sử dụng thông tin góc phương vị giao nhau từ các vị trí khác nhau để xác định chính xác tọa độ, hướng đi và tốc độ của mục tiêu. Về cơ bản, điều này biến hệ thống thành một radar âm thanh thụ động, cung cấp một lớp phát hiện mới bổ sung cho các hệ thống radar hiện có. Hiệu quả của hệ thống Zvook đã dẫn đến việc sử dụng radar chủ yếu để phản ứng với các cảnh báo âm thanh. Nhiều hệ thống radar mặc định bị tắt để tránh phát xạ, điều này có thể dẫn đến các cuộc tấn công của Nga. Zvook cho phép bật radar của Ukraine chỉ trong các tình huống ưu tiên.

2.6. Phân tích thông tin văn bản

Quân đội Ukraine nhận được dữ liệu văn bản với số lượng lớn, chủ yếu từ ba loại nguồn: (1) các cuộc liên lạc bị chặn của lực lượng Nga được chuyển đổi thành văn bản, (2) tin nhắn trò chuyện được sử dụng trong quân đội Ukraine để trao đổi thông tin và (3) báo cáo do dân thường gửi qua các ứng dụng chatbot.

Xử lý thông tin dựa trên văn bản là một lĩnh vực cốt lõi khác mà trí tuệ nhân tạo (AI) thể hiện ưu thế. Xử lý ngôn ngữ tự nhiên (NLP) và các phương pháp học máy liên quan có thể sàng lọc các bộ sưu tập khổng lồ tin nhắn, cuộc trò chuyện và thông tin liên lạc bị chặn, trích xuất những thông tin quan trọng. Các kỹ thuật như nhận dạng thực thể được đặt tên và mô hình hóa chủ đề xác định thông tin quan trọng—như tên, địa điểm hoặc các sự kiện quan trọng—và làm nổi bật các mẫu có thể bị bỏ qua. Bằng cách nhanh chóng đối chiếu nhiều nguồn, các hệ thống dựa trên AI này đưa thông tin định vị địa lý lên bản đồ, chỉ ra vị trí và chuyển động của thiết bị hoặc lực lượng địch. Do đó, các nguồn thông tin dựa trên văn bản này đóng vai trò là một lớp dữ liệu bổ sung có giá trị tương đương để nâng cao nhận thức tình huống theo thời gian thực.

2.7. Dữ liệu đóng góp từ cộng đồng

ePPO là một ứng dụng di động sử dụng trí tuệ nhân tạo (AI) để thu thập và phân tích các báo cáo từ người dân về các mối đe dọa trên không, chẳng hạn như tên lửa và máy bay không người lái. Để sử dụng ứng dụng ePPO, người dùng trước tiên phải xác minh danh tính của mình thông qua ứng dụng Diia của chính phủ. Sau khi được xác minh, họ có thể báo cáo các mối đe dọa trên không đã quan sát được bằng cách chọn loại đối tượng—máy bay không người lái, tên lửa, máy bay hoặc trực thăng—và nhấn vào một nút màu đỏ lớn để gửi cảnh báo.

Một tính năng độc đáo của ứng dụng có tên gọi “Nó đang đến gần bạn” là cảnh báo cá nhân hóa cho người dùng nếu mối đe dọa có khả năng ảnh hưởng đến vị trí của họ. Cảnh báo được đưa ra dựa trên sự kết hợp dữ liệu và dự đoán quỹ đạo bay được hỗ trợ bởi trí tuệ nhân tạo (AI). Trong vòng khoảng 10 phút sau khi thu thập dữ liệu, AI sẽ cung cấp tọa độ gần đúng về hướng di chuyển của mối đe dọa cho người dùng, cho phép họ kịp thời thực hiện các biện pháp phòng ngừa. Với hơn 600.000 lượt tải xuống và 200.000 người dùng hoạt động đóng góp vào hệ thống radar tập thể này, ứng dụng ePPO thể hiện một bước tiến đáng kể trong việc tận dụng dữ liệu thu thập từ cộng đồng và AI để tăng cường phòng không và bảo vệ dân thường trong cuộc xung đột đang diễn ra.

2.8. Nhận dạng mục tiêu tự động

Nhận dạng mục tiêu tự động (ATR – automation target recognition) là một tập hợp các công nghệ tự động hóa việc phát hiện, phân loại và theo dõi các đối tượng hoặc kẻ địch. Về cơ bản, ATR dựa trên các thuật toán nhận dạng mẫu (template matching), so khớp dữ liệu cảm biến đến với một tập hợp các mẫu hoặc mô hình hành vi đã biết, gắn cờ các đặc điểm bất thường là mục tiêu tiềm năng. Đây không phải là một khái niệm mới đối với quân đội, nhưng trí tuệ nhân tạo (AI) đang thay đổi cách thức hoạt động của ATR và cách phát triển các hệ thống ATR, cho phép nâng cao hiệu suất và giảm chi phí, những yếu tố trước đây khiến các ứng dụng như vậy nằm ngoài tầm với.

Trên thực tế, ATR tuân theo quy trình ba bước. Đầu tiên, hệ thống ATR tích hợp trí tuệ nhân tạo (AI) phát hiện mục tiêu bằng cách quét một khu vực được chỉ định để tìm kiếm bất kỳ dấu hiệu đáng chú ý nào, dựa trên cả dữ liệu cảm biến hình ảnh và phi hình ảnh. Sau khi phát hiện mục tiêu, hệ thống sẽ phân loại mục tiêu đó bằng cách xác định đối tượng mà nó có khả năng đại diện nhất—ví dụ: một phương tiện, một người hoặc một công trình. Cuối cùng, hệ thống theo dõi từng mục tiêu đã được xác định, liên tục cập nhật thông tin vị trí và dự đoán các chuyển động hoặc thay đổi trạng thái có thể xảy ra. Việc giám sát liên tục này đặc biệt có giá trị trong các tình huống chiến thuật diễn biến nhanh chóng, vì nó cung cấp cho các chiến binh trên mặt đất thông tin cập nhật từng giây về các mối đe dọa tiềm tàng.

Bằng cách tự động hóa việc xác định mục tiêu, công nghệ ATR tăng cường khả năng ra quyết định trong thời gian thực—cho dù đó là do người vận hành hay chính hệ thống thực hiện. Nền tảng dựa trên các thuật toán trí tuệ nhân tạo và sự kết hợp cảm biến cũng giúp nó thích ứng cao với các điều kiện chiến trường luôn thay đổi và đánh dấu một bước tiến đáng kể trong việc khai thác khả năng của AI để xử lý dữ liệu phức tạp một cách hiệu quả, chính xác và đáng tin cậy.

Những thách thức hiện tại trong ATR

Mặc dù công nghệ ATR đã trở nên thiết yếu trên chiến trường hiện đại, nó vẫn phải đối mặt với những hạn chế đáng kể. Trong khi hoạt động tốt trong môi trường được kiểm soát, khả năng thích ứng và độ chính xác của nó giảm đi trong điều kiện phức tạp và năng động của một cuộc chiến thực sự. Sau đây là một số trở ngại chính mà máy bay không người lái do con người điều khiển được trang bị ATR đang phải đối mặt:

1. Sử dụng mồi nhử và ngụy trang: Một trong những thách thức cấp bách nhất đối với ATR nằm ở việc phân biệt giữa các mối đe dọa thực sự và các chiêu trò đánh lừa tinh vi. Cả lực lượng Ukraine và Nga thường xuyên sử dụng mồi nhử , chẳng hạn như xe tăng bơm hơi hoặc các công trình pháo binh giả, và các kỹ thuật ngụy trang tiên tiến, làm rối loạn các thuật toán nhận dạng mục tiêu và người điều khiển.
2. Gây nhiễu tác chiến điện tử (EW): Bên cạnh các biện pháp đối phó vật lý, cả hai bên đều sử dụng các hệ thống EW mạnh mẽ được thiết kế để làm gián đoạn liên lạc của máy bay không người lái, nguồn cấp dữ liệu cảm biến và toàn bộ chuỗi chỉ huy. Gây nhiễu EW làm suy giảm việc truyền dữ liệu thời gian thực, khiến cho máy bay không người lái hoặc người điều khiển chúng khó xác định và xác nhận mục tiêu một cách đáng tin cậy hơn. Do đó, ATR phải hoạt động trong môi trường có liên kết thông tin bị suy giảm hoặc gián đoạn, xử lý các nhiệm vụ nhận dạng và theo dõi mục tiêu bằng bộ xử lý trên máy bay.
3. Đối phó với tầm nhìn hạn chế và môi trường đô thị dày đặc. Các yếu tố tự nhiên và nhân tạo như sương mù, mưa, tuyết và hoạt động ban đêm có thể làm giảm đáng kể hiệu quả của các cảm biến quang học và hồng ngoại tiêu chuẩn. Trong những trường hợp như vậy, ATR có thể phải dựa vào các phương pháp thay thế như radar hoặc phát hiện âm thanh, vốn cũng có những hạn chế riêng về hiệu suất. Môi trường đô thị ở miền đông Ukraine càng làm tăng thêm độ phức tạp do cơ sở hạ tầng dày đặc. Các cảm biến và thuật toán tinh vi cùng với các người vận hành được đào tạo bài bản thường bị nhầm lẫn, nhưng các nhà phát triển Ukraine vẫn nỗ lực duy trì khả năng nhắm mục tiêu chính xác đồng thời giảm thiểu thiệt hại ngoài dự kiến.

Trí tuệ nhân tạo có thể giải quyết những thách thức như thế nào?

Trí tuệ nhân tạo (AI) mang lại những lợi thế đáng kể về tốc độ, độ chính xác và hiệu quả trong việc xác định và theo dõi mục tiêu trong môi trường tác chiến phức tạp. Đặc biệt là có thể được tích hợp trực tiếp trên hệ thống không người lái. Bằng cách xử lý dữ liệu trong một mạng lưới cục bộ, khép kín, các thuật toán AI có thể kết hợp nhiều đầu vào cảm biến để cung cấp cho binh lính hiểu biết về môi trường xung quanh và mục tiêu, ngay cả khi không liên lạc được với căn cứ chỉ huy.

Giá trị cốt lõi của hệ thống ATR được hỗ trợ bởi AI là khả năng phát hiện và phân loại mục tiêu nhanh chóng và chính xác hơn so với người điều khiển. Các thuật toán học máy tiên tiến, được huấn luyện trên các tập dữ liệu bao gồm các kịch bản chiến đấu thực tế, có thể phân biệt giữa các phương tiện, hình người và cấu trúc trong các điều kiện địa hình và thời tiết khác nhau. Hoạt động liên tục mà không mệt mỏi, các hệ thống này nhận biết được những khác biệt tinh tế mà người quan sát có thể bỏ sót , cho phép xác định các mục tiêu giả và mục tiêu được ngụy trang.

Ngoài khả năng phát hiện đơn thuần, AI còn vượt trội trong việc nhanh chóng ưu tiên nhiều mục tiêu dựa trên các biến số thời gian thực như mức độ đe dọa, khoảng cách đến lực lượng đồng minh và mục tiêu nhiệm vụ.

2.9. Tự chủ công nghệ Thị giác Máy tính

Công ty ZIR System chuyên phát triển phần mềm có thể bổ sung cho hầu hết mọi loại máy bay không người lái tấn công. Tính năng chính của phần mềm và lý do nó được gọi là ZIR (có nghĩa là “thị giác” trong tiếng Ukraina) là khả năng tự động phát hiện mục tiêu. Hệ thống bao gồm một thành phần phần cứng — một module nhỏ gọn với máy tính và camera kỹ thuật số— và một thành phần phần mềm, trong trường hợp này là một mô hình AI được huấn luyện trước có khả năng nhận dạng mục tiêu. Phần mềm này cũng bổ sung một số khả năng điều hướng tự động.

Drone ZIR

Module phần cứng, có kích thước xấp xỉ cỡ cục xà bông tắm, được thiết kế để tích hợp liền mạch trên nhiều nền tảng khác nhau, từ máy bay không người lái bốn cánh đến máy bay cánh cố định. Có các thiết lập sẵn cho các mẫu máy bay không người lái bốn cánh tiêu chuẩn từ 7 đến 10 inch. Đối với máy bay không người lái cánh cố định, công ty chỉ cung cấp dây dẫn và các linh kiện thiết yếu, để các nhà sản xuất tự giải quyết vấn đề cân bằng trọng lượng, vị trí đặt camera và các khía cạnh khác trong thiết kế sản phẩm của họ. Mặc dù quá trình tích hợp phần cứng có vẻ đơn giản, nhưng mỗi máy bay không người lái mới vẫn cần điều chỉnh thủ công. Do đó, toàn bộ quá trình tích hợp bộ kit ZIR có thể mất từ vài tuần đến một tháng.

Phần mềm dựa trên trí tuệ nhân tạo (AI), được huấn luyện bằng dữ liệu nguồn mở, có thể nhận dạng nhiều loại mục tiêu khác nhau—bao gồm bộ binh, ô tô dân dụng, xe tải nhỏ, xe tải, hệ thống phòng không, pháo binh, xe bọc thép và xe tăng. Nó tự động phát hiện mục tiêu và khóa mục tiêu từ khoảng cách 1 km và hoạt động tự động ở khoảng cách lên đến 3 km, ngay cả trong môi trường tác chiến điện tử khắc nghiệt. Với độ chính xác khoảng 90 cm, nó cũng có thể tấn công các mục tiêu di động với tốc độ lên đến 64 km/h.

Công ty đang theo đuổi mục tiêu tự chủ hoàn toàn bằng cách phát triển một hệ thống có thể tự bay, phát hiện và tấn công mục tiêu. Để đạt được mục tiêu này, công ty sử dụng ArduPilot, một phần mềm lái tự động mã nguồn mở dành cho phương tiện không người lái, hỗ trợ điều hướng tự động, lập kế hoạch điểm đến và truyền dữ liệu từ xa theo thời gian thực. Thông qua ArduPilot, hệ thống có thể hoạt động mà không cần liên lạc bằng cách tải lên các nhiệm vụ để định vị và vô hiệu hóa mục tiêu trong một khu vực được chỉ định. Ngoài ra, định vị quang học thay thế GPS trong môi trường thiếu vùng phủ sóng vệ tinh, một khả năng đã được thử nghiệm và xác nhận bằng một chuyến bay thử nghiệm thành công trên quãng đường ba dặm, quay trở lại điểm xuất phát mà không cần GPS.

2.10. Mã hóa phần mềm

Mã hóa phần mềm trí tuệ nhân tạo (AI) trên máy bay cho phép Ukraine duy trì lợi thế công nghệ bằng cách khiến các hệ thống tự hành khó bị phân tích ngược. Mặc dù đối thủ có thể sao chép thiết kế phần cứng chỉ trong vài tuần, nhưng mã hóa tinh vi trong phần mềm hỗ trợ AI làm chậm đáng kể nỗ lực phát triển các hệ thống tương đương của họ.

Nguồn

https://www.csis.org/analysis/ukraines-future-vision-and-current-capabilities-waging-ai-enabled-autonomous-warfare

Ứng dụng của Thị giác Máy tính và Trí tuệ nhân tạo trong cuộc chiến Nga – Ukraina