Bài viết này viết bằng sự phán đoán trên các kiến thức đã học rồi xâu chuỗi lại. Tác giả hoàn toàn chưa sử dụng Siêu máy tính nào, do đó nếu có sai xin vui lòng phản hồi bên dưới.
Bài này sẽ giới thiệu về siêu máy tính & ứng dụng trong thị giác máy tính. Hình ảnh đầu bài là Siêu máy tính IBM Blue Gene sử dụng 164,000 vi xử lý (CPU).
Nhu cầu thực tế
Một trong những bài toán cơ bản nhất của thị giác máy tính là tìm đối tượng trong ảnh. 1 trong những cách phổ biến nhất là dùng Haar Cascade . Thuật toán này sẽ học mọi đặc trưng của đối tượng cần tìm rồi lưu lại. Sau đó dùng đặc trưng đã học được để tìm đối tượng trong ảnh. Số lượng ảnh cho học càng nhiều thì càng chính xác, càng nhiều bước càng chính xác. Tuy nhiên quá trình training lại lâu, có thể đến 1 ngày hoặc 1 tuần.
Khi training xem tốc độ CPU không sử dụng hết 100% CPU bởi vì quá trình training chỉ sử dụng 1 core. Các CPU hiện đại có nhiều core để xử lý nhiều tác vụ của người dùng. Trong khi đó quá trình training lại cần 1 core mạnh bởi vì quá trình tính toán phải đồng bộ. Tức là không xử lý song song được mà cần xử lý tuần tự.
Đó mới chỉ là 1 ví dụ nhỏ, các tác vụ khác cần xử lý bộ dữ liệu lớn hơn nhiều lần. Nếu tính bằng máy tính thường thì phải mất vài năm, vài chục năm mới xong. Do đó cần xây dựng siêu máy tính để tính toán nhanh hơn. Các công việc như dự đoán vị trí giếng dầu mỏ, mỏ than đá là có lợi về kinh tế.
Mặt khác các siêu máy tính được custom cho nhu cầu riêng biệt nào đó. Do đó khi xử lý bằng siêu máy tính sẽ có lợi hơn do sự chuyên biệt hóa.
Định nghĩa siêu máy tính
Dựa vào nhu cầu thực tế người ta sẽ build máy cho nhu cầu nào đó chứ không nhất thiết phải giống nhau. Có thể cho khai thác khoáng sản, thiên văn học, hoặc phục vụ cho các trường đại học.
Định nghĩa siêu máy có thể hiểu như sau:
Siêu máy tính là máy tính có khả năng tính toán vượt trội so với máy tính thông thường. Siêu máy tính được tạo thành từ hàng ngàn CPU (có thể trăm ngàn CPU) và tiêu tốn rất nhiều điện năng.
Không chỉ là cỗ máy mạnh, siêu máy tính còn thể hiện sức mạnh quốc gia, trình độ khoa học kỹ thuật. Các nước tiên tiến thường chạy đua với nhau để chứng tỏ sức mạnh công nghệ của mình. Tương tự như các cường quốc chạy đua xem ai sẽ lên vũ trụ trước.
Ứng dụng trong trí tuệ nhân tạo
Nvidia vừa công bố siêu máy tính mini DGX-1 được tạo thành từ GPU, không phải CPU như siêu máy tính khác.
Bên dưới là so sánh giữa siêu máy tính DGX-1 và máy tính sử dụng 2 CPU Xeon E5-2699 khi training Deep Learning. Máy tính thường training tốn 1310 giờ, còn siêu máy tính tốn 23 giờ. Đó là lý do cần siêu máy tính, vì training sai còn thời gian training lại.
Với cỗ máy như vậy, các bạn có thể training Haar Cascade nhanh hơn nhiều so với máy bàn.