Hai nhóm nghiên cứu độc lập hôm thứ Năm công bố ba kỹ thuật tấn công Rowhammer mới nhắm vào card GPU thế hệ Ampere của Nvidia, cho phép kẻ tấn công giành quyền root hoàn toàn trên máy chủ. Các cuộc tấn công khai thác hiện tượng "lật bit" trong bộ nhớ DRAM — khi các bit 0 chuyển thành 1 và ngược lại do truy cập lặp đi lặp lại với tốc độ cao. Không giống các cuộc tấn công Rowhammer trước đây chỉ gây hỏng nhẹ đầu ra mạng thần kinh, các kỹ thuật mới này tạo ra bitflip trên bộ nhớ GDDR và từ đó kiểm soát toàn bộ bộ nhớ CPU. Điều kiện để tấn công thành công là IOMMU phải bị tắt — đây là cài đặt mặc định trong BIOS của nhiều hệ thống.
Phân Tích
Đây không phải một lỗ hổng phần mềm bình thường có thể vá bằng một bản cập nhật. Rowhammer là vấn đề vật lý — xuất phát từ thiết kế phần cứng bộ nhớ. Điều đó khiến nó đặc biệt nguy hiểm và khó khắc phục triệt để.
Nguy cơ lớn nhất nằm ở môi trường điện toán đám mây. Một card GPU cao cấp thường có giá từ 8.000 USD trở lên, nên các nhà cung cấp cloud như AWS, Google Cloud, hay Azure thường cho nhiều người dùng thuê chung tài nguyên GPU. Trong mô hình đó, một khách hàng độc hại — hoặc mã độc chạy trong container của họ — có thể leo thang đặc quyền và chiếm quyền kiểm soát toàn bộ máy chủ vật lý, kéo theo dữ liệu của tất cả người dùng khác trên cùng node.
Cần lưu ý rằng điều kiện IOMMU bị tắt theo mặc định là một chi tiết nghiêm trọng. Nhiều nhà quản trị hệ thống không chủ động bật tính năng này vì lo ngại ảnh hưởng hiệu năng. Đây là ví dụ điển hình của đánh đổi bảo mật-hiệu suất mà giờ đây có hậu quả rõ ràng.
Tác động lan rộng đến các lĩnh vực AI (Trí tuệ nhân tạo), nghiên cứu khoa học, và tài chính — bất kỳ ngành nào đang thuê GPU theo giờ trên cloud đều phải đánh giá lại mức độ rủi ro ngay lập tức.
Tác Động Cộng Đồng
Kỹ sư và lập trình viên gốc Việt tại Thung lũng Silicon và các công ty công nghệ Mỹ cần đặc biệt chú ý. Nhiều người trong cộng đồng này làm việc tại các công ty AI (Trí tuệ nhân tạo), startup, hoặc các nhóm nghiên cứu sử dụng GPU cloud để huấn luyện mô hình học máy. Nếu hạ tầng cloud của công ty họ chạy trên các card Nvidia Ampere với IOMMU bị tắt, dữ liệu huấn luyện, mã nguồn, và thông tin xác thực đều có nguy cơ bị đánh cắp bởi người dùng độc hại cùng chia sẻ tài nguyên.
Sinh viên Việt Nam theo diện STEM OPT hoặc visa H-1B đang làm nghiên cứu tại các trường đại học Mỹ — nơi tài nguyên GPU thường được chia sẻ trong cluster nội bộ — cũng nên kiểm tra cấu hình IOMMU trên hệ thống mình sử dụng và báo cáo với quản trị viên IT.