3 điểm bởi jane10000 2026-04-13 | 2 bình luận | Chia sẻ qua WhatsApp

Do làm công việc nghiên cứu AI nên tôi thường xuyên chạy huấn luyện trên máy chủ GPU dùng chung. Mỗi lần như vậy, việc phải mở terminal để kiểm tra nvidia-smi xem có GPU trống hay không, tiến trình huấn luyện còn sống không, util và memory có được dùng đúng cách không, khá là bất tiện.

Vì vậy tôi đã thử tạo một ứng dụng cho phép xem ngay trạng thái máy chủ GPU NVIDIA từ xa trên thanh menu macOS. Ứng dụng kết nối tới máy chủ qua SSH để lấy thông tin, và được thiết kế để hoạt động mà không cần cài thêm agent riêng hay chương trình bổ sung nào ở phía máy chủ.

Ngay trên thanh menu, bạn có thể xem trực tiếp trạng thái GPU của máy chủ đã kết nối, đồng thời kiểm tra cả thông tin theo từng tiến trình. Ứng dụng cũng lấy được UID tiến trình, thứ vốn khó xem ngay chỉ với nvidia-smi, giúp nhận biết trực quan hơn người dùng nào đang chạy tác vụ gì. Tôi cũng cố gắng tận dụng tối đa cấu hình SSH hiện có và chú ý đến việc tìm nhanh các tiến trình do chính mình chạy.

Đây là công cụ tôi làm để dùng cá nhân, nhưng sau khi nhờ những người xung quanh thử đơn giản thì phản hồi lại tốt hơn mong đợi nên tôi đã công khai nó. Hiện tại ứng dụng chỉ hỗ trợ macOS.

Nếu có ai thường xuyên dùng máy chủ GPU trong môi trường tương tự, hãy thử dùng nhé. Nếu có điểm nào bất tiện hoặc tính năng nào cần thiết, tôi sẽ rất cảm kích nếu nhận được phản hồi!

2 bình luận

 
elbum 2026-04-14

Wow... có vẻ thực sự rất hữu ích.

 
jane10000 2026-04-14

Cảm ơn bạn!
Chúng tôi đang tiếp tục cải thiện để bạn có thể sử dụng thuận tiện hơn.