- Tesla đã công bố mã nguồn mở Tesla Transport Protocol over Ethernet (TTPoE) tại HotChips 2024
- Tesla đã tham gia Ultra Ethernet Consortium (UEC) để chia sẻ giao thức này và nỗ lực tiêu chuẩn hóa một fabric tốc độ cao/độ trễ thấp mới dành cho AI/ML/trung tâm dữ liệu
- TTPoE hướng tới tính không độc quyền, chi phí thấp, kiểm soát tắc nghẽn phân tán, khung EthernetII tiêu chuẩn và giao thức liên kết phi tập trung
- Các đặc điểm của TTPoE
- Tương tự TCP, giao thức này cho phép mất gói và truyền lại, nhưng vẫn đảm bảo toàn bộ quá trình truyền
- Việc triển khai ban đầu của TTPoE được thực hiện trong dự án Tesla Dojo v1
- Giao thức chạy hoàn toàn bằng phần cứng và được triển khai trên một siêu máy tính đa exaflops (fp16) cực lớn với hàng chục nghìn endpoint đồng thời trở lên
- Giao thức này có thể thiết lập và vận hành liên kết mà không cần sự can thiệp của CPU hay OS
- Giao thức này không phức tạp hay quá cầu kỳ mà dựa trên các nguyên tắc cơ bản
- Truyền tải Ethernet về bản chất là di chuyển dữ liệu từ A đến B và chỉ nên bị giới hạn bởi các giới hạn vật lý
- Quản lý tắc nghẽn tập trung trong các hệ thống quy mô rất lớn là một nỗ lực thiếu thực tế; mỗi endpoint nên có khả năng đàn hồi và tự quản lý
Ý kiến của GN⁺
- TTPoE là một nỗ lực đáng chú ý nhằm vượt qua các giới hạn của giao thức TCP hiện có trong môi trường tính toán hiệu năng cao
- Mục tiêu chính có vẻ là giảm thiểu độ trễ và tối đa hóa thông lượng thông qua offload phần cứng và máy trạng thái được đơn giản hóa
- TTPoE có tiềm năng cải thiện tốc độ truyền dữ liệu và độ trễ trong lĩnh vực AI và ML
- Việc Tesla công bố mã nguồn mở giao thức này sẽ giúp thúc đẩy đổi mới trong lĩnh vực HPC
- Tuy vậy, có vẻ TTPoE sẽ khó có thể thay thế hoàn toàn TCP trong các mạng dùng chung; đây là một giải pháp được tối ưu cho mạng chuyên dụng chất lượng cao. Để TTPoE được chấp nhận rộng rãi, việc tiêu chuẩn hóa và xây dựng hệ sinh thái sẽ là yếu tố quan trọng
- Các giao thức có chức năng tương tự gồm có RoCE (RDMA over Converged Ethernet) và NVLink
1 bình luận
Có một bài khác giải thích chi tiết hơn về TTPoE đây.
Tesla’s TTPoE at Hot Chips 2024: Replacing TCP for Low Latency Applications
Tổng quan về TTPoE
Sự cần thiết của TTPoE
Đặc điểm của TTPoE
Kiểm soát tắc nghẽn của TTPoE
Triển khai phần cứng TTPoE
Mojo NIC
Tóm tắt