1 điểm bởi GN⁺ 2023-12-17 | 1 bình luận | Chia sẻ qua WhatsApp

Tối ưu hóa trình biên dịch ML

  • Trình biên dịch ML là một quy trình phần mềm chuyển đổi chương trình do người dùng viết thành các lệnh có thể chạy trên phần cứng thực tế.
  • Chương trình ML có thể được biểu diễn dưới dạng đồ thị tính toán, trong đó các nút biểu thị các phép toán tensor và các cạnh biểu thị luồng tensor.
  • Trình biên dịch ML phải giải quyết nhiều bài toán tối ưu hóa phức tạp khác nhau, bao gồm tối ưu hóa ở cấp độ đồ thị và cấp độ kernel.

Bộ dữ liệu TpuGraphs

  • Mục tiêu là cải thiện trình biên dịch ML để nâng cao hiệu quả của các mô hình ML.
  • Gắn một mô hình chi phí đã được huấn luyện vào trình biên dịch để nhận chương trình và cấu hình trình biên dịch làm đầu vào, rồi xuất ra thời gian chạy dự kiến của chương trình.
  • Bộ dữ liệu TpuGraphs được phát hành để phục vụ việc huấn luyện mô hình chi phí cho các chương trình chạy trên Tensor Processing Units (TPU) tùy chỉnh của Google.

Cuộc thi Kaggle

  • Cuộc thi "Fast or Slow? Predict AI Model Runtime" sử dụng bộ dữ liệu TpuGraph đã khép lại với 792 người tham gia và 616 đội.
  • Những người tham gia đã sử dụng nhiều kỹ thuật mới như cắt tỉa/nén đồ thị, giá trị đệm đặc trưng, đặc trưng nút và cross-configuration attention.

NeurIPS Expo

  • Nếu bạn quan tâm đến nghiên cứu về dữ liệu có cấu trúc và trí tuệ nhân tạo, hãy chú ý đến phiên thảo luận tại NeurIPS Expo ngày 9 tháng 12 mang tên "Graph Learning Meets Artificial Intelligence".

Ý kiến của GN⁺

  • Tối ưu hóa trình biên dịch ML là một lĩnh vực quan trọng có thể cải thiện đáng kể tốc độ thực thi và hiệu quả của các mô hình ML.
  • Các nguồn lực như bộ dữ liệu TpuGraphs góp phần thúc đẩy nghiên cứu tối ưu hóa chương trình dựa trên ML và cải thiện hiệu năng của các hệ thống ML.
  • Cuộc thi Kaggle là nền tảng thúc đẩy sự hợp tác và đổi mới của cộng đồng ML, giúp những người tham gia chia sẻ và phát triển các cách tiếp cận cũng như kỹ thuật mới.

1 bình luận

 
GN⁺ 2023-12-17
Ý kiến trên Hacker News
  • Sự thổi phồng quá mức về trình biên dịch ML

    Các trình biên dịch ML đang bị thổi phồng quá mức. Cũng như các trình biên dịch truyền thống, luôn tồn tại những đánh đổi; chúng có thông lượng cao hơn so với việc thuê các lập trình viên hiệu năng chuyên sâu, nhưng nhóm sau thường có thể đạt hiệu năng cao hơn nhiều. Trình biên dịch ML kém hơn ở nhiều cấp độ: về mặt thuật toán, chúng không cung cấp phản hồi về cách sửa đổi mạng, làm mất đi ý đồ ban đầu và tạo ra các kernel kém hiệu quả. So với các lập trình viên assembly chuyên nghiệp, hiệu năng của trình biên dịch thấp hơn hơn 30%.

  • Tình trạng hiện tại và những hứa hẹn của trình biên dịch ML

    Câu hỏi về tình trạng hiện tại và những hứa hẹn trong ngắn hạn của các trình biên dịch ML.

  • Cải thiện dự đoán hiệu năng thời gian chạy của đồ thị tính toán

    Tóm tắt về việc cải thiện cách dự đoán hiệu năng thời gian chạy của đồ thị tính toán bằng GNN. Sử dụng từ điển embedding cho opcode của từng nút cùng với các đặc trưng nút khác, đồng thời công bố các cấu hình biên dịch XLA khác nhau trên TPU và bộ dữ liệu hiệu năng tương ứng. Để cải thiện dự đoán cho các đồ thị lớn hơn, họ sử dụng phân hoạch đồ thị (phân hoạch đồ thị METIS) và các phương pháp huấn luyện khác. Nội dung này chỉ liên quan đến dự đoán hiệu năng, không phải cải thiện hay đề xuất các đồ thị tương đương mới.

  • Câu hỏi về dự án Gemini

    Câu hỏi về tình trạng hiện tại của dự án Gemini.

  • Yêu cầu giải thích cách phép tích chập (conv) hoạt động trong đồ thị

    Yêu cầu giải thích cách phép tích chập được thực hiện đối với tensor có một hình dạng cụ thể.

  • Transformer có tối ưu hay không

    Câu hỏi liệu có dấu hiệu nào cho thấy Transformer là tối ưu theo cách nào đó hay không.

  • Ý kiến về đoạn đầu tiên

    Ý kiến cho rằng đoạn đầu tiên đang che khuất ý chính, nhưng ngoài điều đó ra thì đây vẫn là nội dung thú vị.

  • Sự thán phục trước tốc độ phát triển của ML

    Ý kiến rằng ML hiện đang phát triển với tốc độ đáng kinh ngạc; dù không tin vào singularity, nhưng nó đang thay đổi phần mềm và xã hội theo những cách không thể dự đoán.

  • [Bình luận bị gắn cờ]

    Hai bình luận đã bị gắn cờ nên không thể xem nội dung.