DSPy - framework để lập trình mô hình ngôn ngữ (thay vì prompting)

xguru · 2024-12-12T10:23:01+09:00

DSPy (Declarative Self-improving Python) là một framework được thiết kế để điều khiển mô hình ngôn ngữ (LM) thông qua lập trình Có thể nhanh chóng xây dựng các hệ thống AI dạng mô-đun, từ bộ phân loại đơn giản đến pipeline RAG phức tạp và vòng lặp agent, đồng thời cũng cung cấp các thuật toán để tối ưu prompt và trọng số Thay vì các prompt mong manh trước đây, bạn có thể viết mã Python có khả năng kết hợp để nhanh chóng xây dựng các hệ thống AI mô-đun và huấn luyện LM tạo ra đầu ra chất lượng cao Module dùng để mô tả hành vi AI bằng mã thay vì chuỗi Để xây dựng hệ thống AI đáng tin cậy, cần lặp lại nhanh Tuy nhiên, việc duy trì prompt rất khó vì mỗi khi thay đổi LM, metric hoặc pipeline, bạn lại phải sửa chuỗi hoặc dữ liệu DSPy được phát triển để tách phần định nghĩa hệ thống LM khỏi những lựa chọn phức tạp gắn với một LM hoặc chiến lược prompting cụ thể Cách lập trình của DSPy DSPy chuyển trọng tâm từ việc tinh chỉnh chuỗi prompt sang lập trình bằng các mô-đun ngôn ngữ tự nhiên có cấu trúc và mang tính khai báo Với mọi thành phần AI trong hệ thống, bạn chỉ định hành vi đầu vào/đầu ra bằng signature và chọn module để gán chiến lược gọi LM DSPy mở rộng signature thành prompt và phân tích đầu ra có kiểu để giúp viết các hệ thống AI dễ dùng, dễ перенос, và có thể tối ưu hóa Optimizer điều chỉnh prompt và trọng số của các mô-đun AI DSPy cung cấp công cụ biên dịch mã cấp cao có chú thích ngôn ngữ tự nhiên thành các phép toán cấp thấp, prompt hoặc cập nhật trọng số Nhờ đó có thể căn chỉnh LM với cấu trúc chương trình và metric Khi thay đổi mã hoặc metric, bạn có thể đơn giản biên dịch lại để phù hợp Quy trình tối ưu của DSPy Nếu bạn có vài chục hoặc vài trăm đầu vào đại diện cho tác vụ và một metric có thể đo chất lượng đầu ra của hệ thống, bạn có thể dùng DSPy Optimizer dspy.BootstrapRS tổng hợp các ví dụ few-shot tốt cho mọi module dspy.MIPROv2 đề xuất và tìm kiếm thông minh các chỉ dẫn ngôn ngữ tự nhiên tốt hơn cho mọi prompt dspy.BootstrapFinetune xây dựng dataset cho module và dùng nó để fine-tune trọng số LM của hệ thống Hệ sinh thái DSPy thúc đẩy nghiên cứu AI mã nguồn mở Mô hình mô-đun của DSPy mở ra cơ hội để nhiều nhà nghiên cứu cùng cải thiện kiến trúc xây dựng chương trình LM, chiến lược thời gian suy luận và công cụ tối ưu theo cách phân tán hơn, so với việc chỉ tập trung vào các mô hình ngôn ngữ lớn Điều này mang lại cho người dùng DSPy nhiều quyền kiểm soát hơn, giúp lặp nhanh hơn và cho phép chương trình tiếp tục tiến hóa theo thời gian bằng cách áp dụng các module hoặc công cụ tối ưu mới nhất Nghiên cứu DSPy bắt đầu tại Stanford NLP vào tháng 2 năm 2022, được xây dựng từ những bài học rút ra trong quá trình phát triển các hệ thống LM phức hợp ban đầu như ColBERT-QA, Baleen và Hindsight Lần đầu ra mắt với tên DSP vào tháng 12 năm 2022, phát triển thành DSPy vào tháng 10 năm 2023, và nhờ 250 người đóng góp, hàng chục nghìn người đã có thể học cách xây dựng và tối ưu các chương trình LM mô-đun Cộng đồng DSPy đã đạt được nhiều thành quả nghiên cứu về các công cụ tối ưu như MIPROv2, BetterTogether, LeReT và các kiến trúc chương trình như STORM, IReRa, DSPy Assertions Cũng có nhiều trường hợp áp dụng thành công cho các bài toán mới như PAPILLON, PATH, các nghiên cứu điển hình về prompting của WangLab@MEDIQA và UMD, cùng chương trình Red-Teaming của Haize Ngoài ra, tính thực tiễn của DSPy còn được chứng minh qua nhiều dự án mã nguồn mở, ứng dụng production và các trường hợp sử dụng khác

(dspy.ai)

9 điểm bởi xguru 2024-12-12 | Chưa có bình luận nào. | Chia sẻ qua WhatsApp

DSPy (Declarative Self-improving Python) là một framework được thiết kế để điều khiển mô hình ngôn ngữ (LM) thông qua lập trình
Có thể nhanh chóng xây dựng các hệ thống AI dạng mô-đun, từ bộ phân loại đơn giản đến pipeline RAG phức tạp và vòng lặp agent, đồng thời cũng cung cấp các thuật toán để tối ưu prompt và trọng số
Thay vì các prompt mong manh trước đây, bạn có thể viết mã Python có khả năng kết hợp để nhanh chóng xây dựng các hệ thống AI mô-đun và huấn luyện LM tạo ra đầu ra chất lượng cao
Module dùng để mô tả hành vi AI bằng mã thay vì chuỗi
- Để xây dựng hệ thống AI đáng tin cậy, cần lặp lại nhanh
- Tuy nhiên, việc duy trì prompt rất khó vì mỗi khi thay đổi LM, metric hoặc pipeline, bạn lại phải sửa chuỗi hoặc dữ liệu
- DSPy được phát triển để tách phần định nghĩa hệ thống LM khỏi những lựa chọn phức tạp gắn với một LM hoặc chiến lược prompting cụ thể
- Cách lập trình của DSPy
  - DSPy chuyển trọng tâm từ việc tinh chỉnh chuỗi prompt sang lập trình bằng các mô-đun ngôn ngữ tự nhiên có cấu trúc và mang tính khai báo
  - Với mọi thành phần AI trong hệ thống, bạn chỉ định hành vi đầu vào/đầu ra bằng signature và chọn module để gán chiến lược gọi LM
  - DSPy mở rộng signature thành prompt và phân tích đầu ra có kiểu để giúp viết các hệ thống AI dễ dùng, dễ перенос, và có thể tối ưu hóa
Optimizer điều chỉnh prompt và trọng số của các mô-đun AI
- DSPy cung cấp công cụ biên dịch mã cấp cao có chú thích ngôn ngữ tự nhiên thành các phép toán cấp thấp, prompt hoặc cập nhật trọng số
- Nhờ đó có thể căn chỉnh LM với cấu trúc chương trình và metric
- Khi thay đổi mã hoặc metric, bạn có thể đơn giản biên dịch lại để phù hợp
- Quy trình tối ưu của DSPy
  - Nếu bạn có vài chục hoặc vài trăm đầu vào đại diện cho tác vụ và một metric có thể đo chất lượng đầu ra của hệ thống, bạn có thể dùng DSPy Optimizer
    - dspy.BootstrapRS tổng hợp các ví dụ few-shot tốt cho mọi module
    - dspy.MIPROv2 đề xuất và tìm kiếm thông minh các chỉ dẫn ngôn ngữ tự nhiên tốt hơn cho mọi prompt
    - dspy.BootstrapFinetune xây dựng dataset cho module và dùng nó để fine-tune trọng số LM của hệ thống
Hệ sinh thái DSPy thúc đẩy nghiên cứu AI mã nguồn mở
- Mô hình mô-đun của DSPy mở ra cơ hội để nhiều nhà nghiên cứu cùng cải thiện kiến trúc xây dựng chương trình LM, chiến lược thời gian suy luận và công cụ tối ưu theo cách phân tán hơn, so với việc chỉ tập trung vào các mô hình ngôn ngữ lớn
- Điều này mang lại cho người dùng DSPy nhiều quyền kiểm soát hơn, giúp lặp nhanh hơn và cho phép chương trình tiếp tục tiến hóa theo thời gian bằng cách áp dụng các module hoặc công cụ tối ưu mới nhất
- Nghiên cứu DSPy bắt đầu tại Stanford NLP vào tháng 2 năm 2022, được xây dựng từ những bài học rút ra trong quá trình phát triển các hệ thống LM phức hợp ban đầu như ColBERT-QA, Baleen và Hindsight
- Lần đầu ra mắt với tên DSP vào tháng 12 năm 2022, phát triển thành DSPy vào tháng 10 năm 2023, và nhờ 250 người đóng góp, hàng chục nghìn người đã có thể học cách xây dựng và tối ưu các chương trình LM mô-đun
- Cộng đồng DSPy đã đạt được nhiều thành quả nghiên cứu về các công cụ tối ưu như MIPROv2, BetterTogether, LeReT và các kiến trúc chương trình như STORM, IReRa, DSPy Assertions
- Cũng có nhiều trường hợp áp dụng thành công cho các bài toán mới như PAPILLON, PATH, các nghiên cứu điển hình về prompting của WangLab@MEDIQA và UMD, cùng chương trình Red-Teaming của Haize
- Ngoài ra, tính thực tiễn của DSPy còn được chứng minh qua nhiều dự án mã nguồn mở, ứng dụng production và các trường hợp sử dụng khác

DSPy - framework để lập trình mô hình ngôn ngữ (thay vì prompting)

Bài viết liên quan

Chưa có bình luận nào.