DeepEval - Kiểm thử đơn vị cho LLM

xguru · 2023-08-19T10:03:01+09:00

Triết lý cốt lõi là "Pytest for LLM" Để chuyển sang production, cung cấp một cách đậm chất Python để chạy đánh giá offline cho pipeline LLM Có thể viết bài kiểm thử cho ứng dụng LLM (như RAG) giống như cách viết unit test Python Thông qua assert_llm_output, đánh giá câu trả lời bằng các metric như entailment / exact / bertscore Cũng có thể thiết lập metric tùy chỉnh và chỉnh sửa các metric hiện có

(github.com/mr-gpt)

4 điểm bởi xguru 2023-08-19 | Chưa có bình luận nào. | Chia sẻ qua WhatsApp

Triết lý cốt lõi là "Pytest for LLM"
Để chuyển sang production, cung cấp một cách đậm chất Python để chạy đánh giá offline cho pipeline LLM
Có thể viết bài kiểm thử cho ứng dụng LLM (như RAG) giống như cách viết unit test Python
Thông qua assert_llm_output, đánh giá câu trả lời bằng các metric như entailment / exact / bertscore
Cũng có thể thiết lập metric tùy chỉnh và chỉnh sửa các metric hiện có

DeepEval - Kiểm thử đơn vị cho LLM

Bài viết liên quan

Chưa có bình luận nào.