GPTCache - Thư viện lưu đệm câu trả lời cho truy vấn LLM

xguru · 2023-04-24T10:03:05+09:00

Lưu đệm câu trả lời của LLM để giảm chi phí LLM cho tổ chức và tăng tốc độ phản hồi Thông qua chiến lược lưu đệm ngữ nghĩa, tìm các truy vấn tương tự hoặc có liên quan để tăng tỷ lệ cache hit Chuyển truy vấn thành embedding bằng thuật toán embedding và thực hiện tìm kiếm liên quan cho embedding này thông qua vector store LLM Adapter: hỗ trợ OpenAI ChatGPT và LangChain (dự kiến cũng sẽ hỗ trợ Bard/Anthropic/LLaMA, v.v.) MultiModal Adapter: OpenAI Image Create, OpenAI Audio Transribe, HuggingFace Stable Diffusion Embedding Generator: OpenAI, ONNX, HuggingFace, Cohere, fastText, SentenceTransformers Cache Storage: SQLite, PostgreSQL, MySQL, SQLServer,.. Vector Store: Mulvus, Zilliz Cloud, FAISS, Hnswlib Cache Manager: LRU, FIFO

(github.com/zilliztech)

13 điểm bởi xguru 2023-04-24 | Chưa có bình luận nào. | Chia sẻ qua WhatsApp

Lưu đệm câu trả lời của LLM để giảm chi phí LLM cho tổ chức và tăng tốc độ phản hồi
Thông qua chiến lược lưu đệm ngữ nghĩa, tìm các truy vấn tương tự hoặc có liên quan để tăng tỷ lệ cache hit
- Chuyển truy vấn thành embedding bằng thuật toán embedding và thực hiện tìm kiếm liên quan cho embedding này thông qua vector store
LLM Adapter: hỗ trợ OpenAI ChatGPT và LangChain (dự kiến cũng sẽ hỗ trợ Bard/Anthropic/LLaMA, v.v.)
MultiModal Adapter: OpenAI Image Create, OpenAI Audio Transribe, HuggingFace Stable Diffusion
Embedding Generator: OpenAI, ONNX, HuggingFace, Cohere, fastText, SentenceTransformers
Cache Storage: SQLite, PostgreSQL, MySQL, SQLServer,..
Vector Store: Mulvus, Zilliz Cloud, FAISS, Hnswlib
Cache Manager: LRU, FIFO

GPTCache - Thư viện lưu đệm câu trả lời cho truy vấn LLM

Bài viết liên quan

Chưa có bình luận nào.