Khả năng tương thích OpenAI
- Ollama hiện tương thích với API hoàn thành hội thoại của OpenAI, giúp có thể sử dụng Ollama cục bộ với nhiều công cụ và ứng dụng hơn.
- Bắt đầu thiết lập bằng cách tải xuống Ollama và lấy các mô hình như Llama 2 hoặc Mistral.
Cách dùng
cURL
- Sử dụng định dạng OpenAI để gọi endpoint API tương thích OpenAI của Ollama và đổi tên máy chủ thành
http://localhost:11434.
Thư viện OpenAI Python
- Có thể dùng thư viện OpenAI Python để truy cập endpoint API của Ollama, kèm theo khóa API bắt buộc nhưng không được sử dụng.
Thư viện OpenAI JavaScript
- Có thể dùng thư viện OpenAI JavaScript để truy cập endpoint API của Ollama, kèm theo khóa API bắt buộc nhưng không được sử dụng.
Ví dụ
Vercel AI SDK
- Vercel AI SDK là thư viện mã nguồn mở giúp xây dựng các ứng dụng phát trực tuyến hội thoại.
- Sử dụng
create-next-app để sao chép kho lưu trữ ví dụ.
Autogen
- Autogen là framework mã nguồn mở phổ biến để xây dựng các ứng dụng đa tác tử do Microsoft tạo ra.
- Ví dụ này sử dụng mô hình Code Llama, đồng thời cài đặt Autogen và tạo script Python để dùng Ollama.
Sắp có thêm nhiều tính năng
- Đây là hỗ trợ thử nghiệm ban đầu cho OpenAI API.
- Các cải tiến tương lai đang được cân nhắc gồm API embeddings, function calling, hỗ trợ vision và Logprobs.
- Xem tài liệu về khả năng tương thích OpenAI để biết thêm chi tiết.
Ý kiến của GN⁺
- Tương thích với OpenAI API: Khi Ollama tương thích với OpenAI API, các nhà phát triển có thể tích hợp và tận dụng mô hình AI trong môi trường cục bộ dễ dàng hơn. Đây là một thay đổi quan trọng giúp tăng khả năng tiếp cận trong phát triển ứng dụng dựa trên AI.
- Hỗ trợ nhiều ngôn ngữ lập trình: Việc hỗ trợ thông qua các thư viện Python và JavaScript cho thấy khả năng ứng dụng trong nhiều môi trường phát triển khác nhau. Điều này có nghĩa là các nhà phát triển có thể dễ dàng tích hợp tính năng AI bằng ngôn ngữ họ ưa dùng.
- Tích hợp với framework mã nguồn mở: Các ví dụ tích hợp với những framework mã nguồn mở như Vercel AI SDK và Autogen cho thấy khả năng mở rộng phạm vi sử dụng của Ollama, đồng thời thể hiện tiềm năng thúc đẩy đổi mới dựa trên cộng đồng.
1 bình luận
Ý kiến Hacker News
Trong vài tháng gần đây, mức độ dễ dùng của các LLM tự host tại chỗ đã cải thiện đáng kinh ngạc.
llamafilecủa Mozilla-Ocho dễ dùng đến mức nào.Có những người cá nhân cảm thấy không hài lòng khi khả năng tương thích với API OpenAI đang trở thành tiêu chuẩn của cộng đồng.
Đang phát triển một phiên bản Copilot được cải tiến, hỗ trợ để người dùng có thể mang LLM của riêng mình vào.
Ollama hoạt động tốt hơn các công cụ khác và đơn giản là chạy được.
Script cài đặt Linux của Ollama hoạt động theo phong cách tiêu chuẩn hiện nay.
sudo.Tính tương thích với OpenAI có phần hơi dễ gây hiểu lầm.
Lớp tương thích cũng có thể được xây dựng ở phía thư viện.
llm()hoạt động với nhiều backend LLM khác nhau.Đang thực hiện một dự án cho phép chuyển đổi dễ dàng giữa mã nguồn mở (ví dụ: HF, VLLM) và các mô hình thương mại (OpenAI, Google, Anthropic, Together).
Đặt câu hỏi về trường hợp sử dụng của Ollama là gì, và vì sao không nên dùng trực tiếp
llama.cpp.Hỏi liệu Ollama có phải chỉ là một máy chủ HTTP dạng Dockerized gọi trực tiếp
llama.cpphay không, và ngoài API OpenAI mới được bổ sung thì còn khác biệt gì nữa.