Grab tăng tốc phát triển ứng dụng LLM với LLM-Kit

xguru · 2024-12-03T10:02:01+09:00

LLM-Kit của Grab là một framework được thiết kế để tăng tốc việc thiết lập các ứng dụng Generative AI ở cấp độ production Khi phát triển các ứng dụng AI xử lý dữ liệu nhạy cảm, bảo mật và an toàn dữ liệu là cực kỳ quan trọng; LLM-Kit giải quyết các vấn đề như khả năng mở rộng, tích hợp, giám sát và tiêu chuẩn hóa Nhờ đó, công cụ này giúp việc phát triển ứng dụng LLM hiệu quả hơn trong dài hạn, đồng thời hỗ trợ Grab onboarding hàng trăm ứng dụng GenAI Các đặc điểm của LLM-Kit Cung cấp cấu trúc được cấu hình sẵn (máy chủ API, quản lý cấu hình, mẫu tác tử LLM, kiểm thử, v.v.) Tích hợp với Poetry, Gunicorn, FastAPI, LangChain, LangSmith, Hashicorp Vault, Amazon EKS, Gitlab CI, v.v. Tính năng observability cho phép giám sát theo thời gian thực thông qua tích hợp Datadog và LangSmith Quản lý cấu hình và secret bằng configparser của Python và Vault Trình hỗ trợ xác thực OpenID Connect (OIDC) Tài liệu hóa API bằng Swagger và Redoc Tích hợp với Redis và Vector DB Pipeline triển khai cho môi trường staging và production Tích hợp framework đánh giá mạnh mẽ của LangSmith Cookbook: cung cấp tài nguyên cho nhà phát triển bằng cách tập hợp các ví dụ được Grab sử dụng thường xuyên Bao gồm nhiều trường hợp như tác tử bộ nhớ bền vững, tác tử LLM cho Slackbot, trình phân tích hình ảnh, chatbot full-stack có giao diện người dùng, v.v. Giá trị của LLM-Kit Tăng tốc phát triển ứng dụng LLM nhờ stack công nghệ được cấu hình sẵn và tích hợp sẵn Có thể giám sát theo thời gian thực và phát hiện/giải quyết sự cố nhờ tích hợp LangSmith và Datadog Nâng cao bảo mật với xác thực OIDC và quản lý secret bằng Vault Cải thiện hiệu quả lưu trữ/tìm kiếm dữ liệu bằng Vector DB Cung cấp một framework “paved road” nhằm thúc đẩy best practice và tiêu chuẩn hóa Nhóm có thể tiết kiệm khoảng 1,5 tuần thời gian phát triển trước khi bắt tay vào tính năng đầu tiên Thiết kế kiến trúc và triển khai kỹ thuật Kiến trúc mô-đun mang lại khả năng mở rộng, tính linh hoạt và tính dễ sử dụng Tự động hóa Khi kỹ sư gửi các thông tin liên quan như tên ứng dụng, việc tạo dự án GitLab sẽ được kích hoạt Mã scaffold được thiết kế riêng cho ứng dụng LLM sẽ được tạo ra Tệp GitLab CI cho CI/CD cũng được tạo trong cùng repository Hạ tầng staging như ECR, EKS, v.v. sẽ được tạo Thư mục Terraform cho provisioning hạ tầng sẽ được tạo và dẫn tới việc triển khai hạ tầng production Ở cuối pipeline, token GPT sẽ được đẩy vào đường dẫn Vault bảo mật và thông báo hoàn tất sẽ được gửi cho kỹ sư Cấu trúc mã scaffold Agents: chứa mã khởi tạo tác tử dựa trên framework tác tử LangChain Auth: mô-đun xác thực và phân quyền để thực thi một số API nội bộ của Grab Core: bao gồm trích xuất cấu hình (như token GPT) và giải mã secret để chạy ứng dụng LLM Models: định nghĩa cấu trúc cho API LLM cốt lõi trong Grab Routes: định nghĩa các endpoint REST API cho ứng dụng LLM (bao gồm kiểm tra trạng thái, xác thực, phân quyền, tác tử đơn giản, v.v.) Storage: bao gồm kết nối với PGVector, Vector DB được Grab quản lý, cùng schema cơ sở dữ liệu Tools: các chức năng được dùng làm công cụ cho tác tử LLM Tracing: tích hợp với các công cụ tracing và monitoring để theo dõi nhiều metric khác nhau của ứng dụng production Utils: thư mục cơ bản cho các chức năng tiện ích Provisioning hạ tầng và triển khai Tích hợp một pipeline toàn diện tự động scaffold mã cần thiết cho provisioning hạ tầng, triển khai và quy trình build ngay trong cùng codebase Sử dụng Terraform để provisioning hạ tầng cần thiết một cách liền mạch Pipeline triển khai được định nghĩa trong tệp .gitlab-ci.yml để bảo đảm triển khai tự động Quy trình build được chỉ định trong Dockerfile, cho phép build nhất quán Việc scaffolding tự động giúp nhà phát triển tập trung viết business logic thay vì xử lý độ phức tạp của hạ tầng và triển khai cơ bản Scaffolding cho RAG Với LLM-Kit, quá trình thiết lập Vector DB (PGVector) và thêm vào danh sách cho phép dịch vụ được đơn giản hóa Sau khi gửi biểu mẫu, có thể truy cập thông tin xác thực và đường dẫn host DB Secret sẽ được tự động thêm vào đường dẫn Vault Kỹ sư chỉ cần đưa đường dẫn host DB vào tệp cấu hình của ứng dụng LLM-Kit đã được scaffold Kết luận LLM-Kit là công cụ quan trọng hỗ trợ đổi mới và tăng trưởng AI/ML của Grab Bằng cách giải quyết những thách thức mà các nhóm đang đối mặt và cung cấp một framework phát triển ứng dụng LLM toàn diện, có thể mở rộng và linh hoạt, LLM-Kit đang dẫn dắt quá trình phát triển thế hệ ứng dụng AI tiếp theo tại Grab Tăng trưởng và kế hoạch tương lai Có kế hoạch cung cấp SDK ổn định và dễ dùng, đồng thời cải thiện đáng kể khả năng đồng thời và khả năng mở rộng của web server Dự kiến cung cấp SDK LLM có thể tái sử dụng và kết hợp linh hoạt, bao gồm framework đánh giá và guardrail Phát triển CLI cho cập nhật phiên bản và công cụ phát triển Phát triển tính năng cung cấp tác tử dựa trên polling Thông qua những tiến bộ này, Grab muốn mang đến cho kỹ sư trải nghiệm phát triển mượt mà và hiệu quả hơn nữa

(engineering.grab.com)

7 điểm bởi xguru 2024-12-03 | Chưa có bình luận nào. | Chia sẻ qua WhatsApp

LLM-Kit của Grab là một framework được thiết kế để tăng tốc việc thiết lập các ứng dụng Generative AI ở cấp độ production
Khi phát triển các ứng dụng AI xử lý dữ liệu nhạy cảm, bảo mật và an toàn dữ liệu là cực kỳ quan trọng; LLM-Kit giải quyết các vấn đề như khả năng mở rộng, tích hợp, giám sát và tiêu chuẩn hóa
Nhờ đó, công cụ này giúp việc phát triển ứng dụng LLM hiệu quả hơn trong dài hạn, đồng thời hỗ trợ Grab onboarding hàng trăm ứng dụng GenAI

Các đặc điểm của LLM-Kit

Cung cấp cấu trúc được cấu hình sẵn (máy chủ API, quản lý cấu hình, mẫu tác tử LLM, kiểm thử, v.v.)
Tích hợp với Poetry, Gunicorn, FastAPI, LangChain, LangSmith, Hashicorp Vault, Amazon EKS, Gitlab CI, v.v.
Tính năng observability cho phép giám sát theo thời gian thực thông qua tích hợp Datadog và LangSmith
Quản lý cấu hình và secret bằng configparser của Python và Vault
Trình hỗ trợ xác thực OpenID Connect (OIDC)
Tài liệu hóa API bằng Swagger và Redoc
Tích hợp với Redis và Vector DB
Pipeline triển khai cho môi trường staging và production
Tích hợp framework đánh giá mạnh mẽ của LangSmith
Cookbook: cung cấp tài nguyên cho nhà phát triển bằng cách tập hợp các ví dụ được Grab sử dụng thường xuyên
- Bao gồm nhiều trường hợp như tác tử bộ nhớ bền vững, tác tử LLM cho Slackbot, trình phân tích hình ảnh, chatbot full-stack có giao diện người dùng, v.v.

Giá trị của LLM-Kit

Tăng tốc phát triển ứng dụng LLM nhờ stack công nghệ được cấu hình sẵn và tích hợp sẵn
Có thể giám sát theo thời gian thực và phát hiện/giải quyết sự cố nhờ tích hợp LangSmith và Datadog
Nâng cao bảo mật với xác thực OIDC và quản lý secret bằng Vault
Cải thiện hiệu quả lưu trữ/tìm kiếm dữ liệu bằng Vector DB
Cung cấp một framework “paved road” nhằm thúc đẩy best practice và tiêu chuẩn hóa
Nhóm có thể tiết kiệm khoảng 1,5 tuần thời gian phát triển trước khi bắt tay vào tính năng đầu tiên

Thiết kế kiến trúc và triển khai kỹ thuật

Kiến trúc mô-đun mang lại khả năng mở rộng, tính linh hoạt và tính dễ sử dụng

Tự động hóa

Khi kỹ sư gửi các thông tin liên quan như tên ứng dụng, việc tạo dự án GitLab sẽ được kích hoạt
Mã scaffold được thiết kế riêng cho ứng dụng LLM sẽ được tạo ra
Tệp GitLab CI cho CI/CD cũng được tạo trong cùng repository
Hạ tầng staging như ECR, EKS, v.v. sẽ được tạo
Thư mục Terraform cho provisioning hạ tầng sẽ được tạo và dẫn tới việc triển khai hạ tầng production
Ở cuối pipeline, token GPT sẽ được đẩy vào đường dẫn Vault bảo mật và thông báo hoàn tất sẽ được gửi cho kỹ sư

Cấu trúc mã scaffold

Agents: chứa mã khởi tạo tác tử dựa trên framework tác tử LangChain
Auth: mô-đun xác thực và phân quyền để thực thi một số API nội bộ của Grab
Core: bao gồm trích xuất cấu hình (như token GPT) và giải mã secret để chạy ứng dụng LLM
Models: định nghĩa cấu trúc cho API LLM cốt lõi trong Grab
Routes: định nghĩa các endpoint REST API cho ứng dụng LLM (bao gồm kiểm tra trạng thái, xác thực, phân quyền, tác tử đơn giản, v.v.)
Storage: bao gồm kết nối với PGVector, Vector DB được Grab quản lý, cùng schema cơ sở dữ liệu
Tools: các chức năng được dùng làm công cụ cho tác tử LLM
Tracing: tích hợp với các công cụ tracing và monitoring để theo dõi nhiều metric khác nhau của ứng dụng production
Utils: thư mục cơ bản cho các chức năng tiện ích

Provisioning hạ tầng và triển khai

Tích hợp một pipeline toàn diện tự động scaffold mã cần thiết cho provisioning hạ tầng, triển khai và quy trình build ngay trong cùng codebase
Sử dụng Terraform để provisioning hạ tầng cần thiết một cách liền mạch
Pipeline triển khai được định nghĩa trong tệp .gitlab-ci.yml để bảo đảm triển khai tự động
Quy trình build được chỉ định trong Dockerfile, cho phép build nhất quán
Việc scaffolding tự động giúp nhà phát triển tập trung viết business logic thay vì xử lý độ phức tạp của hạ tầng và triển khai cơ bản

Scaffolding cho RAG

Với LLM-Kit, quá trình thiết lập Vector DB (PGVector) và thêm vào danh sách cho phép dịch vụ được đơn giản hóa
Sau khi gửi biểu mẫu, có thể truy cập thông tin xác thực và đường dẫn host DB
Secret sẽ được tự động thêm vào đường dẫn Vault
Kỹ sư chỉ cần đưa đường dẫn host DB vào tệp cấu hình của ứng dụng LLM-Kit đã được scaffold

Kết luận

LLM-Kit là công cụ quan trọng hỗ trợ đổi mới và tăng trưởng AI/ML của Grab
Bằng cách giải quyết những thách thức mà các nhóm đang đối mặt và cung cấp một framework phát triển ứng dụng LLM toàn diện, có thể mở rộng và linh hoạt, LLM-Kit đang dẫn dắt quá trình phát triển thế hệ ứng dụng AI tiếp theo tại Grab

Tăng trưởng và kế hoạch tương lai

Có kế hoạch cung cấp SDK ổn định và dễ dùng, đồng thời cải thiện đáng kể khả năng đồng thời và khả năng mở rộng của web server
Dự kiến cung cấp SDK LLM có thể tái sử dụng và kết hợp linh hoạt, bao gồm framework đánh giá và guardrail
Phát triển CLI cho cập nhật phiên bản và công cụ phát triển
Phát triển tính năng cung cấp tác tử dựa trên polling
Thông qua những tiến bộ này, Grab muốn mang đến cho kỹ sư trải nghiệm phát triển mượt mà và hiệu quả hơn nữa