62 điểm bởi GN⁺ 2025-12-31 | 1 bình luận | Chia sẻ qua WhatsApp
  • Năm 2025 là năm mô hình ngôn ngữ lớn (LLM)framework agent bùng nổ tăng trưởng, thúc đẩy đổi mới trên toàn bộ hệ sinh thái Python
  • Ngay cả trong làn sóng lấy LLM làm trung tâm, danh sách Top 10 thư viện vẫn được chọn theo hướng cân bằng giữa phát triển phổ thôngAI/ML/Data
  • Ở nhóm phổ thông nổi bật có trình kiểm tra kiểu ty siêu nhanh viết bằng Rust, công cụ phân tích độ phức tạp mã complexipy, và framework xử lý tài liệu Kreuzberg
  • Trong mảng AI/ML, MCP Python SDK, TOON, Deep Agents, smolagents, LlamaIndex Workflows đang dẫn dắt đổi mới trong tích hợp LLM và phát triển agent
  • Danh sách này cho thấy Python vẫn tiếp tục tiến hóa trên nhiều mặt như xử lý dữ liệu, hiệu năng và trải nghiệm lập trình viên

Tổng quan

  • Tryolabs chọn ra các thư viện tiêu biểu của hệ sinh thái Python mỗi năm, và đây là danh sách thường niên lần thứ 11
  • Năm 2025 chứng kiến sự gia tăng mạnh của các công cụ liên quan đến LLM và agent, nhưng nhóm tuyển chọn đã tránh thiên lệch quá mức về LLM và phản ánh sự phát triển rộng khắp của Python
  • Kết quả được chia thành các hạng mục: Top 10 cho phát triển phổ thông, Top 10 AI/ML/Data, Runners-up, và Long tail

Top 10 thư viện cho phát triển phổ thông

  • ty — trình kiểm tra kiểu Python siêu nhanh viết bằng Rust

    • Tự động nhận diện cấu trúc dự án, phát hiện .venv, hỗ trợ pyproject.toml
    • Phân tích tăng dần theo từng hàm dựa trên Salsa giúp cải thiện độ phản hồi của IDE
    • Nỗ lực hiện đại hóa tooling tiếp nối Ruffuv của đội Astral
  • complexipy — công cụ đo độ phức tạp nhận thức (cognitive complexity) của mã

    • Dựa trên nghiên cứu của SonarSource, lượng hóa các cấu trúc khó hiểu đối với con người
    • Cài đặt bằng Rust giúp phân tích nhanh ngay cả với codebase lớn
    • Hỗ trợ CLI, Python API, extension VS Code và tích hợp CI/CD
  • Kreuzberg — framework document intelligence đa ngôn ngữ

    • Hỗ trợ hơn 50 định dạng tệp như PDF, Office, hình ảnh, HTML
    • Cung cấp binding cho Python, TypeScript, Go và nhiều ngôn ngữ khác
    • Có nhiều hình thức triển khai như CLI, REST API, Docker, máy chủ MCP
  • throttled-py — kiểm soát tốc độ request dựa trên 5 thuật toán (Fixed/Sliding Window, Token/Leaky Bucket, GCRA)

    • Hỗ trợ lưu trữ bằng bộ nhớ hoặc Redis, tương thích cả mã đồng bộ và bất đồng bộ
    • Cung cấp hiệu năng nhanh hơn 2,5~4,5 lần cùng cấu trúc cấu hình gọn gàng
  • httptapphân tích và trực quan hóa thời gian chi tiết của request HTTP

    • Đo lường theo từng giai đoạn như DNS, TCP, TLS, chờ máy chủ, truyền phản hồi
    • Hỗ trợ waterfall view trong terminal, xuất JSON/metrics và theo dõi redirect
  • fastapi-guardgiải pháp middleware bảo mật tích hợp cho FastAPI

    • Danh sách trắng/đen IP, giới hạn tốc độ, phát hiện XSS·SQLi, lọc theo địa lý
    • Hỗ trợ môi trường phân tán qua tích hợp Redis, tự động thiết lập header OWASP
  • modshim — mở rộng thư viện hiện có theo cách overlay module

    • Có thể thêm tính năng mà không cần sửa mã nguồn, là giải pháp thay thế monkey-patching
    • Tạo module hợp nhất ảo bằng cách hook vào hệ thống import
  • Spec Kit — công cụ Spec-Driven Development của GitHub

    • Chuyển đặc tả thành bản thiết kế có thể thực thi, để agent AI đảm nhiệm phần triển khai
    • Tương thích với nhiều công cụ AI như Copilot, Claude Code
  • skylos — công cụ phát hiện mã chết và phân tích lỗ hổng bảo mật

    • Phát hiện hàm, lớp, import không được sử dụng; kiểm tra các mẫu rủi ro như SQLi
    • Cung cấp kết quả dựa trên điểm độ tin cậy (0–100), tích hợp VS Code và CI/CD
  • FastOpenAPItự động tạo tài liệu OpenAPI cho mọi web framework

    • Hỗ trợ 8 framework gồm Flask, Django, Tornado
    • Cung cấp routing bằng decorator kiểu FastAPI và kiểm định Pydantic v2

Top 10 thư viện AI/ML/Data

  • MCP Python SDK & FastMCP — hiện thực Model Context Protocol để kết nối LLM với dữ liệu bên ngoài

    • SDK chính thức của Anthropic và FastMCP 2.0 của Prefect bổ trợ cho nhau
    • Hỗ trợ OAuth 2.1, xác thực doanh nghiệp, tích hợp OpenAPI/FastAPI
  • TOON (Token-Oriented Object Notation)định dạng thay thế JSON nén dành cho LLM

    • Với cách thụt lề kiểu YAML và cấu trúc mảng kiểu CSV, giúp giảm 40~60% số token
    • Hoàn toàn tương thích với JSON, đang được triển khai đa ngôn ngữ
  • Deep Agents — framework agent LLM cho tác vụ dài hạn dựa trên LangChain

    • Tích hợp sẵn khả năng lập kế hoạch, truy cập hệ thống tệp, và ủy quyền cho sub-agent
    • Hỗ trợ streaming và bộ nhớ bền vững qua tích hợp LangGraph
  • smolagents — framework agent thực thi mã nhẹ của Hugging Face

    • Cấu trúc đơn giản chỉ khoảng 1.000 dòng, thực thi hành vi bằng mã Python
    • Cung cấp môi trường chạy an toàn như E2B·Docker·WASM sandbox
  • LlamaIndex Workflowsframework workflow AI hướng sự kiện

    • Cấu trúc bất đồng bộ gồm @stepEvent, hỗ trợ thực thi song song
    • Có thể quản lý trạng thái và khôi phục checkpoint bằng đối tượng Context
  • BatchataAPI xử lý batch hợp nhất cho OpenAI·Anthropic·Gemini

    • Hỗ trợ giới hạn chi phí, retry, khôi phục sau gián đoạn, và structured output dựa trên Pydantic
  • MarkItDowntrình chuyển tài liệu sang Markdown của Microsoft

    • Hỗ trợ nhiều định dạng như PDF, Word, PPT, Excel, hình ảnh, âm thanh
    • Giữ cấu trúc thân thiện với LLM, tích hợp Azure Document Intelligence
  • Data Formulatorcông cụ trực quan hóa dữ liệu dùng AI của Microsoft Research

    • Kết hợp giao diện trực quan với ngôn ngữ tự nhiên, tự động tạo mã biến đổi dữ liệu
    • Trực quan hóa dựa trên Vega-Lite, công khai minh bạch mã pandas/SQL
  • LangExtract — thư viện trích xuất cấu trúc văn bản chính xác của Google

    • Ánh xạ vị trí ký tự của văn bản gốc để trực quan hóa căn cứ trích xuất
    • Hỗ trợ nhiều mô hình như Gemini, OpenAI, Ollama, tối ưu xử lý song song
  • GeoAI — framework phân tích tích hợp AI-địa lý không gian của OpenGeos

    • Tích hợp PyTorch·Transformers·Leafmap, hỗ trợ huấn luyện và trực quan hóa ảnh vệ tinh
    • Đơn giản hóa các tác vụ phân tích địa lý chính như phân loại lớp phủ đất, phát hiện thay đổi

Một số ví dụ tiêu biểu trong Runners-up

  • AuthTuna — framework xác thực và phân quyền cho Python bất đồng bộ
  • FastRTC — biến hàm Python thành luồng âm thanh·video thời gian thực
  • hexora — công cụ phân tích tĩnh để phát hiện mẫu mã độc
  • opentemplate — template dự án bao gồm cấu hình phát triển·bảo mật·CI/CD hiện đại
  • Pyrefly — trình kiểm tra kiểu hiệu năng cao viết bằng Rust của Meta

Khái quát về Long Tail

  • Hàng trăm thư viện ngách được sắp xếp theo từng lĩnh vực
  • Phân loại chi tiết theo agent AI, xử lý bất đồng bộ, data pipeline, phát triển web, kiểm thử...
  • Cho thấy sự thử nghiệm rộng khắp và xu hướng chuyển giao thế hệ trong hệ sinh thái Python

Kết luận

  • Hệ sinh thái Python năm 2025 nổi lên với các xu hướng chính gồm cải thiện hiệu năng bằng Rust, tích hợp LLM, tự động hóa bằng agent, và tăng cường bảo mật cùng khả năng bảo trì
  • Danh sách của Tryolabs chứng minh rằng Python vẫn nằm tại giao điểm giữa đổi mới AI và phát triển đa dụng

1 bình luận

 
bungker 2025-12-31

Có khá nhiều thư viện mình chưa biết, chắc phải lướt qua một lượt mới được.