Những thư viện Python nổi bật trong năm 2025
(tryolabs.com)- Năm 2025 là năm mô hình ngôn ngữ lớn (LLM) và framework agent bùng nổ tăng trưởng, thúc đẩy đổi mới trên toàn bộ hệ sinh thái Python
- Ngay cả trong làn sóng lấy LLM làm trung tâm, danh sách Top 10 thư viện vẫn được chọn theo hướng cân bằng giữa phát triển phổ thông và AI/ML/Data
- Ở nhóm phổ thông nổi bật có trình kiểm tra kiểu
tysiêu nhanh viết bằng Rust, công cụ phân tích độ phức tạp mã complexipy, và framework xử lý tài liệu Kreuzberg - Trong mảng AI/ML, MCP Python SDK, TOON, Deep Agents, smolagents, LlamaIndex Workflows đang dẫn dắt đổi mới trong tích hợp LLM và phát triển agent
- Danh sách này cho thấy Python vẫn tiếp tục tiến hóa trên nhiều mặt như xử lý dữ liệu, hiệu năng và trải nghiệm lập trình viên
Tổng quan
- Tryolabs chọn ra các thư viện tiêu biểu của hệ sinh thái Python mỗi năm, và đây là danh sách thường niên lần thứ 11
- Năm 2025 chứng kiến sự gia tăng mạnh của các công cụ liên quan đến LLM và agent, nhưng nhóm tuyển chọn đã tránh thiên lệch quá mức về LLM và phản ánh sự phát triển rộng khắp của Python
- Kết quả được chia thành các hạng mục: Top 10 cho phát triển phổ thông, Top 10 AI/ML/Data, Runners-up, và Long tail
Top 10 thư viện cho phát triển phổ thông
-
ty — trình kiểm tra kiểu Python siêu nhanh viết bằng Rust
- Tự động nhận diện cấu trúc dự án, phát hiện
.venv, hỗ trợpyproject.toml - Phân tích tăng dần theo từng hàm dựa trên Salsa giúp cải thiện độ phản hồi của IDE
- Nỗ lực hiện đại hóa tooling tiếp nối Ruff và uv của đội Astral
- Tự động nhận diện cấu trúc dự án, phát hiện
-
complexipy — công cụ đo độ phức tạp nhận thức (cognitive complexity) của mã
- Dựa trên nghiên cứu của SonarSource, lượng hóa các cấu trúc khó hiểu đối với con người
- Cài đặt bằng Rust giúp phân tích nhanh ngay cả với codebase lớn
- Hỗ trợ CLI, Python API, extension VS Code và tích hợp CI/CD
-
Kreuzberg — framework document intelligence đa ngôn ngữ
- Hỗ trợ hơn 50 định dạng tệp như PDF, Office, hình ảnh, HTML
- Cung cấp binding cho Python, TypeScript, Go và nhiều ngôn ngữ khác
- Có nhiều hình thức triển khai như CLI, REST API, Docker, máy chủ MCP
-
throttled-py — kiểm soát tốc độ request dựa trên 5 thuật toán (Fixed/Sliding Window, Token/Leaky Bucket, GCRA)
- Hỗ trợ lưu trữ bằng bộ nhớ hoặc Redis, tương thích cả mã đồng bộ và bất đồng bộ
- Cung cấp hiệu năng nhanh hơn 2,5~4,5 lần cùng cấu trúc cấu hình gọn gàng
-
httptap — phân tích và trực quan hóa thời gian chi tiết của request HTTP
- Đo lường theo từng giai đoạn như DNS, TCP, TLS, chờ máy chủ, truyền phản hồi
- Hỗ trợ waterfall view trong terminal, xuất JSON/metrics và theo dõi redirect
-
fastapi-guard — giải pháp middleware bảo mật tích hợp cho FastAPI
- Danh sách trắng/đen IP, giới hạn tốc độ, phát hiện XSS·SQLi, lọc theo địa lý
- Hỗ trợ môi trường phân tán qua tích hợp Redis, tự động thiết lập header OWASP
-
modshim — mở rộng thư viện hiện có theo cách overlay module
- Có thể thêm tính năng mà không cần sửa mã nguồn, là giải pháp thay thế monkey-patching
- Tạo module hợp nhất ảo bằng cách hook vào hệ thống import
-
Spec Kit — công cụ Spec-Driven Development của GitHub
- Chuyển đặc tả thành bản thiết kế có thể thực thi, để agent AI đảm nhiệm phần triển khai
- Tương thích với nhiều công cụ AI như Copilot, Claude Code
-
skylos — công cụ phát hiện mã chết và phân tích lỗ hổng bảo mật
- Phát hiện hàm, lớp, import không được sử dụng; kiểm tra các mẫu rủi ro như SQLi
- Cung cấp kết quả dựa trên điểm độ tin cậy (0–100), tích hợp VS Code và CI/CD
-
FastOpenAPI — tự động tạo tài liệu OpenAPI cho mọi web framework
- Hỗ trợ 8 framework gồm Flask, Django, Tornado
- Cung cấp routing bằng decorator kiểu FastAPI và kiểm định Pydantic v2
Top 10 thư viện AI/ML/Data
-
MCP Python SDK & FastMCP — hiện thực Model Context Protocol để kết nối LLM với dữ liệu bên ngoài
- SDK chính thức của Anthropic và FastMCP 2.0 của Prefect bổ trợ cho nhau
- Hỗ trợ OAuth 2.1, xác thực doanh nghiệp, tích hợp OpenAPI/FastAPI
-
TOON (Token-Oriented Object Notation) — định dạng thay thế JSON nén dành cho LLM
- Với cách thụt lề kiểu YAML và cấu trúc mảng kiểu CSV, giúp giảm 40~60% số token
- Hoàn toàn tương thích với JSON, đang được triển khai đa ngôn ngữ
-
Deep Agents — framework agent LLM cho tác vụ dài hạn dựa trên LangChain
- Tích hợp sẵn khả năng lập kế hoạch, truy cập hệ thống tệp, và ủy quyền cho sub-agent
- Hỗ trợ streaming và bộ nhớ bền vững qua tích hợp LangGraph
-
smolagents — framework agent thực thi mã nhẹ của Hugging Face
- Cấu trúc đơn giản chỉ khoảng 1.000 dòng, thực thi hành vi bằng mã Python
- Cung cấp môi trường chạy an toàn như E2B·Docker·WASM sandbox
-
LlamaIndex Workflows — framework workflow AI hướng sự kiện
- Cấu trúc bất đồng bộ gồm
@stepvàEvent, hỗ trợ thực thi song song - Có thể quản lý trạng thái và khôi phục checkpoint bằng đối tượng Context
- Cấu trúc bất đồng bộ gồm
-
Batchata — API xử lý batch hợp nhất cho OpenAI·Anthropic·Gemini
- Hỗ trợ giới hạn chi phí, retry, khôi phục sau gián đoạn, và structured output dựa trên Pydantic
-
MarkItDown — trình chuyển tài liệu sang Markdown của Microsoft
- Hỗ trợ nhiều định dạng như PDF, Word, PPT, Excel, hình ảnh, âm thanh
- Giữ cấu trúc thân thiện với LLM, tích hợp Azure Document Intelligence
-
Data Formulator — công cụ trực quan hóa dữ liệu dùng AI của Microsoft Research
- Kết hợp giao diện trực quan với ngôn ngữ tự nhiên, tự động tạo mã biến đổi dữ liệu
- Trực quan hóa dựa trên Vega-Lite, công khai minh bạch mã pandas/SQL
-
LangExtract — thư viện trích xuất cấu trúc văn bản chính xác của Google
- Ánh xạ vị trí ký tự của văn bản gốc để trực quan hóa căn cứ trích xuất
- Hỗ trợ nhiều mô hình như Gemini, OpenAI, Ollama, tối ưu xử lý song song
-
GeoAI — framework phân tích tích hợp AI-địa lý không gian của OpenGeos
- Tích hợp PyTorch·Transformers·Leafmap, hỗ trợ huấn luyện và trực quan hóa ảnh vệ tinh
- Đơn giản hóa các tác vụ phân tích địa lý chính như phân loại lớp phủ đất, phát hiện thay đổi
Một số ví dụ tiêu biểu trong Runners-up
- AuthTuna — framework xác thực và phân quyền cho Python bất đồng bộ
- FastRTC — biến hàm Python thành luồng âm thanh·video thời gian thực
- hexora — công cụ phân tích tĩnh để phát hiện mẫu mã độc
- opentemplate — template dự án bao gồm cấu hình phát triển·bảo mật·CI/CD hiện đại
- Pyrefly — trình kiểm tra kiểu hiệu năng cao viết bằng Rust của Meta
Khái quát về Long Tail
- Hàng trăm thư viện ngách được sắp xếp theo từng lĩnh vực
- Phân loại chi tiết theo agent AI, xử lý bất đồng bộ, data pipeline, phát triển web, kiểm thử...
- Cho thấy sự thử nghiệm rộng khắp và xu hướng chuyển giao thế hệ trong hệ sinh thái Python
Kết luận
- Hệ sinh thái Python năm 2025 nổi lên với các xu hướng chính gồm cải thiện hiệu năng bằng Rust, tích hợp LLM, tự động hóa bằng agent, và tăng cường bảo mật cùng khả năng bảo trì
- Danh sách của Tryolabs chứng minh rằng Python vẫn nằm tại giao điểm giữa đổi mới AI và phát triển đa dụng
1 bình luận
Có khá nhiều thư viện mình chưa biết, chắc phải lướt qua một lượt mới được.