Thoughtworks công bố Technology Radar, Volume 33

(thoughtworks.com)

15 điểm bởi GN⁺ 2025-11-07 | Chưa có bình luận nào. | Chia sẻ qua WhatsApp

Hình dung hóa và giải thích các xu hướng mới nhất trong các lĩnh vực kỹ thuật/công cụ/nền tảng/ngôn ngữ lập trình và framework theo 4 mức: Adopt (khuyến nghị áp dụng), Trial (dùng thử), Assess (đánh giá), Hold (thận trọng)
4 chủ đề chính: điều phối hạ tầng AI, sự trỗi dậy của agent dựa trên MCP, quy trình làm việc lập trình với AI, sự xuất hiện của các phản mẫu AI

Đưa điều phối hạ tầng vào AI

Khối lượng công việc AI đang buộc các tổ chức phải có điều phối đội GPU quy mô lớn cho huấn luyện và suy luận
- Khi ngày càng nhiều mô hình lớn vượt quá giới hạn dung lượng HBM (80GB) của một GPU đơn lẻ, huấn luyện phân tán và suy luận đa GPU trở thành yêu cầu thiết yếu
- Các nhóm nền tảng xây dựng các pipeline nhiều giai đoạn phức tạp và liên tục điều chỉnh thông lượng cũng như độ trễ
- Thực hiện telemetry từ xa cho cả đội bằng Nvidia DCGM Exporter, và dùng lập lịch nhận biết topo để đặt tác vụ vào vị trí có băng thông kết nối liên thông cao nhất
Kubernetes là nền tảng cốt lõi để quản lý khối lượng công việc AI ở quy mô lớn, nhưng các nền tảng thay thế như microVM(Firecracker), Uncloud cũng đang thu hút sự chú ý
- Các chiến lược phân bổ có xét tới liên lạc tốc độ cao giữa các liên kết GPU như quản lý hàng đợi và hạn ngạch qua Kueue, lập lịch nhận biết topo (topology-aware scheduling), gang scheduling đang tiếp tục phát triển
- Bố trí các tác vụ đa GPU trong những “đảo” trung tâm dữ liệu liền mạch (rack hoặc pod) có các liên kết GPU tốc độ cao như NVLink/NVSwitch và RDMA
Những cải tiến API gần đây của Kubernetes về đa GPU và nhận biết NUMA đang củng cố các năng lực này, giúp tăng băng thông giữa các thiết bị, giảm tail latency và nâng cao hiệu suất sử dụng
- Khi nhu cầu với quy trình làm việc lập trình bằng AI tăng lên và các agent được tăng cường bởi MCP nổi lên, hạ tầng AI được kỳ vọng sẽ đổi mới nhanh chóng
- Điều phối nhận biết GPU đang trở thành yêu cầu cơ bản, và topology hiện nổi lên như một yếu tố lập lịch hạng nhất

Sự trỗi dậy của agent dựa trên MCP

Sự trỗi dậy đồng thời của MCP và agent, cùng với sự mở rộng của hệ sinh thái giao thức và công cụ được xây quanh đó, là chủ đề chính của Radar lần này
- MCP đang định vị mình là giao thức tích hợp tối hậu để vận hành agent và giúp chúng hoạt động hiệu quả, bán tự trị
Gần như mọi nhà cung cấp lớn đều đang bổ sung hỗ trợ MCP, và quy trình làm việc lấy agent làm trung tâm đang tăng trưởng nhanh chóng
Đổi mới liên tục trong quy trình làm việc của agent đang được quan sát, và context engineering đang nổi lên là chìa khóa để tối ưu hóa hành vi mô hình và hiệu quả tài nguyên
- Các giao thức mới như A2A(Agent-to-Agent), AG-UI đang làm giảm độ phức tạp khi xây dựng ứng dụng cộng tác đa agent
- Các kỹ thuật như AGENTS.md, Anchoring coding agents, Context7 MCP server đang được áp dụng vào quy trình phát triển thực tế
Do đặc tính của hệ sinh thái AI, mỗi kỳ Radar đều chứng kiến các đổi mới mới bùng nổ
— lần trước là RAG, còn lần này là quy trình làm việc của agent và chòm công cụ, kỹ thuật, nền tảng hỗ trợ nó đang ngày càng mở rộng
- Và một số phản mẫu AI đáng chú ý cũng đã bắt đầu xuất hiện

Quy trình làm việc lập trình với AI

AI đang thay đổi cách xây dựng và bảo trì phần mềm, và là chủ đề chi phối trong các thảo luận gần đây
- Từ việc dùng AI để hiểu codebase legacy đến GenAI cho forward engineering, AI đang được tích hợp một cách chiến lược trên toàn bộ chuỗi giá trị phần mềm
- Các nhóm đang học cách cung cấp tri thức cho coding agent hiệu quả hơn
Các nhóm đang thử nghiệm những thực hành mới như định nghĩa chỉ dẫn tùy biến qua tệp AGENTS.md, tích hợp với các MCP server như Context7 để lấy tài liệu dependency mới nhất
- Nhận thức rằng AI không chỉ nên khuếch đại từng cá nhân đóng góp mà còn phải khuếch đại cả đội ngũ đang gia tăng
- Chỉ dẫn chia sẻ được tuyển chọn và lệnh tùy chỉnh đang xuất hiện để bảo đảm tri thức được lan tỏa công bằng
Môi trường công cụ đang phát triển sôi động:
- Nhà thiết kế dùng UX Pilot và AI Design Reviewer, còn nhà phát triển dùng v0 và Bolt để tạo mẫu nhanh thông qua self-service UI prototyping
- Tranh luận vẫn tiếp diễn quanh phạm vi, mức độ chi tiết và khả năng đóng vai trò nguồn chân lý duy nhất cho việc bàn giao dần dần của phát triển dựa trên đặc tả
- Dù đầy hứng khởi, sự chủ quan với mã do AI tạo ra vẫn là mối lo phổ biến, nhắc lại rằng AI có thể tăng tốc kỹ thuật nhưng phán đoán của con người vẫn hoàn toàn không thể thay thế

Sự xuất hiện của các phản mẫu AI mới

Việc tăng tốc áp dụng AI trên toàn ngành đang làm lộ diện cả các phản mẫu mới nổi bên cạnh các thực hành hiệu quả
- Dù thừa nhận tính hữu ích rõ ràng của các khái niệm như self-service UI prototyping dùng GenAI, người ta cũng nhận ra khả năng nó đẩy tổ chức vào phản mẫu Shadow IT được AI tăng tốc
- Khi MCP(Model Context Protocol) nhận được nhiều chú ý, nhiều nhóm rơi vào phản mẫu chuyển đổi ngây thơ từ API sang MCP
Hiệu quả của các giải pháp Text-to-SQL không đạt được kỳ vọng ban đầu, còn sự chủ quan với mã do AI tạo ra vẫn tiếp tục là một mối lo liên quan
- Ngay cả trong các thực hành mới nổi như phát triển dựa trên đặc tả, vẫn tồn tại nguy cơ quay lại các phản mẫu kỹ nghệ phần mềm truyền thống
  — đặc biệt là khuynh hướng đặc tả quá mức từ đầu và phát hành big-bang
GenAI đang phát triển với tốc độ và quy mô chưa từng có, nên các phản mẫu mới được dự đoán sẽ xuất hiện nhanh chóng
- Các nhóm cần duy trì cảnh giác với những mẫu hình ban đầu có vẻ hiệu quả nhưng theo thời gian lại làm suy giảm hiệu năng, làm chậm phản hồi, gây tổn hại khả năng thích ứng hoặc làm mờ trách nhiệm giải trình

ThoughtWorks Technology Radar Volume 33

[Techniques]

Adopt

1. Continuous compliance

Thực hành bảo đảm quy trình phát triển phần mềm và công nghệ liên tục đáp ứng các tiêu chuẩn quy định và bảo mật thông qua tự động hóa
Tích hợp các công cụ policy-as-code như Open Policy Agent, đồng thời tạo SBOM trong pipeline CD để phát hiện và xử lý vấn đề tuân thủ từ giai đoạn sớm theo hướng dẫn SLSA
Khi mã hóa các quy tắc và thông lệ tốt nhất thành code, có thể thực thi tiêu chuẩn nhất quán trên toàn đội mà không tạo nút thắt cổ chai
Khi rủi ro chủ quan với mã do AI tạo ra gia tăng, việc tích hợp tuân thủ vào quy trình phát triển trở nên quan trọng hơn bao giờ hết

2. Curated shared instructions for software teams

Với các nhóm sử dụng AI tích cực trong phân phối phần mềm, họ đang chuyển từ prompting cá nhân sang các chỉ dẫn được tuyển chọn
Cách triển khai trực quan nhất là commit trực tiếp các tệp chỉ dẫn như AGENTS.md vào repository của dự án
Hầu hết các công cụ lập trình AI như Cursor, Windsurf, Claude Code đều hỗ trợ chia sẻ chỉ dẫn thông qua lệnh slash tùy chỉnh hoặc workflow
Ngay khi prompt được cải thiện, cả đội sẽ cùng hưởng lợi, bảo đảm khả năng tiếp cận nhất quán với các chỉ dẫn AI tốt nhất

3. Pre-commit hooks

Git hooks đã tồn tại từ lâu nhưng vẫn chưa được tận dụng đầy đủ
Sự trỗi dậy của AI-assisted và agent coding làm tăng rủi ro commit nhầm bí mật hoặc mã có vấn đề
Dù có nhiều cơ chế kiểm chứng mã như continuous integration, hook pre-commit là một biện pháp an toàn đơn giản nhưng hiệu quả mà nhiều đội nên áp dụng hơn
Tốt nhất là giữ nó tối giản và tập trung vào các rủi ro được bắt hiệu quả nhất ở giai đoạn này của workflow, như quét bí mật

4. Dùng GenAI để hiểu codebase legacy

Việc dùng GenAI để hiểu codebase legacy giúp tăng tốc đáng kể quá trình nắm bắt các hệ thống phức tạp quy mô lớn
Các công cụ như Cursor, Claude Code, Copilot, Windsurf, Aider, Cody, Swimm, Unblocked, PocketFlow-Tutorial-Codebase-Knowledge hỗ trợ làm rõ các quy tắc nghiệp vụ, tóm tắt logic và xác định phụ thuộc
Khi dùng cùng các framework mở và prompt trực tiếp cho LLM, thời gian để hiểu codebase legacy được rút ngắn mạnh mẽ
Công sức thiết lập cho các cách tiếp cận nâng cao như GraphRAG thay đổi tùy theo quy mô và độ phức tạp của codebase được phân tích, nhưng tác động tới năng suất là nhất quán và đáng kể

Trial

5. AGENTS.md

Một định dạng chung để cung cấp hướng dẫn cho các AI coding agent làm việc trong dự án
Về bản chất đây là tệp README dành cho agent, không có trường bắt buộc hay định dạng nào ngoài Markdown
Dựa vào khả năng của các coding agent dựa trên LLM trong việc diễn giải các hướng dẫn do con người viết và có thể đọc được
Cách dùng phổ biến là bao gồm mẹo sử dụng công cụ trong môi trường lập trình, hướng dẫn kiểm thử và các thực hành ưu tiên cho việc quản lý commit

6. AI cho di chuyển mã

Di chuyển mã có nhiều hình thức, từ viết lại ngôn ngữ đến nâng cấp dependency hoặc framework, và thường đòi hỏi nhiều tháng làm thủ công
Các nhóm nâng cấp phiên bản .NET framework đang thử nghiệm dùng AI để rút ngắn quy trình
Trước đây thường dùng các công cụ refactor quyết định luận dựa trên luật như OpenRewrite, còn chỉ dùng AI thì tốn kém và dễ khiến hội thoại đi chệch hướng
Thay vì giao toàn bộ việc nâng cấp, quy trình được tách thành các bước nhỏ hơn và có thể kiểm chứng như phân tích lỗi biên dịch, tạo diff di chuyển và xác minh lặp lại bằng kiểm thử
Các trường hợp trong ngành như int32-to-int64 migration quy mô lớn của Google cũng phản ánh xu hướng tương tự

7. Delta Lake liquid clustering

Một kỹ thuật cho các bảng Delta Lake, đóng vai trò thay thế cho partitioning và Z-ordering
Trước đây, để tối ưu hiệu năng đọc của các bảng Delta, cần xác định partition và khóa Z-order tại thời điểm tạo bảng dựa trên các mẫu truy vấn dự kiến
liquid clustering sử dụng thuật toán dựa trên cây để phân cụm dữ liệu theo các khóa được chỉ định
Có thể thay đổi dần dần mà không cần ghi lại toàn bộ dữ liệu, từ đó mang lại tính linh hoạt cao hơn để hỗ trợ nhiều mẫu truy vấn khác nhau
Databricks Runtime for Delta Lake hỗ trợ liquid clustering tự động bằng cách phân tích khối lượng công việc truy vấn trước đó, xác định cột tối ưu và phân cụm dữ liệu tương ứng

8. Tự phục vụ tạo mẫu UI với GenAI

Các công cụ như Claude Code, Figma Make, Miro AI, v0 cho phép quản lý sản phẩm tạo trực tiếp các prototype tương tác có thể đem đi kiểm thử với người dùng từ prompt văn bản
Thay vì dựng wireframe thủ công, các nhóm có thể tạo ra các artifact HTML, CSS, JS có chức năng chỉ trong vài phút
Những prototype "dùng một lần" này đánh đổi độ trau chuốt để lấy tốc độ học hỏi, nên rất phù hợp cho xác thực ban đầu trong các design sprint
Độ trung thực cao hơn có thể dẫn đến việc tập trung sai vào chi tiết hoặc kỳ vọng không thực tế về công sức sản xuất, nên cần định khung rõ ràng và quản lý kỳ vọng

9. Đầu ra có cấu trúc từ LLM

Một thực hành ép LLM tạo phản hồi theo định dạng được xác định trước như JSON hoặc một lớp lập trình cụ thể
Đây là yếu tố thiết yếu để xây dựng các ứng dụng cấp production đáng tin cậy, bằng cách biến văn bản vốn thường khó đoán của LLM thành các hợp đồng dữ liệu có thể đọc bằng máy và mang tính quyết định
Có nhiều cách tiếp cận, từ định dạng dựa trên prompt đơn giản và model-native structured outputs đến các phương pháp constrained decoding mạnh hơn dùng công cụ như Outlines và Instructor
Đã được sử dụng thành công để trích xuất dữ liệu phức tạp, phi cấu trúc từ nhiều loại tài liệu khác nhau và chuyển nó thành JSON có cấu trúc cho logic nghiệp vụ phía sau

10. TCR (Test && Commit || Revert)

Một quy trình lập trình bắt nguồn từ phát triển hướng kiểm thử, thúc đẩy các bước rất nhỏ và liên tục thông qua một quy tắc đơn giản
Sau mỗi thay đổi, nếu kiểm thử thành công thì thay đổi được commit, nếu thất bại thì thay đổi bị hoàn tác
Việc triển khai khá đơn giản vì chỉ cần định nghĩa các script tự động hóa chu kỳ này trong codebase
Lần đầu được giới thiệu trong bài viết chính thức của Kent Beck, TCR củng cố các thực hành lập trình tích cực như YAGNI và KISS

Assess

11. Kiểm thử UI dùng AI

Ở Radar trước, kiểm thử UI dựa trên AI chủ yếu tập trung vào kiểm thử khám phá, và có nhắc rằng tính không quyết định của LLM có thể gây ra sự thiếu ổn định
Với sự nổi lên của MCP, các framework kiểm thử UI lớn như Playwright và Selenium đã đưa vào các máy chủ MCP riêng (playwright-mcp, mcp-selenium)
Nhờ cung cấp tự động hóa trình duyệt đáng tin cậy thông qua công nghệ native, các trợ lý lập trình có thể tạo các bài kiểm thử UI đáng tin cậy bằng Playwright hoặc Selenium
Họ rất hào hứng với các phát triển như Playwright Agents trong các bản phát hành Playwright mới nhất và kỳ vọng sẽ xuất hiện thêm hướng dẫn thực tiễn cùng kinh nghiệm triển khai thực tế

12. Neo các coding agent vào một ứng dụng tham chiếu

Trước đây đã đưa mẫu tailored service templates vào Radar, giúp các tổ chức áp dụng microservices khởi tạo dịch vụ mới và tích hợp liền mạch với hạ tầng hiện có
Theo thời gian, khi các dependency, framework và mẫu kiến trúc mới xuất hiện, độ lệch mã giữa các template này với các dịch vụ hiện hữu có xu hướng tăng lên
Trong kỷ nguyên coding agent, họ đang thử nghiệm anchoring coding agents to a reference application để duy trì thực tiễn tốt và sự nhất quán kiến trúc
Máy chủ Model Context Protocol (MCP) có thể phơi bày cả mã template tham chiếu lẫn commit diff để agent phát hiện độ lệch và đề xuất sửa chữa

13. Context engineering

Thiết kế và tối ưu hóa có hệ thống thông tin được cung cấp cho LLM trong quá trình suy luận để tạo ra đầu ra mong muốn một cách ổn định
Bao gồm việc cấu trúc, lựa chọn và sắp xếp thứ tự các yếu tố ngữ cảnh như prompt, dữ liệu được truy xuất, bộ nhớ, chỉ dẫn và tín hiệu môi trường
Khác với prompt engineering chỉ tập trung vào câu chữ của prompt, context engineering xem xét toàn bộ cấu hình ngữ cảnh
Ngày nay, kỹ sư sử dụng nhiều kỹ thuật riêng lẻ khác nhau có thể được nhóm thành ba lĩnh vực: Context setup, Context management for long-horizon tasks, Dynamic information retrieval

14. GenAI for forward engineering

Một kỹ thuật mới nổi để hiện đại hóa các hệ thống legacy thông qua phần mô tả codebase legacy do AI tạo ra
Giới thiệu một bước tường minh tập trung vào việc mã legacy làm gì (đặc tả), đồng thời cố ý che giấu cách nó hiện đang được triển khai
Có liên quan đến spec-driven development, nhưng được áp dụng đặc biệt cho hiện đại hóa legacy
Theo vòng lặp reverse-engineering → design/solutioning → forward-engineering, cả con người và AI agent đều có thể suy luận ở mức cao hơn trước khi commit vào triển khai

15. GraphQL as data access pattern for LLMs

Một cách tiếp cận mới nổi để tạo ra lớp truy cập dữ liệu đồng nhất, thân thiện với mô hình nhằm cải thiện context engineering
Có thể phơi bày dữ liệu có cấu trúc và có thể truy vấn mà không cấp quyền truy cập cơ sở dữ liệu trực tiếp cho mô hình
Khác với REST API, nơi mỗi trường hợp sử dụng có thể cần endpoint hoặc bộ lọc mới, GraphQL cho phép mô hình chỉ truy xuất dữ liệu cần thiết
Một schema GraphQL được định nghĩa tốt cung cấp metadata để LLM suy luận về các thực thể và quan hệ sẵn có

16. Knowledge flows over knowledge stocks

Họ thường nhận được câu hỏi về "làm thế nào để cải thiện cách chia sẻ thông tin giữa các nhóm"
Khái niệm knowledge flows and knowledge stocks, một góc nhìn vay mượn từ tư duy hệ thống, rất có giá trị
Khuyến khích nhìn tri thức của tổ chức như một hệ thống — stock đại diện cho tri thức tích lũy, còn flow là cách tri thức di chuyển và tiến hóa trong tổ chức
Tăng flow của tri thức bên ngoài vào tổ chức có xu hướng thúc đẩy đổi mới, và việc thiết lập communities of practice là một cách đã được kiểm chứng để cải thiện flow

17. LLM as a judge

Việc dùng LLM làm giám khảo để đánh giá đầu ra của các hệ thống khác, thường là bộ sinh dựa trên LLM, đang được chú ý nhờ tiềm năng cung cấp đánh giá có thể mở rộng và tự động trong AI tạo sinh
Blip này được chuyển từ Trial sang Assess để phản ánh những độ phức tạp và rủi ro mới được nhận diện
Việc đánh giá dễ bị ảnh hưởng bởi position bias, verbosity bias và độ vững thấp; vấn đề nghiêm trọng hơn là scaling contamination
Để xử lý các khiếm khuyết này, họ đang khám phá các kỹ thuật cải tiến như LLMs as a jury (dùng nhiều mô hình để đạt đồng thuận) hoặc suy luận chain-of-thought trong quá trình đánh giá

18. On-device information retrieval

Kỹ thuật cho phép tìm kiếm, nhận biết ngữ cảnh và retrieval-augmented generation (RAG) chạy hoàn toàn trên thiết bị của người dùng như di động, máy tính để bàn hoặc thiết bị biên
Ưu tiên quyền riêng tư và hiệu quả tính toán bằng cách kết hợp cơ sở dữ liệu cục bộ nhẹ với các mô hình được tối ưu cho suy luận on-device
Một triển khai đầy hứa hẹn là kết hợp sqlite-vec (phần mở rộng SQLite hỗ trợ tìm kiếm vector trong cơ sở dữ liệu nhúng) và EmbeddingGemma (mô hình embedding 300 triệu tham số dựa trên kiến trúc Gemma 3)
Được khuyến nghị đánh giá cho các ứng dụng ưu tiên local-first, chủ quyền dữ liệu, độ trễ thấp và các trường hợp sử dụng khác coi trọng quyền riêng tư

19. SAIF

SAIF (Secure AI Framework) là framework do Google phát triển nhằm cung cấp hướng dẫn thực tiễn cho việc quản lý rủi ro bảo mật AI
Framework này xử lý có hệ thống các mối đe dọa phổ biến như đầu độc dữ liệu và prompt injection thông qua bản đồ rủi ro rõ ràng, phân tích thành phần và chiến lược giảm thiểu thực tiễn
Sự tập trung vào các rủi ro đang tiến hóa khi xây dựng hệ thống agent đặc biệt kịp thời và có giá trị
Cung cấp một playbook ngắn gọn, có thể hành động để củng cố thực tiễn bảo mật cho việc sử dụng LLM và các ứng dụng chạy bằng AI

20. Service mesh without sidecar

Khi chi phí và độ phức tạp vận hành của service mesh dựa trên sidecar vẫn tiếp diễn, họ hào hứng với sự xuất hiện của các lựa chọn service mesh không sidecar như Istio ambient mode
Ambient mode giới thiệu một kiến trúc phân lớp tách biệt mối quan tâm giữa hai thành phần chính: proxy L4 theo từng node (ztunnel) và proxy L7 theo từng namespace (Waypoint proxy)
ztunnel đảm bảo lưu lượng L3 và L4 được truyền hiệu quả, an toàn; lấy chứng chỉ cho mọi danh tính trên node và xử lý chuyển hướng lưu lượng với các workload hỗ trợ ambient
Waypoints proxy là thành phần tùy chọn của ambient mode, cho phép các tính năng Istio phong phú hơn như quản lý lưu lượng, bảo mật và khả năng quan sát

21. Small language models

Qua nhiều kỳ Technology Radar, quan sát thấy sự phát triển ổn định của small language models (SLMs)
Sự quan tâm gia tăng đối với việc xây dựng các giải pháp agent kéo theo ngày càng nhiều bằng chứng cho thấy SLM có thể vận hành agent AI một cách hiệu quả
Phần lớn workflow agent hiện nay tập trung vào các tác vụ hẹp, lặp lại và không đòi hỏi suy luận nâng cao, nên rất phù hợp với SLM
Sự tiến bộ liên tục của các SLM như Phi-3, SmolLM2, DeepSeek mang lại đủ năng lực cho các tác vụ này

22. Phát triển dựa trên đặc tả

Một cách tiếp cận mới nổi đối với workflow lập trình có hỗ trợ AI, và cách định nghĩa thuật ngữ này vẫn đang tiếp tục được hoàn thiện
Nói chung dùng để chỉ workflow bắt đầu bằng một đặc tả tính năng có cấu trúc, sau đó qua nhiều bước được phân rã thành các phần nhỏ hơn, giải pháp và tác vụ
Kiro của Amazon hướng dẫn người dùng qua ba giai đoạn workflow: tạo yêu cầu, thiết kế và tác vụ
spec-kit của GitHub theo quy trình 3 bước tương tự, nhưng bổ sung điều phối phong phú hơn, prompt có thể cấu hình và một "constitution" xác định các nguyên tắc bất biến luôn phải được tuân theo

23. Nhóm các coding agent

Kỹ thuật trong đó nhà phát triển điều phối nhiều AI coding agent, mỗi agent đảm nhận một vai trò riêng như architect, chuyên gia back-end hoặc tester
Các công cụ như Claude Code, Roo Code, Kilo Code hỗ trợ subagent và nhiều chế độ vận hành
Dựa trên nguyên lý đã được chứng minh rằng việc gán vai trò và persona cụ thể cho LLM sẽ cải thiện chất lượng đầu ra, cách tiếp cận này đạt kết quả tốt hơn bằng cách phối hợp nhiều agent theo vai trò thay vì phụ thuộc vào một agent đa dụng duy nhất
Đánh dấu sự chuyển dịch sang các pipeline phát triển có hỗ trợ AI nhiều giai đoạn được điều phối

24. Lập lịch nhận biết topology

GPU và LPU không còn là các thiết bị độc lập, mà là những mạng accelerator liên kết chặt chẽ, nơi hiệu năng phụ thuộc vào cách bố trí và topology
Trong các hệ thống quy mô rack như NVL72 của NVIDIA, 72 GPU chia sẻ hơn 13TB VRAM và hoạt động như một accelerator duy nhất, nhưng khi workload đi qua các switch island thì các tác vụ tập hợp sẽ trở thành điểm nghẽn
Kiến trúc được lập lịch bằng phần mềm tại thời điểm biên dịch của Groq giả định việc di chuyển dữ liệu có tính quyết định, và lập lịch ngẫu nhiên sẽ phá vỡ các giả định cũng như tính dự đoán đó
Các scheduler ngây thơ bỏ qua topology thường phân tán workload multi-GPU một cách tùy tiện, làm tăng thời gian theo giai đoạn và giảm hiệu quả

25. Phân tích luồng độc hại cho AI

Trò đùa quen thuộc rằng chữ S trong MCP là viết tắt của "security" đang che giấu một vấn đề rất thực tế
Khi các agent giao tiếp với nhau qua tool call hoặc API call, chúng có thể nhanh chóng rơi vào cái gọi là lethal trifecta: truy cập dữ liệu cá nhân, tiếp xúc với nội dung không đáng tin cậy và khả năng giao tiếp ra bên ngoài
Một agent có đủ cả ba yếu tố này sẽ rất dễ bị tổn thương, và vì LLM có xu hướng làm theo chỉ dẫn trong đầu vào nên nội dung từ nguồn không đáng tin cậy chứa hướng dẫn rò rỉ dữ liệu có thể dễ dàng dẫn tới lộ dữ liệu
toxic flow analysis kiểm tra đồ thị luồng của hệ thống agent để xác định các đường đi dữ liệu có khả năng không an toàn nhằm phục vụ điều tra thêm

Hold

26. Shadow IT được AI tăng tốc

AI làm giảm rào cản để người không biết lập trình có thể tự xây dựng và tích hợp phần mềm thay vì chờ bộ phận IT
Dù hào hứng với tiềm năng mà điều này mở ra, vẫn cảnh giác với những dấu hiệu đầu tiên của AI-accelerated shadow IT
Các nền tảng tự động hóa workflow no-code hiện đã hỗ trợ tích hợp AI API, như OpenAI hoặc Anthropic, tạo ra sự cám dỗ dùng AI như băng keo để nối các tích hợp trước đây vốn không thể kết nối
Đồng thời, các coding assistant AI ngày càng mang tính agent hơn, cho phép người không biết lập trình nhưng được đào tạo cơ bản xây dựng các ứng dụng tiện ích nội bộ

27. Phát triển theo năng lực sẵn có

Trọng tâm vào luồng công việc là yếu tố then chốt tạo nên thành công của các thực hành phát triển phần mềm hiện đại
Các nhóm stream-aligned tập trung vào một luồng giá trị duy nhất, như hành trình người dùng hoặc sản phẩm, để cung cấp giá trị end-to-end một cách hiệu quả
Tuy nhiên, đang quan sát thấy một xu hướng đáng lo ngại hướng tới capacity-driven development, nơi các nhóm được tổ chức theo cách này sẽ đảm nhận tính năng của sản phẩm hoặc luồng khác khi họ còn dư năng lực
Trong ngắn hạn điều này có thể trông hiệu quả, nhưng đó là một tối ưu cục bộ phù hợp nhất để xử lý nhu cầu tăng đột biến, và nếu bị bình thường hóa sẽ làm tăng tải nhận thức cũng như nợ kỹ thuật

28. Sự tự mãn với mã do AI tạo ra

Khi AI coding assistant và agent thu hút sự chú ý, ngày càng có nhiều dữ liệu và nghiên cứu nhấn mạnh mối lo về complacency with AI-generated code
Có đủ bằng chứng cho thấy các công cụ này có thể tăng tốc phát triển, nhưng nghiên cứu cũng cho thấy chất lượng mã có thể suy giảm theo thời gian
Nghiên cứu 2024 research của GitClear cho thấy mã trùng lặp và code churn tăng nhiều hơn dự kiến, trong khi hoạt động refactoring trong lịch sử commit lại giảm
Nghiên cứu của Microsoft về lao động tri thức cho thấy sự tự tin do AI mang lại thường xuất hiện với cái giá là tư duy phản biện bị suy giảm

29. Chuyển đổi API sang MCP một cách ngây thơ

Các tổ chức rất mong muốn chuyển đổi API nội bộ sang Model Context Protocol (MCP) một cách liền mạch và trực tiếp để AI agent có thể tương tác với các hệ thống hiện có
Ngày càng có nhiều công cụ như MCP link và FastAPI-MCP nhằm hỗ trợ việc chuyển đổi này
Phản đối kiểu naive API-to-MCP conversion này, vì API thường được thiết kế cho nhà phát triển là con người và gồm các thao tác nguyên tử chi tiết, có thể dẫn đến tiêu tốn token quá mức, ô nhiễm ngữ cảnh và làm suy giảm hiệu năng agent khi AI phải xâu chuỗi chúng lại
Những API này cũng thường làm lộ dữ liệu nhạy cảm hoặc cho phép thực hiện các thao tác mang tính phá hủy, đặc biệt là với API nội bộ

30. Các nhóm data engineering độc lập

Việc tổ chức các nhóm data engineering riêng biệt để phát triển và sở hữu pipeline dữ liệu và sản phẩm, tách rời khỏi miền nghiệp vụ sắp xếp luồng mà họ phục vụ, là một phản mẫu dẫn đến kém hiệu quả và kết quả kinh doanh yếu
Cấu trúc này lặp lại những sai lầm trong quá khứ khi tách riêng chức năng DevOps, kiểm thử hoặc triển khai, tạo ra các silo kiến thức, điểm nghẽn và lãng phí công sức
Nếu không có sự cộng tác chặt chẽ, các data engineer thường thiếu bối cảnh nghiệp vụ và miền cần thiết để thiết kế các data product có ý nghĩa, từ đó hạn chế cả mức độ chấp nhận lẫn giá trị
Thay vào đó, các nhóm nền tảng dữ liệu nên tập trung vào việc duy trì hạ tầng dùng chung, còn các nhóm nghiệp vụ đa chức năng nên tự xây dựng và sở hữu data products của mình theo các nguyên tắc data mesh

31. Text to SQL

Text to SQL sử dụng LLM để chuyển ngôn ngữ tự nhiên thành SQL có thể thực thi, nhưng độ tin cậy thường không đạt kỳ vọng
Blip này đã được chuyển sang Hold để khuyến nghị không dùng trong các workflow không có giám sát — ví dụ như che giấu đầu ra hoặc chuyển đổi động các truy vấn do người dùng tạo trong hệ thống tự động hóa
Trong các trường hợp như vậy, LLM thường bị ảo giác do hiểu biết hạn chế về schema hoặc miền, dẫn đến nguy cơ truy xuất dữ liệu sai hoặc sửa đổi dữ liệu ngoài ý muốn
Đối với agentic business intelligence, nên tránh truy cập cơ sở dữ liệu trực tiếp và thay vào đó sử dụng lớp ngữ nghĩa trừu tượng hóa dữ liệu được quản lý như Cube hoặc dbt's semantic layer

[Platforms]

Adopt

32. Arm in the cloud

Các Arm compute instances trên đám mây ngày càng phổ biến trong những năm gần đây nhờ hiệu quả về chi phí và năng lượng so với các instance truyền thống dựa trên x86
Các nhà cung cấp đám mây lớn bao gồm AWS, Azure và GCP hiện đều cung cấp các tùy chọn Arm mạnh mẽ
Nhiều nhóm đã di chuyển thành công các workload như microservice, cơ sở dữ liệu mã nguồn mở, thậm chí cả điện toán hiệu năng cao sang Arm chỉ với thay đổi mã tối thiểu và một vài điều chỉnh nhỏ trong script build
Các công cụ hiện đại như multi-arch Docker images giúp đơn giản hóa việc build và triển khai trên cả môi trường Arm và x86

Trial

33. Apache Paimon

Apache Paimon là một định dạng data lake mã nguồn mở được thiết kế để hỗ trợ lakehouse architecture
Nó tích hợp liền mạch với các engine xử lý như Flink và Spark, hỗ trợ cả tác vụ streaming lẫn batch
Một ưu điểm kiến trúc chính của Paimon là sự kết hợp giữa định dạng data lake tiêu chuẩn và cấu trúc LSM (log-structured merge tree)
Sự kết hợp này giải quyết bài toán truyền thống của data lake là cập nhật hiệu năng cao và đọc với độ trễ thấp

34. DataDog LLM Observability

Datadog LLM Observability cung cấp khả năng theo dõi, giám sát và chẩn đoán end-to-end cho workflow của mô hình ngôn ngữ lớn và ứng dụng agent
Nó ánh xạ từng prompt, lệnh gọi công cụ và bước trung gian thành span và trace, theo dõi độ trễ, lượng token sử dụng, lỗi và các chỉ số chất lượng, đồng thời tích hợp với bộ sản phẩm APM và quan sát rộng hơn của Datadog
Các tổ chức đã dùng Datadog và quen với cấu trúc chi phí của nó có thể thấy các tính năng quan sát LLM là cách trực quan để có được khả năng quan sát cho workload AI, miễn là họ có thể instrument các workload đó
Việc cấu hình và sử dụng instrument cho LLM đòi hỏi sự cẩn trọng và hiểu biết chắc chắn về workload cũng như cách triển khai, đồng thời khuyến nghị sự phối hợp chặt chẽ giữa data engineer và nhân sự vận hành khi triển khai

35. Delta Sharing

Delta Sharing là một tiêu chuẩn mở và giao thức cho chia sẻ dữ liệu an toàn, đa nền tảng, do Databricks và Linux Foundation phát triển
Nó độc lập với nhà cung cấp đám mây, cho phép các tổ chức chia sẻ dữ liệu trực tiếp giữa các nhà cung cấp đám mây và các vị trí on-premises mà không cần sao chép hay nhân bản dữ liệu
Sử dụng REST API đơn giản, nó phát hành các URL ký trước ngắn hạn để bên nhận có thể truy xuất các bộ dữ liệu lớn bằng các công cụ như pandas, Spark hoặc Power BI
Nó hỗ trợ chia sẻ bảng dữ liệu, view, mô hình AI và notebook, đồng thời cung cấp quản trị tập trung và kiểm toán mạnh mẽ

36. Dovetail

Dovetail platform giải quyết thách thức kéo dài trong việc quản lý dữ liệu nghiên cứu định tính phân tán
Nó cung cấp một kho lưu trữ tập trung cho phỏng vấn người dùng, bản chép lời và insight, biến dữ liệu thô thành tài sản có cấu trúc và có thể phân tích
Nó đặc biệt hữu ích trong workflow khám phá sản phẩm nhờ tạo ra khả năng truy vết bằng chứng, liên kết trực tiếp các trích dẫn khách hàng và các chủ đề đã được tổng hợp với giả thuyết sản phẩm và ROI dự kiến
Nhờ đó, Dovetail củng cố vai trò của dữ liệu định tính trong các quyết định về sản phẩm

37. Langdock

Langdock là một nền tảng để các tổ chức phát triển và vận hành các agent AI tạo sinh và workflow cho hoạt động nội bộ
Nó cung cấp một môi trường tích hợp với trợ lý chat nội bộ, lớp API để kết nối nhiều LLM và các công cụ xây dựng workflow agent tích hợp với những hệ thống như Slack, Confluence và Google Drive
Nền tảng này cung cấp các tùy chọn triển khai on-premises và lưu trữ tại EU với các tiêu chuẩn tuân thủ cấp doanh nghiệp, nhấn mạnh chủ quyền dữ liệu
Các tổ chức triển khai Langdock vẫn cần đặc biệt chú ý đến quản trị dữ liệu và sử dụng các kỹ thuật như toxic flow analysis để ngăn chặn lethal trifecta

38. LangSmith

LangSmith là nền tảng được lưu trữ bởi đội ngũ LangChain, cung cấp khả năng quan sát, truy vết và đánh giá cho các ứng dụng LLM
Nó ghi lại các trace chi tiết của chain, công cụ và prompt để các nhóm có thể debug và đo lường hành vi mô hình, theo dõi suy giảm hiệu năng và quản lý các bộ dữ liệu đánh giá
LangSmith là một nền tảng SaaS độc quyền với hỗ trợ hạn chế cho các workflow không thuộc LangChain, nên hấp dẫn nhất với các nhóm đã đầu tư vào hệ sinh thái đó
Hỗ trợ tích hợp cho đánh giá prompt và thử nghiệm của LangSmith đặc biệt hoàn thiện hơn so với các lựa chọn thay thế mã nguồn mở như Langfuse

39. Model Context Protocol (MCP)

Model Context Protocol (MCP) là một tiêu chuẩn mở định nghĩa cách các ứng dụng và agent LLM tích hợp với các nguồn dữ liệu và công cụ bên ngoài
MCP được phân biệt với giao thức Agent2Agent (A2A), vốn quản lý giao tiếp giữa các agent, bằng việc tập trung vào ngữ cảnh và quyền truy cập công cụ
Kể từ blip trước, việc áp dụng MCP đã tăng vọt, với các công ty lớn như JetBrains (IntelliJ) và Apple tham gia hệ sinh thái cùng các framework mới nổi như FastMCP
Tiêu chuẩn MCP Registry ở trạng thái preview hiện đã hỗ trợ khám phá công cụ công khai và độc quyền

40. n8n

n8n là một nền tảng tự động hóa workflow theo giấy phép fair-code, tương tự Zapier hoặc Make (trước đây là Integromat), nhưng được xây dựng cho các nhà phát triển muốn có tùy chọn tự lưu trữ, mở rộng và kiểm soát bằng mã
Cung cấp cách tiếp cận trực quan, low-code để tạo workflow hơn là Apache Airflow, đồng thời vẫn hỗ trợ mã tùy chỉnh bằng JavaScript hoặc Python
Trường hợp sử dụng chính là tích hợp nhiều dịch vụ vào các workflow tự động, nhưng cũng có thể kết nối LLM với các nguồn dữ liệu, bộ nhớ và công cụ có thể cấu hình
Nhiều nhóm sử dụng n8n để tạo prototype nhanh cho workflow agent được kích hoạt qua ứng dụng chat hoặc webhook, thường tận dụng tính năng import và export để tạo workflow với sự hỗ trợ của AI

41. OpenThread

OpenThread là triển khai mã nguồn mở của giao thức mạng Thread do Google phát triển
Hỗ trợ mọi tính năng chính của đặc tả Thread, bao gồm các lớp mạng như IPv6, 6LoWPAN, LR-WPAN, cùng khả năng mạng mesh nơi thiết bị có thể hoạt động như node và border router
OpenThread chạy trên nhiều nền tảng phần cứng nhờ tận dụng lớp trừu tượng linh hoạt và các hook tích hợp cho phép nhà cung cấp tích hợp radio và chức năng mã hóa riêng
Giao thức đã trưởng thành này được sử dụng rộng rãi trong các sản phẩm thương mại và theo kinh nghiệm, đủ tin cậy để xây dựng nhiều giải pháp IoT khác nhau, từ thiết bị công suất thấp chạy pin đến các mạng cảm biến mesh quy mô lớn

Assess

42. AG-UI Protocol

AG-UI là một giao thức và thư viện mở được thiết kế để chuẩn hóa giao diện người dùng phong phú và giao tiếp giữa các agent
Tập trung vào các agent trực tiếp tương tác với người dùng, đồng thời khái quát hóa cho mọi frontend và backend bằng cách sử dụng tích hợp middleware và client
Giao thức định nghĩa một cách nhất quán để agent backend giao tiếp với ứng dụng frontend, cho phép cộng tác thời gian thực có lưu trạng thái giữa AI và người dùng
Hỗ trợ nhiều giao thức truyền tải, bao gồm SSE và WebSockets, đồng thời cung cấp các loại sự kiện được chuẩn hóa để biểu thị các trạng thái khác nhau của quá trình thực thi agent

43. Agent-to-Agent (A2A) Protocol

Agent2Agent (A2A) là một giao thức định nghĩa tiêu chuẩn cho giao tiếp và tương tác giữa các agent trong các workflow đa agent phức tạp
Sử dụng Agent Cards để mô tả các yếu tố cốt lõi của giao tiếp giữa các agent, bao gồm đặc tả về khám phá kỹ năng và truyền tải, cũng như các cơ chế bảo mật
A2A bổ sung cho Model Context Protocol (MCP) bằng cách tập trung vào giao tiếp giữa các agent mà không phơi bày các chi tiết nội bộ như trạng thái, bộ nhớ hay phần bên trong của agent
Giao thức thúc đẩy các thông lệ tốt như cách tiếp cận ưu tiên bất đồng bộ cho các tác vụ chạy dài, phản hồi streaming cho cập nhật tăng dần, và truyền tải an toàn bằng HTTPS, xác thực và phân quyền

44. Amazon S3 Vectors

Amazon S3 Vectors mở rộng kho lưu trữ đối tượng S3 với khả năng vector gốc, cung cấp chức năng lưu trữ vector tích hợp và tìm kiếm tương đồng
Tích hợp liền mạch với hệ sinh thái AWS, bao gồm Amazon Bedrock và OpenSearch, đồng thời cung cấp các tính năng bổ sung như lọc metadata và quản trị thông qua IAM
Dù vẫn ở trạng thái preview và còn có các giới hạn, đề xuất giá trị của nó rất hấp dẫn - cách tiếp cận lưu trữ vector tiết kiệm chi phí và dễ tiếp cận này có thể phù hợp cho nhiều ứng dụng liên quan đến khối lượng dữ liệu lớn, nơi độ trễ thấp không phải mối quan tâm chính

45. Ardoq

Ardoq là một nền tảng enterprise architecture (EA) cho phép tổ chức xây dựng, quản lý và mở rộng cơ sở tri thức kiến trúc để lập kế hoạch cho tương lai hiệu quả hơn
Không giống tài liệu tĩnh truyền thống dễ bị lệch và phân mảnh thành silo, cách tiếp cận dựa trên dữ liệu của Ardoq lấy thông tin từ các hệ thống hiện có để tạo đồ thị tri thức động luôn được cập nhật khi bối cảnh thay đổi
Một tính năng đặc biệt hữu ích là Ardoq Scenarios, cho phép mô hình hóa và định nghĩa trực quan các trạng thái tương lai kiểu what-if bằng cách sử dụng cách tiếp cận phân nhánh và hợp nhất tương tự Git
Các tổ chức đang theo đuổi chuyển đổi kiến trúc nên đánh giá những nền tảng EA chuyên dụng như Ardoq vì tiềm năng đơn giản hóa và tăng tốc quy trình này

46. CloudNativePG

CloudNativePG là một Kubernetes Operator giúp đơn giản hóa việc lưu trữ và quản lý các cụm PostgreSQL có tính sẵn sàng cao trên Kubernetes
Việc chạy các dịch vụ có trạng thái như PostgreSQL trên Kubernetes có thể phức tạp vì đòi hỏi kiến thức sâu cả về Kubernetes lẫn cơ chế sao chép của PostgreSQL
CloudNativePG trừu tượng hóa phần lớn sự phức tạp này bằng cách xem toàn bộ cụm PostgreSQL như một tài nguyên khai báo duy nhất có thể cấu hình
Cung cấp kiến trúc primary/standby liền mạch bằng sao chép streaming gốc, đồng thời mang lại ngay các tính năng tính sẵn sàng cao như tự phục hồi, failover tự động bằng cách nâng cấp bản sao đồng bộ nhất, và tự động tạo lại các bản sao bị lỗi

47. Coder

Coder là một nền tảng cung cấp nhanh các môi trường lập trình được chuẩn hóa theo thực hành development environments in the cloud đã được mô tả trước đó
So với các công cụ tương tự như Gitpod (nay được đổi thương hiệu thành Ona) và GitHub Codespaces, Coder cung cấp quyền kiểm soát lớn hơn trong việc tùy biến workstation thông qua Terraform
Lưu trữ workstation trên hạ tầng riêng của bạn trong cloud hoặc trung tâm dữ liệu, thay vì trên máy chủ của nhà cung cấp
Cách tiếp cận này mang lại sự linh hoạt lớn hơn, bao gồm khả năng chạy các AI coding agent và truy cập các hệ thống nội bộ của tổ chức

48. Graft

Graft là một transaction storage engine cho phép đồng bộ dữ liệu mạnh mẽ, nhất quán và hiệu quả trong các môi trường edge và phân tán
Sử dụng lazy replication để chỉ đồng bộ dữ liệu khi cần, partial replication để giảm thiểu tiêu thụ băng thông, và serializable snapshot isolation để đảm bảo tính toàn vẹn dữ liệu
Radar đã từng nhắc đến Electric cho các trường hợp sử dụng tương tự, nhưng Graft độc đáo ở chỗ biến object storage thành một hệ thống giao dịch hỗ trợ cập nhật nhất quán ở cấp trang mà không áp đặt định dạng dữ liệu
Phù hợp để vận hành các ứng dụng di động local-first, quản lý đồng bộ đa nền tảng phức tạp, và đóng vai trò xương sống cho các bản sao stateless trong hệ thống serverless hoặc nhúng

49. groundcover

groundcover là nền tảng quan sát cloud-native hợp nhất log, trace, metric và sự kiện Kubernetes trong một giao diện duy nhất
Tận dụng eBPF để thu thập dữ liệu quan sát chi tiết bằng zero-code instrumentation mà không cần chèn agent hay SDK vào mã ứng dụng
Cảm biến eBPF của groundcover chạy trên các node chuyên dụng của từng cluster được giám sát, hoạt động độc lập với ứng dụng đang được quan sát
Các tính năng chính gồm khả năng quan sát sâu ở cấp độ kernel, bring-your-own-cloud (BYOC) architecture cho quyền riêng tư dữ liệu, và mô hình định giá không phụ thuộc khối lượng dữ liệu để giữ chi phí ở mức có thể dự đoán

50. Karmada

Karmada (“Kubernetes Armada”) là nền tảng điều phối workload trên nhiều cluster Kubernetes, cloud và trung tâm dữ liệu
Hiện nay nhiều nhóm kết hợp công cụ GitOps như Flux hoặc ArgoCD với script tùy chỉnh để triển khai trên toàn bộ các cluster, vì vậy một giải pháp chuyên dụng là rất được hoan nghênh
Karmada tận dụng API native của Kubernetes nên không cần thay đổi các ứng dụng vốn đã được xây dựng cho môi trường cloud-native
Cung cấp các tính năng lập lịch nâng cao cho quản lý multi-cloud, tính sẵn sàng cao, khôi phục sau sự cố và điều phối lưu lượng

51. OpenFeature

Khi doanh nghiệp mở rộng, việc quản lý feature flag thường trở nên ngày càng phức tạp, và các nhóm cần một lớp trừu tượng vượt ra ngoài feature toggle đơn giản nhất
OpenFeature cung cấp lớp này thông qua đặc tả API độc lập với nhà cung cấp và do cộng đồng dẫn dắt, nhằm chuẩn hóa cách feature flag được định nghĩa và sử dụng
CLI cung cấp hỗ trợ rộng rãi cho nhiều định nghĩa schema, từ thiết lập cơ bản dùng biến môi trường hoặc cấu hình in-memory cho đến các nền tảng trưởng thành như ConfigCat hoặc LaunchDarkly
Tuy nhiên vẫn còn một lưu ý quan trọng: các nhóm phải quản lý riêng biệt và có kỷ luật các categories of flags khác nhau để tránh sự lan tràn của flag, độ phức tạp của ứng dụng và chi phí kiểm thử quá mức

52. Oxide

Việc xây dựng và vận hành hạ tầng riêng là rất phức tạp, và đó là một trong những lý do chính khiến cloud công cộng trở thành lựa chọn mặc định của phần lớn tổ chức
Tuy nhiên, với những ai cần điều đó, Oxide mang đến một phương án thay thế bằng cách lắp ráp và tích hợp phần cứng lẫn phần mềm ngay từ đầu
Cung cấp các rack dựng sẵn bao gồm năng lực tính toán, mạng và lưu trữ chạy phần mềm hệ thống tích hợp hoàn chỉnh
Các nhóm có thể quản lý tài nguyên qua API IaaS của Oxide bằng Terraform và các công cụ tự động hóa khác — điều mà Oxide gọi là hạ tầng đàn hồi on-premises

53. Restate

Restate là nền tảng thực thi bền vững được thiết kế để giải quyết các thách thức phức tạp của hệ thống phân tán khi xây dựng ứng dụng có trạng thái và chịu lỗi
Thông qua execution journaling, mọi bước đều được ghi lại để bảo đảm khả năng chịu lỗi, khôi phục đáng tin cậy và giao tiếp exactly-once giữa các dịch vụ
Ưu điểm kiến trúc chính của nền tảng là tách logic ứng dụng thành ba loại dịch vụ bền vững: Basic Services cho hàm không trạng thái, Virtual Objects để mô hình hóa các thực thể có trạng thái đồng thời, và Workflows để điều phối các quy trình phức tạp nhiều bước
Chúng tôi đang đánh giá Restate một cách thận trọng trong một hệ thống bảo hiểm quy mô lớn và đến nay rất hài lòng với hiệu năng

54. SkyPilot

SkyPilot là nền tảng mã nguồn mở để chạy và mở rộng AI workload on-premises hoặc trên cloud
Được phát triển bởi Sky Computing Lab của UC Berkeley, SkyPilot đóng vai trò như một broker thông minh, tự động tìm và cấp phát GPU rẻ nhất và sẵn có trên các cloud lớn và cluster Kubernetes, từ đó thường giúp giảm chi phí tính toán
Với các đội hạ tầng, nó đơn giản hóa việc chạy AI trên Kubernetes bằng cách cung cấp khả năng dễ sử dụng như Slurm, độ vững chắc cloud-native, truy cập SSH trực tiếp vào pod, cùng các tính năng như gang scheduling và hỗ trợ multi-cluster
Hỗ trợ mở rộng liền mạch cho workload huấn luyện hoặc suy luận

55. StarRocks

StarRocks là cơ sở dữ liệu phân tích đang tái định nghĩa business intelligence thời gian thực bằng cách kết hợp tốc độ của hệ thống OLAP truyền thống với tính linh hoạt của data lakehouse hiện đại
Đạt độ trễ truy vấn dưới một giây ở quy mô lớn nhờ engine thực thi tối ưu SIMD, kho lưu trữ cột và bộ tối ưu hóa dựa trên chi phí tinh vi
Kiến trúc hiệu năng cao này cho phép người dùng thực hiện các phân tích phức tạp trực tiếp trên các định dạng dữ liệu mở như Apache Iceberg mà không cần tính toán trước hay sao chép dữ liệu
Dù có nhiều nền tảng trong lĩnh vực này, chúng tôi xem StarRocks là ứng viên mạnh cho một giải pháp hiệu quả về chi phí, đáp ứng cả mức độ đồng thời cực cao lẫn độ mới dữ liệu ổn định

56. Uncloud

Uncloud là công cụ điều phối và clustering container gọn nhẹ, giúp nhà phát triển đưa các ứng dụng Docker Compose vào môi trường production
Cung cấp trải nghiệm đơn giản, giống cloud mà không có overhead vận hành của Kubernetes
Tự động thiết lập mạng mesh WireGuard an toàn cho giao tiếp và dùng reverse proxy Caddy để cung cấp HTTPS tự động cùng cân bằng tải, từ đó đạt được khả năng mở rộng đa máy và triển khai không gián đoạn
Ưu điểm kiến trúc chính của Uncloud là thiết kế hoàn toàn phân tán, loại bỏ nhu cầu về control plane trung tâm và bảo đảm hoạt động của cluster vẫn duy trì chức năng ngay cả khi từng máy riêng lẻ bị offline

[Tools]

Adopt

57. ClickHouse

ClickHouse là cơ sở dữ liệu OLAP (xử lý phân tích trực tuyến) dạng cột, phân tán và mã nguồn mở cho phân tích thời gian thực
Đã trưởng thành thành một engine có hiệu năng rất cao và khả năng mở rộng tốt để xử lý phân tích dữ liệu quy mô lớn
Materialized view gia tăng, engine truy vấn hiệu quả và khả năng nén dữ liệu mạnh mẽ khiến nó rất phù hợp cho các truy vấn tương tác
Hỗ trợ tích hợp cho các hàm tổng hợp xấp xỉ cho phép đánh đổi giữa độ chính xác và hiệu năng, đặc biệt hữu ích cho phân tích high-cardinality

58. NeMo Guardrails

NeMo Guardrails là bộ công cụ mã nguồn mở của NVIDIA giúp dễ dàng bổ sung các cơ chế an toàn và kiểm soát có thể lập trình cho ứng dụng hội thoại dựa trên LLM
Định nghĩa và thực thi các quy tắc hành vi để bảo đảm đầu ra an toàn, đúng chủ đề và tuân thủ quy định
Nhà phát triển sử dụng Colang, một ngôn ngữ chuyên dụng, để tạo luồng hội thoại linh hoạt, quản lý cuộc hội thoại và thực thi các lộ trình cùng quy trình vận hành được xác định trước
NeMo Guardrails cung cấp API ưu tiên bất đồng bộ để tối ưu hiệu năng và hỗ trợ các guardrail cho an toàn nội dung, bảo mật, cũng như điều phối đầu vào và đầu ra

59. pnpm

Kể từ Radar trước, chúng tôi tiếp tục nhận được phản hồi tích cực từ các nhóm về pnpm
pnpm là trình quản lý gói Node.js mang lại cải thiện hiệu năng đáng kể so với các lựa chọn thay thế, cả về tốc độ lẫn hiệu quả sử dụng dung lượng đĩa
Hỗ trợ tối ưu hóa tăng dần ở cấp tệp để cải thiện hiệu năng hơn nữa, bằng cách hard link các gói trùng lặp từ thư mục node_modules của nhiều dự án về một vị trí duy nhất trên đĩa
pnpm đã trở thành lựa chọn mặc định cho quản lý gói Node.js vì cung cấp vòng lặp phản hồi nhanh hơn nhiều với rất ít vấn đề tương thích

60. Pydantic

Pydantic là thư viện Python dùng các type hint tiêu chuẩn để định nghĩa mô hình dữ liệu và áp đặt schema dữ liệu tại thời gian chạy
Ban đầu, chú thích kiểu được thêm vào Python để phục vụ phân tích tĩnh, nhưng mức độ đa dạng ngày càng tăng của chúng đã dẫn tới phạm vi sử dụng rộng hơn, bao gồm cả kiểm tra hợp lệ lúc chạy
Được xây dựng trên lõi Rust tốc độ cao, mang lại khả năng kiểm tra dữ liệu, phân tích cú pháp và tuần tự hóa hiệu quả
Đã trở thành thành phần thiết yếu trong các ứng dụng LLM, thường được dùng cùng kỹ thuật structured output from LLMs để quản lý tính khó dự đoán của LLM

Trial

61. AI Design Reviewer

AI Design Reviewer là plugin Figma để thực hiện kiểm tra thiết kế hoặc đánh giá heuristic và thu thập phản hồi có thể hành động cho các thiết kế hiện có hoặc mới
Các đợt đánh giá bao quát phê bình UX, sự không nhất quán trong UI, khoảng trống về khả năng truy cập, chất lượng nội dung và các kịch bản edge case
Ngoài việc xác định vấn đề, công cụ còn đưa ra các khuyến nghị có nhận thức theo miền, giúp nhóm xây dựng vốn từ vựng thiết kế chung và lý do đằng sau các lựa chọn thiết kế
Nhóm đã sử dụng AI Design Reviewer để phân tích các thiết kế legacy — xác định những trải nghiệm tích cực cần giữ lại và những trải nghiệm tiêu cực cần xử lý, từ đó cung cấp thông tin cho mục tiêu UX của lần thiết kế lại

62. Barman

Barman (Backup and Recovery Manager) là công cụ mã nguồn mở để quản lý sao lưu và khôi phục sau thảm họa cho máy chủ PostgreSQL
Đơn giản hóa việc tạo bản sao lưu vật lý bằng nhiều phương pháp khác nhau, tổ chức chúng trong một catalog toàn diện, và hỗ trợ toàn bộ quy trình khôi phục sau thảm họa bằng cách phục hồi bản sao lưu lên máy chủ đang chạy với khả năng khôi phục theo thời điểm
Chúng tôi nhận thấy Barman mạnh mẽ và dễ sử dụng, đồng thời đặc biệt ấn tượng với tốc độ của các thao tác khôi phục theo thời điểm trong quá trình migration
Nó cũng rất hiệu quả cho sao lưu theo lịch, với khả năng xử lý các cấu hình lập lịch và lưu giữ phức tạp, pha trộn

63. Claude Code

Claude Code của Anthropic là công cụ lập trình AI dạng agent, cung cấp giao diện ngôn ngữ tự nhiên và mô hình thực thi agent để lập kế hoạch và triển khai các workflow phức tạp nhiều bước
Dù mới ra mắt chưa đầy một năm, nó đã được các nhà phát triển trong và ngoài Thoughtworks đón nhận rộng rãi và được đưa vào Trial
Các agent lập trình dựa trên console như Codex CLI của OpenAI, Gemini CLI của Google và OpenCode mã nguồn mở đã xuất hiện, còn các trợ lý tích hợp trong IDE như Cursor, Windsurf và GitHub Copilot nay cũng đã có chế độ agent
Chúng tôi thấy các nhóm sử dụng nó như một agent AI đa dụng không chỉ để viết và chỉnh sửa mã mà còn để quản lý đặc tả, user story, cấu hình, hạ tầng và tài liệu

64. Cleanlab

Trong mô hình AI lấy dữ liệu làm trung tâm, việc cải thiện chất lượng bộ dữ liệu thường mang lại mức tăng hiệu năng lớn hơn so với việc tinh chỉnh chính mô hình
Cleanlab là thư viện Python mã nguồn mở được thiết kế để giải quyết vấn đề này, tự động xác định các vấn đề dữ liệu phổ biến như gán nhãn sai, ngoại lệ và trùng lặp trong các bộ dữ liệu văn bản, hình ảnh, dạng bảng và âm thanh
Được xây dựng dựa trên các nguyên tắc của confident learning, Cleanlab tận dụng xác suất dự đoán của mô hình để ước lượng nhiễu nhãn và định lượng chất lượng dữ liệu
Cách tiếp cận độc lập với mô hình này cho phép nhà phát triển chẩn đoán và sửa lỗi trong bộ dữ liệu, sau đó huấn luyện lại mô hình để có độ vững chắc và độ chính xác tốt hơn

65. Context7

Context7 là máy chủ MCP nhằm giải quyết sự thiếu chính xác trong mã do AI tạo ra
Trong khi LLM phụ thuộc vào dữ liệu huấn luyện đã cũ, Context7 đảm bảo tạo ra mã chính xác, cập nhật và theo đúng phiên bản cho các thư viện và framework được dùng trong dự án
Nó lấy tài liệu mới nhất và các ví dụ mã hoạt động trực tiếp từ source repository của framework rồi đưa vào cửa sổ ngữ cảnh của LLM tại thời điểm prompting
Theo kinh nghiệm của chúng tôi, Context7 giúp giảm đáng kể hiện tượng hallucination trong mã và sự phụ thuộc vào dữ liệu huấn luyện lỗi thời

66. Data Contract CLI

Data Contract CLI là công cụ dòng lệnh mã nguồn mở được thiết kế để làm việc với đặc tả Data Contract
Nó cho phép tạo và chỉnh sửa data contract, và quan trọng hơn là có thể kiểm tra dữ liệu so với contract, điều thiết yếu để bảo đảm tính toàn vẹn và chất lượng của data product
CLI cung cấp hỗ trợ rộng rãi cho nhiều định nghĩa schema khác nhau (Avro, SQL DDL, Open Data Contract Standard, v.v.) và có thể so sánh các phiên bản contract khác nhau để phát hiện ngay các thay đổi gây breaking
Chúng tôi nhận thấy nó đặc biệt hữu ích trong không gian data mesh để vận hành hóa quản trị contract giữa các data product thông qua tích hợp CI/CD

67. Databricks Assistant

Databricks Assistant là công cụ hội thoại dùng AI được tích hợp trực tiếp vào nền tảng Databricks, đóng vai trò như một pair programmer theo ngữ cảnh cho các chuyên gia dữ liệu
Không giống các trợ lý lập trình đa dụng, nó có lợi thế từ sự hiểu biết sẵn có về môi trường Databricks và ngữ cảnh dữ liệu, bao gồm cả metadata trong Unity Catalog
Assistant vượt xa việc tạo snippet mã, có thể viết các truy vấn SQL và Python phức tạp nhiều bước, chẩn đoán lỗi và cung cấp giải thích chi tiết theo từng workspace
Với các tổ chức đã đầu tư vào hệ sinh thái Databricks, nó có thể thúc đẩy năng suất và hạ thấp rào cản tiếp cận các tác vụ dữ liệu phức tạp

68. Hoppscotch

Hoppscotch là công cụ mã nguồn mở gọn nhẹ cho phát triển, gỡ lỗi, kiểm thử và chia sẻ API
Hỗ trợ nhiều giao thức bao gồm HTTP, GraphQL và WebSocket, đồng thời cung cấp client đa nền tảng cho môi trường web, desktop và CLI
Dù không gian công cụ API đã chật chội với các lựa chọn thay thế như Postman, Insomnia và Bruno, Hoppscotch vẫn nổi bật nhờ footprint nhẹ và thiết kế thân thiện với quyền riêng tư
Bỏ qua phân tích, sử dụng lưu trữ local-first và hỗ trợ tự lưu trữ, đây là lựa chọn mạnh mẽ cho các tổ chức đang tìm kiếm cách trực quan để chia sẻ script API mà vẫn duy trì quyền riêng tư dữ liệu mạnh mẽ

69. NVIDIA DCGM Exporter

NVIDIA DCGM Exporter là công cụ mã nguồn mở giúp các nhóm giám sát huấn luyện GPU phân tán ở quy mô lớn
Nó chuyển đổi telemetry độc quyền từ NVIDIA Data Center GPU Manager (DCGM) sang định dạng mở tương thích với các hệ thống giám sát tiêu chuẩn
Công cụ này hiển thị các chỉ số thời gian thực quan trọng từ cả GPU và máy chủ host, như mức sử dụng GPU, nhiệt độ, điện năng và số lượng lỗi ECC
Mức độ quan sát này là thiết yếu với các tổ chức đang fine-tune LLM tùy chỉnh hoặc vận hành các tác vụ huấn luyện dài hạn, tiêu tốn nhiều GPU

70. RelationalAI

Khi lượng lớn dữ liệu đa dạng được đưa vào Snowflake, các mối quan hệ riêng biệt và các quy tắc ngầm trong dữ liệu đó có thể trở nên mơ hồ
RelationalAI, được xây dựng như một Snowflake Native App, cho phép các nhóm xây dựng những mô hình tinh vi để nắm bắt các khái niệm có ý nghĩa, định nghĩa các thực thể kinh doanh cốt lõi và nhúng trực tiếp logic phức tạp vào các bảng Snowflake
Thông qua Graph Reasoner mạnh mẽ, người dùng có thể tạo, phân tích và trực quan hóa các knowledge graph quan hệ dựa trên những mô hình này
Đối với các tổ chức quản lý những bộ dữ liệu lớn thay đổi nhanh, việc xây dựng knowledge graph có thể là yếu tố thiết yếu để giám sát chủ động và tạo ra những insight phong phú hơn, có thể hành động được

71. UX Pilot

UX Pilot là công cụ AI hỗ trợ nhiều giai đoạn trong quy trình thiết kế UX, từ wireframing đến thiết kế hình ảnh độ trung thực cao và review
Có thể nhận đầu vào dạng văn bản hoặc hình ảnh và tự động tạo màn hình, flow và bố cục
Tính năng Autoflow tạo các chuyển tiếp user flow và Deep Design tạo đầu ra phong phú, chi tiết hơn
UX Pilot cũng bao gồm plugin Figma để xuất các thiết kế đã tạo ra nhằm tinh chỉnh trong các công cụ thiết kế tiêu chuẩn

72. v0

v0 đã tiếp tục phát triển kể từ lần gần nhất được giới thiệu trong Radar
Hiện nay đã có design mode giúp product manager dễ dàng tự phục vụ trong việc tạo và điều chỉnh UI prototype hơn
Bản phát hành mới nhất giới thiệu model riêng với cửa sổ ngữ cảnh lớn và khả năng multimodal, cho phép v0 tạo và cải thiện UI từ cả đầu vào văn bản lẫn hình ảnh
Một bổ sung đáng chú ý khác là agent mode, nơi hệ thống có thể phân rã các tác vụ phức tạp hơn và chọn model phù hợp cho từng tác vụ

Assess

73. Augment Code

Augment Code là trợ lý lập trình AI cung cấp hỗ trợ nhận biết ngữ cảnh sâu cho các codebase quy mô lớn
Nổi bật nhờ context engineering tiên tiến, cho phép cập nhật chỉ mục mã nhanh và truy xuất nhanh ngay cả khi mã thay đổi thường xuyên
Augment hỗ trợ các model như Claude Sonnet 4 và 4.5 cùng GPT-5, tích hợp với GitHub, Jira, Confluence và hỗ trợ Model Context Protocol (MCP) để tương tác với các công cụ bên ngoài
Cung cấp hướng dẫn từng bước cho các thay đổi codebase phức tạp, từ refactor và nâng cấp dependency đến cập nhật schema

74. Azure AI Document Intelligence

Azure AI Document Intelligence (trước đây là Form Recognizer) trích xuất văn bản, bảng và các cặp key-value từ tài liệu phi cấu trúc để chuyển đổi thành dữ liệu có cấu trúc
Sử dụng các model deep learning được huấn luyện sẵn để diễn giải bố cục và ngữ nghĩa, đồng thời có thể huấn luyện model tùy chỉnh cho các định dạng chuyên biệt thông qua giao diện no-code
Một trong các nhóm đã báo cáo rằng ADI giúp giảm đáng kể việc nhập liệu thủ công, cải thiện độ chính xác dữ liệu và tăng tốc báo cáo, từ đó dẫn tới việc ra quyết định dựa trên dữ liệu nhanh hơn
Tương tự Amazon Textract và Google Document AI, công cụ này cung cấp xử lý tài liệu cấp doanh nghiệp với khả năng hiểu bố cục mạnh mẽ

75. Docling

Docling là thư viện Python và TypeScript mã nguồn mở cho xử lý tài liệu nâng cao đối với dữ liệu phi cấu trúc
Giải quyết vấn đề "last mile" thường bị bỏ qua khi chuyển đổi các tài liệu thực tế như PDF và PowerPoint sang định dạng sạch, máy có thể đọc được
Không giống các công cụ trích xuất truyền thống, Docling sử dụng cách tiếp cận dựa trên computer vision để diễn giải bố cục tài liệu và cấu trúc ngữ nghĩa, khiến đầu ra đặc biệt có giá trị cho các pipeline retrieval-augmented generation (RAG)
Chuyển đổi các tài liệu phức tạp sang các định dạng có cấu trúc như JSON hoặc Markdown để hỗ trợ các kỹ thuật như structured output from LLMs

76. E2B

E2B là công cụ mã nguồn mở để chạy mã do AI tạo ra trong các sandbox an toàn, cô lập trên đám mây
Các agent có thể sử dụng những sandbox này, được xây dựng trên microVM Firecracker, để chạy mã an toàn, phân tích dữ liệu, thực hiện nghiên cứu hoặc vận hành máy ảo
Nhờ đó có thể xây dựng và triển khai các AI agent cấp doanh nghiệp với toàn quyền kiểm soát môi trường thực thi và bảo mật

77. Helix editor

Gần đây đã có một sự hồi sinh nhất định của các trình soạn thảo văn bản đơn giản nhằm thay thế công cụ dòng lệnh được ưa chuộng là Vim
Helix là một trong những đối thủ trong không gian đông đúc này, cùng với Neovim và gần đây là Kakoune
Tự mô tả mình khá dí dỏm là một trình soạn thảo văn bản hậu hiện đại, Helix có nhiều con trỏ, hỗ trợ Tree-sitter và hỗ trợ tích hợp Language Server Protocol (LSP), chính điều này đã thu hút sự chú ý của chúng tôi ban đầu
Đang được phát triển tích cực với hệ thống plugin đang trong tiến trình hoàn thiện, đây nhìn chung là một trình soạn thảo modal nhẹ, quen thuộc với người dùng Vim nhưng bổ sung thêm một số tiện ích hiện đại

78. Kueue

Kueue là controller gốc Kubernetes dành cho hàng đợi job để quản lý quota và mức tiêu thụ tài nguyên
Cung cấp API để xử lý các workload Kubernetes với nhiều mức ưu tiên và yêu cầu tài nguyên khác nhau, đồng thời hoạt động như một bộ quản lý ở cấp job để quyết định khi nào nên chấp nhận hoặc loại bỏ job
Được thiết kế cho quản lý tài nguyên hiệu quả, ưu tiên job và lập lịch nâng cao, Kueue giúp tối ưu hóa việc thực thi workload trong môi trường Kubernetes, đặc biệt là các workload ML dùng các công cụ như Kubeflow
Thay vì thay thế cluster-autoscaler và kube-scheduler, công cụ này hoạt động cùng chúng và tập trung vào việc chấp nhận job dựa trên thứ tự, quota, ưu tiên và nhận biết topology

79. MCPScan.ai

MCPScan.ai là trình quét bảo mật cho máy chủ Model Context Protocol (MCP), hoạt động ở hai chế độ: scan và proxy
Ở chế độ scan, công cụ phân tích cấu hình và mô tả công cụ để phát hiện các lỗ hổng đã biết như prompt injection, tool poisoning và toxic flows
Ở chế độ proxy, MCPScan.ai đóng vai trò cầu nối giữa hệ thống agent và máy chủ MCP, đồng thời liên tục giám sát lưu lượng runtime
Chế độ này cũng thực thi các quy tắc bảo mật và guardrail tùy chỉnh, bao gồm xác thực lệnh gọi công cụ, phát hiện PII và các ràng buộc luồng dữ liệu

80. oRPC

oRPC (OpenAPI Remote Procedure Call) cung cấp API end-to-end type-safe trong TypeScript đồng thời tuân thủ đầy đủ đặc tả OpenAPI
Có thể tự động tạo đặc tả OpenAPI hoàn chỉnh, giúp đơn giản hóa việc tích hợp và tài liệu hóa
Trong khi các lựa chọn thay thế như tRPC và ElysiaJS thường đòi hỏi phải áp dụng framework mới để có được tính an toàn kiểu, oRPC tích hợp liền mạch với các framework Node.js hiện có, bao gồm Express, Fastify, Hono, Next.js
Sự linh hoạt này khiến nó trở thành lựa chọn tuyệt vời cho các nhóm muốn áp dụng tính an toàn kiểu end-to-end cho API hiện có mà không cần refactor mang tính phá vỡ

81. Power user for dbt

Power user for dbt là tiện ích mở rộng cho Visual Studio Code, tích hợp trực tiếp với cả môi trường dbt và dbt Cloud
Vì dbt vẫn là một trong những công cụ chúng tôi yêu thích, bất kỳ thứ gì cải thiện khả năng sử dụng của nó đều là phần bổ sung đáng hoan nghênh cho hệ sinh thái
Trước đây, các nhà phát triển phải dựa vào nhiều công cụ bên ngoài IDE để xác thực mã SQL hoặc kiểm tra lineage của mô hình
Với tiện ích mở rộng này, các chức năng đó nay đã được tích hợp vào VS Code, cung cấp tự động hoàn thành mã, kết quả truy vấn theo thời gian thực, cũng như lineage trực quan của mô hình và cột

82. Serena

Serena là bộ công cụ lập trình mạnh mẽ, cung cấp cho các coding agent như Claude Code các khả năng kiểu IDE để tìm kiếm và chỉnh sửa mã theo ngữ nghĩa
Bằng cách hoạt động ở cấp độ symbol và hiểu cấu trúc quan hệ của mã, Serena cải thiện đáng kể hiệu quả token
Thay vì đọc toàn bộ tệp hoặc dựa vào thay thế chuỗi thô sơ, coding agent có thể dùng các công cụ Serena chính xác như find_symbol, find_referencing_symbols, insert_after_symbol để tìm và chỉnh sửa mã
Trong các dự án nhỏ, tác động có thể không đáng kể, nhưng khi codebase lớn dần, hiệu quả này trở nên rất giá trị

83. SweetPad

Tiện ích mở rộng SweetPad cho phép nhà phát triển sử dụng VS Code hoặc Cursor cho toàn bộ vòng đời phát triển ứng dụng Swift trên các nền tảng Apple
Tích hợp các công cụ thiết yếu như xcodebuild, xcode-build-server, swift-format, giúp loại bỏ nhu cầu phải liên tục chuyển sang Xcode
Nhà phát triển có thể build, chạy và debug ứng dụng Swift cho iOS, macOS, watchOS trực tiếp trong IDE mà không cần mở Xcode, đồng thời quản lý simulator và triển khai lên thiết bị

84. Tape/Z (Tools for Assembly Program Exploration for Z/OS)

Tape/Z (Tools for Assembly Program Exploration for Z/OS) là bộ công cụ đang phát triển để phân tích mã HLASM (High-Level Assembler) trên mainframe
Được Thoughtworker phát triển, công cụ này cung cấp các tính năng như parsing, xây dựng đồ thị luồng điều khiển, theo dõi phụ thuộc và trực quan hóa lưu đồ
Chúng tôi từ lâu đã nhắc đến sự khan hiếm của các công cụ mở và do cộng đồng dẫn dắt trong không gian mainframe, khi phần lớn lựa chọn đều là độc quyền hoặc gắn với hệ sinh thái của nhà cung cấp
Tape/Z giúp lấp đầy khoảng trống đó bằng cách cung cấp khả năng phân tích dễ tiếp cận và có thể script hóa

[Languages and Frameworks]

Adopt

85. Fastify

Chúng tôi tiếp tục có trải nghiệm tích cực với Fastify - một web framework nhanh, không áp đặt quan điểm và có overhead thấp cho Node.js
Nó cung cấp mọi chức năng thiết yếu của một web framework tối giản, bao gồm parsing, validation và serialization, cùng hệ thống plugin vững chắc và sự hỗ trợ mạnh từ cộng đồng
Các nhóm không nhận thấy nhược điểm đáng kể nào khi dùng Fastify so với các lựa chọn như Express.js, đồng thời cũng đạt được cải thiện hiệu năng có thể đo lường, khiến nó trở thành lựa chọn hấp dẫn cho phát triển web tối giản trên Node.js

86. LangGraph

LangGraph là framework orchestration để xây dựng ứng dụng đa tác tử có trạng thái với LLM
Nó cung cấp các primitive cấp thấp như node và edge, cùng các tính năng tích hợp sẵn mang lại cho nhà phát triển quyền kiểm soát chi tiết đối với workflow của agent, quản lý bộ nhớ và khả năng lưu bền trạng thái
Điều này có nghĩa là nhà phát triển có thể bắt đầu với các đồ thị dựng sẵn đơn giản rồi mở rộng thành các kiến trúc agent phức tạp và tiếp tục tiến hóa
Với hỗ trợ cho các mẫu tăng cường độ bền vững như streaming, quản lý ngữ cảnh nâng cao, model fallback và xử lý lỗi công cụ, LangGraph cho phép xây dựng các ứng dụng agent mạnh mẽ ở cấp độ production

87. vLLM

vLLM là inference engine có thông lượng cao, tối ưu bộ nhớ cho LLM, có thể chạy trên cloud hoặc on-premises
Nó hỗ trợ nhiều kiến trúc mô hình và các mô hình mã nguồn mở phổ biến
Các nhóm đã triển khai dockerized vLLM worker trên các nền tảng GPU như NVIDIA DGX và Intel HPC để host các mô hình gồm Llama 3.1 (8B và 70B), Mistral 7B, Llama-SQL phục vụ hỗ trợ lập trình cho nhà phát triển, truy xuất tri thức và tương tác cơ sở dữ liệu bằng ngôn ngữ tự nhiên
vLLM tương thích với chuẩn OpenAI SDK, cho phép model serving nhất quán

Trial

88. Crossplane

Kể từ lần xuất hiện gần nhất trên Radar, việc áp dụng Crossplane tiếp tục tăng, đặc biệt trong mở rộng cụm Kubernetes
Trong quá trình làm việc, chúng tôi nhận thấy Crossplane nổi trội ở một số trường hợp sử dụng cụ thể hơn là như một công cụ cơ sở hạ tầng dưới dạng mã (IaC) đa dụng
Quan sát trước đây vẫn còn đúng: Crossplane hoạt động tốt nhất như một thành phần đi kèm với workload được triển khai trong Kubernetes, chứ không phải là sự thay thế hoàn toàn cho các công cụ như Terraform
Các nhóm "all-in" với Crossplane như giải pháp IaC chính thường gặp khó khăn, nhưng những nhóm sử dụng nó một cách thực dụng - cho các trường hợp sử dụng tùy chỉnh có mục tiêu - lại đạt được kết quả mạnh mẽ

89. DeepEval

DeepEval là framework đánh giá mã nguồn mở dựa trên Python dành cho việc đánh giá hiệu năng LLM
Có thể dùng để đánh giá retrieval-augmented generation (RAG) và các ứng dụng khác được xây dựng bằng LlamaIndex hoặc LangChain, cũng như cho baseline và benchmark mô hình
DeepEval đánh giá độ chính xác, mức độ liên quan và tính nhất quán để cung cấp đánh giá đáng tin cậy hơn trong các kịch bản thực tế, vượt ra ngoài điểm số khớp từ đơn thuần
Bao gồm các metric như phát hiện hallucination, mức độ liên quan của câu trả lời, tối ưu hóa siêu tham số và hỗ trợ GEval để tạo metric tùy chỉnh theo từng trường hợp sử dụng

90. FastMCP

Model Context Protocol (MCP) đang nhanh chóng trở thành một tiêu chuẩn để cung cấp ngữ cảnh và công cụ cho các ứng dụng LLM
Tuy nhiên, việc triển khai máy chủ MCP thường bao gồm khá nhiều mã boilerplate cho cấu hình, xử lý giao thức và quản lý lỗi
FastMCP là một framework Python giúp đơn giản hóa quy trình này bằng cách trừu tượng hóa độ phức tạp của giao thức và cho phép nhà phát triển định nghĩa tài nguyên và công cụ MCP thông qua các decorator Python trực quan
Nhờ lớp trừu tượng này, các nhóm có thể tập trung vào logic nghiệp vụ, từ đó tạo ra các triển khai MCP gọn gàng hơn và dễ bảo trì hơn

91. LiteLLM

LiteLLM là một SDK cung cấp khả năng tích hợp liền mạch với nhiều nhà cung cấp LLM thông qua định dạng API OpenAI đã được chuẩn hóa
Hỗ trợ nhiều nhà cung cấp và mô hình, cung cấp giao diện thống nhất cho text completion, embedding và tạo ảnh
Bằng cách trừu tượng hóa sự khác biệt API giữa các nhà cung cấp, LiteLLM đơn giản hóa việc tích hợp và tự động định tuyến yêu cầu tới đúng endpoint mô hình
Thông qua framework proxy, nó cũng bao gồm các tính năng cấp production như guardrail, caching, logging, giới hạn tốc độ và cân bằng tải

92. MLForecast

MLForecast là một framework và thư viện Python cho dự báo chuỗi thời gian, áp dụng các mô hình machine learning vào các tập dữ liệu quy mô lớn
Nó đơn giản hóa quy trình feature engineering tự động vốn thường phức tạp, bao gồm lag, rolling statistics và các đặc trưng dựa trên ngày tháng
Đây là một trong số ít thư viện có hỗ trợ native cho các framework tính toán phân tán như Spark và Dask, bảo đảm khả năng mở rộng
Nó cũng hỗ trợ dự báo xác suất bằng các phương pháp như conformal prediction, cung cấp thước đo định lượng về độ bất định của dự báo

93. Nuxt

Nuxt là một meta framework có định hướng rõ ràng được xây dựng trên Vue.js để tạo ứng dụng web full-stack, thường được gọi là “Next.js cho Vue.js”
Tương tự đối trọng bên React, Nuxt cung cấp các tính năng thân thiện với SEO như pre-rendering, server-side rendering (SSR) và quản lý metadata
Nuxt được hậu thuẫn bởi Vercel, cũng là công ty đứng sau Next.js, đồng thời được hỗ trợ bởi một cộng đồng mạnh và hệ sinh thái module chính thức lẫn bên thứ ba
Các module này giúp đơn giản hóa việc tích hợp các tính năng như xử lý ảnh, sitemap và Tailwind CSS

94. Phoenix

Chúng tôi tiếp tục có trải nghiệm tích cực với Phoenix — một framework web MVC phía máy chủ được viết bằng Elixir
Phoenix kế thừa tinh thần phát triển ứng dụng nhanh và trải nghiệm lập trình viên của Ruby on Rails, đồng thời phát triển theo mô hình lập trình hàm
Trong số này, bản phát hành Phoenix LiveView 1.0 được đặc biệt nhấn mạnh
LiveView là một giải pháp HTML-over-the-wire tương tự HTMX hoặc Hotwire, cho phép nhà phát triển xây dựng trải nghiệm người dùng phong phú và thời gian thực hoàn toàn bằng HTML được render phía máy chủ

95. Presidio

Presidio là một SDK bảo vệ dữ liệu để xác định và ẩn danh hóa dữ liệu nhạy cảm trong văn bản có cấu trúc và phi cấu trúc
Nó phát hiện thông tin nhận dạng cá nhân (PII) như số thẻ tín dụng, tên và vị trí bằng cách sử dụng named entity recognition, biểu thức chính quy và logic dựa trên luật
Presidio hỗ trợ các bộ nhận diện thực thể tùy chỉnh và pipeline ẩn danh hóa, cho phép các tổ chức điều chỉnh theo yêu cầu riêng về quyền riêng tư và tuân thủ
Các nhóm sử dụng Presidio trong môi trường doanh nghiệp có kiểm soát chặt chẽ việc chia sẻ dữ liệu khi tích hợp với LLM

96. Pydantic AI

Pydantic AI tiếp tục chứng minh là một framework mã nguồn mở ổn định và được hỗ trợ tốt để xây dựng các agent GenAI trong production
Được xây dựng trên nền tảng đáng tin cậy của Pydantic, nó cung cấp type safety mạnh mẽ, khả năng quan sát hạng nhất thông qua OpenTelemetry và các công cụ đánh giá tích hợp sẵn
Bản phát hành phiên bản 1.0 vào ngày 4 tháng 9 năm 2025 đánh dấu một cột mốc quan trọng về độ trưởng thành
Kể từ đó, nhờ tính đơn giản và khả năng bảo trì, nó đã trở nên đáng tin cậy và được áp dụng rộng rãi, gia nhập hàng ngũ các framework agent phổ biến khác như LangChain và LangGraph

97. Tauri

Tauri là một framework để xây dựng ứng dụng desktop hiệu năng cao bằng một codebase web UI duy nhất
Không giống các web wrapper truyền thống như Electron, Tauri được xây dựng trên Rust và tận dụng webview native của hệ điều hành để cung cấp binary nhỏ hơn và bảo mật mạnh hơn
Chúng tôi đã đánh giá Tauri lần đầu vài năm trước, và kể từ đó nó đã mở rộng vượt ra ngoài desktop để hỗ trợ iOS và Android
Phiên bản mới nhất có mô hình quyền hạn và phạm vi linh hoạt hơn, thay thế danh sách quyền cũ, đồng thời có lớp inter-process communication (IPC) được tăng cường để hỗ trợ truyền dữ liệu thô và cải thiện hiệu năng

Assess

98. Agent Development Kit (ADK)

Agent Development Kit (ADK) là một framework để phát triển và triển khai AI agent, áp dụng các kỷ luật kỹ thuật phần mềm hiện đại thay vì chỉ dựa vào prompting
Nó đưa vào các lớp trừu tượng quen thuộc như class, method, mẫu workflow và hỗ trợ CLI
So với các framework như LangGraph hoặc CrewAI, điểm mạnh của ADK là khả năng tích hợp sâu với hạ tầng AI của Google, cung cấp grounding, truy cập dữ liệu và giám sát sẵn sàng cho doanh nghiệp
Được thiết kế cho khả năng tương tác, nó hỗ trợ A2A protocol cho tool wrapper và giao tiếp giữa các agent

99. Agno

Agno là một framework để xây dựng, chạy và quản lý các hệ thống đa agent
Nó mang lại sự linh hoạt để tạo ra các agent hoàn toàn tự chủ hoặc các workflow có kiểm soát theo từng bước, đồng thời bao gồm hỗ trợ tích hợp sẵn cho human-in-the-loop, quản lý phiên, memory và knowledge
Chúng tôi đánh giá cao sự tập trung vào hiệu quả, với thời gian khởi động agent ấn tượng và mức tiêu thụ bộ nhớ thấp
Agno đi kèm runtime riêng là AgentOS, một ứng dụng FastAPI có control plane hợp nhất để đơn giản hóa việc kiểm thử, giám sát và quản lý hệ thống agent

100. assistant-ui

assistant-ui là một thư viện TypeScript và React mã nguồn mở cho giao diện chat AI
Nó xử lý những phần phức tạp của việc triển khai chat UI, như streaming, quản lý trạng thái và các tính năng UX phổ biến cho chỉnh sửa tin nhắn và chuyển nhánh, đồng thời cho phép nhà phát triển tự thiết kế component bằng các primitive của Radix
Nó hỗ trợ tích hợp với các runtime phổ biến, bao gồm Vercel AI SDK và LangGraph, đồng thời cung cấp giải pháp runtime có thể tùy chỉnh cho các trường hợp sử dụng phức tạp
Chúng tôi đã xây dựng thành công một giao diện chat đơn giản bằng assistant-ui và hài lòng với kết quả

101. AutoRound

AutoRound của Intel là một thuật toán lượng tử hóa tiên tiến để nén các mô hình AI quy mô lớn như LLM và vision language models (VLM), đồng thời giảm thiểu tối đa mức suy hao độ chính xác
Sử dụng tối ưu hóa sign-gradient descent để giảm kích thước mô hình xuống độ rộng bit cực thấp (2-4 bit) và áp dụng độ rộng bit hỗn hợp trên các lớp để đạt hiệu quả tối ưu
Quy trình lượng tử hóa này cũng rất nhanh: có thể lượng tử hóa mô hình 7 tỷ tham số chỉ trong vài phút trên một GPU
AutoRound được tích hợp với các inference engine phổ biến như vLLM và Transformers, khiến nó trở thành một lựa chọn hấp dẫn cho việc lượng tử hóa mô hình

102. Browser Use

Browser Use là một thư viện Python mã nguồn mở cho phép các agent dựa trên LLM vận hành trình duyệt web và tương tác với các ứng dụng web
Có thể điều hướng, nhập dữ liệu, trích xuất văn bản, đồng thời quản lý nhiều tab để điều phối công việc giữa các ứng dụng
Thư viện này đặc biệt hữu ích khi agent AI cần truy cập, thao tác hoặc truy xuất thông tin từ nội dung web
Hỗ trợ nhiều LLM khác nhau và tận dụng Playwright để kết hợp hiểu biết thị giác với trích xuất cấu trúc HTML, phục vụ các tương tác web phong phú hơn

103. DeepSpeed

DeepSpeed là một thư viện Python tối ưu hóa deep learning phân tán cho cả huấn luyện lẫn suy luận
Với huấn luyện, nó tích hợp các kỹ thuật như Zero Redundancy Optimizer (ZeRO) và xử lý song song 3D để mở rộng mô hình hiệu quả trên hàng nghìn GPU
Với suy luận, nó kết hợp song song tensor, pipeline, expert và ZeRO với các kernel tùy biến cùng tối ưu hóa truyền thông để giảm thiểu độ trễ
DeepSpeed vận hành một số mô hình ngôn ngữ lớn nhất thế giới, bao gồm Megatron-Turing NLG (530B) và BLOOM (176B)

104. Drizzle

Drizzle là một ORM TypeScript gọn nhẹ
Không giống Prisma ORM, nó cung cấp cho nhà phát triển cả API đơn giản kiểu SQL lẫn giao diện truy vấn theo phong cách ORM truyền thống hơn
Cũng hỗ trợ trích xuất schema từ cơ sở dữ liệu hiện có, cho phép cả cách tiếp cận database-first và code-first
Drizzle được thiết kế với môi trường serverless trong tâm trí, có kích thước bundle nhỏ và hỗ trợ prepared statements

105. Java post-quantum cryptography

Máy tính lượng tử đang tiếp tục phát triển nhanh chóng, và các dịch vụ SaaS như AWS Braket hiện cung cấp quyền truy cập vào các thuật toán lượng tử trên nhiều kiến trúc
Kể từ tháng 3, Java 24 đã giới thiệu Java post-quantum cryptography, bổ sung hỗ trợ cho các thuật toán mật mã hậu lượng tử như ML-KEM và ML-DSA
.Net 10 cũng đang mở rộng hỗ trợ
Lời khuyên rất đơn giản: nếu bạn đang xây dựng phần mềm bằng các ngôn ngữ này, hãy bắt đầu áp dụng các thuật toán an toàn trước lượng tử ngay từ bây giờ để đảm bảo hệ thống sẵn sàng cho tương lai

106. kagent

Kagent là một framework mã nguồn mở để chạy agent AI bên trong các cụm Kubernetes
Cho phép các agent dựa trên LLM lập kế hoạch và thực thi các tác vụ vận hành như chẩn đoán sự cố, sửa cấu hình và tương tác với các công cụ quan sát thông qua API gốc của Kubernetes và tích hợp Model Context Protocol (MCP)
Mục tiêu là đưa "AgentOps" vào hạ tầng cloud-native bằng cách kết hợp quản trị khai báo với suy luận tự động
Với tư cách là một dự án CNCF Sandbox, Kagent nên được áp dụng một cách thận trọng, đặc biệt khi xét đến rủi ro của việc trao cho LLM khả năng quản trị vận hành; các kỹ thuật như toxic flow analysis có thể đặc biệt giá trị trong việc đánh giá và giảm thiểu các rủi ro này

107. LangExtract

LangExtract là một thư viện Python sử dụng LLM để trích xuất thông tin có cấu trúc từ văn bản phi cấu trúc theo các chỉ dẫn tùy chỉnh của người dùng
Nó xử lý các tài liệu theo miền như ghi chú lâm sàng và báo cáo để nhận diện và sắp xếp các chi tiết cốt lõi, đồng thời vẫn giữ khả năng truy vết từng điểm dữ liệu được trích xuất về nguồn
Các thực thể được trích xuất có thể được xuất ra tệp .jsonl (định dạng tiêu chuẩn cho dữ liệu mô hình ngôn ngữ) và được trực quan hóa qua giao diện HTML tương tác để rà soát ngữ cảnh
Nhóm đã đánh giá LangExtract để trích xuất thực thể nhằm điền vào đồ thị tri thức theo miền và nhận thấy nó hiệu quả trong việc chuyển đổi các tài liệu phức tạp thành biểu diễn có cấu trúc, máy có thể đọc được

108. Langflow

Langflow là một nền tảng low-code mã nguồn mở để xây dựng và trực quan hóa các workflow LLM
Được xây dựng trên LangChain, nó cho phép nhà phát triển nối chuỗi prompt, công cụ, cơ sở dữ liệu vector và các thành phần bộ nhớ thông qua giao diện kéo thả, đồng thời vẫn hỗ trợ mã Python tùy chỉnh cho logic nâng cao
Đặc biệt hữu ích cho việc tạo mẫu các ứng dụng agent mà không cần viết toàn bộ mã backend
Tuy nhiên, Langflow vẫn còn tương đối mới và còn một số điểm chưa hoàn thiện cho việc sử dụng trong production; những lưu ý chung đối với các nền tảng low-code cũng áp dụng ở đây

109. LMCache

LMCache là một giải pháp bộ nhớ đệm key-value (KV) giúp tăng tốc hạ tầng phục vụ LLM
Nó hoạt động như một lớp cache chuyên dụng trên toàn bộ cụm inference engine LLM, lưu trữ các mục cache KV đã được tính toán trước cho những văn bản có khả năng được xử lý nhiều lần như lịch sử chat hoặc tập tài liệu
Bằng cách lưu giữ các giá trị này trên đĩa, nó chuyển tải phần tính toán prefill khỏi GPU để giảm time-to-first-token (TTFT) và cắt giảm chi phí suy luận trên các workload đòi hỏi cao như pipeline RAG, ứng dụng chat nhiều lượt và hệ thống agent
Có thể tích hợp LMCache với các máy chủ suy luận chủ chốt như vLLM hoặc NVIDIA Dynamo, và đáng để đánh giá tác động của nó đối với cấu hình của bạn

110. Mem0

Mem0 là một lớp bộ nhớ được thiết kế cho các agent AI
Cách tiếp cận ngây thơ thường là lưu toàn bộ lịch sử chat vào cơ sở dữ liệu và tái sử dụng trong các cuộc hội thoại tương lai, dẫn đến việc tiêu tốn token quá mức
Mem0 thay thế điều này bằng một kiến trúc tinh vi hơn, tách bộ nhớ thành khả năng hồi tưởng ngắn hạn và một lớp dài hạn thông minh chỉ trích xuất, lưu trữ các sự kiện và mối quan hệ nổi bật
Kiến trúc này kết hợp vector store để xử lý độ tương đồng ngữ nghĩa với knowledge graph để hiểu dữ liệu theo thời gian và dữ liệu quan hệ

111. Open Security Control Assessment Language (OSCAL)

Open Security Controls Assessment Language (OSCAL) là một định dạng trao đổi thông tin mở và có thể đọc bằng máy, được thiết kế để tăng cường tự động hóa trong tuân thủ và quản lý rủi ro, đồng thời giúp các nhóm rời bỏ cách tiếp cận thủ công dựa trên văn bản
Được Viện Tiêu chuẩn và Công nghệ Quốc gia Mỹ (NIST) dẫn dắt, OSCAL cung cấp standard representations in XML, JSON and YAML để biểu diễn các biện pháp kiểm soát bảo mật liên quan đến các framework trong ngành như SOC 2 và PCI, cũng như các framework của chính phủ như FedRAMP của Mỹ, Cybersecurity Control Catalogue của Singapore và Information Security Manual của Australia
Dù OSCAL vẫn chưa được áp dụng rộng rãi ngoài khu vực công và hệ sinh thái vẫn đang trong quá trình trưởng thành, chúng tôi hào hứng với tiềm năng của nó trong việc đơn giản hóa đánh giá bảo mật, giảm phụ thuộc vào bảng tính và các bài tập dạng đánh dấu checkbox, đồng thời cho phép tuân thủ tự động khi được tích hợp vào các nền tảng compliance-as-code và continuous compliance

112. OpenInference

OpenInference là một bộ quy ước và plugin được thiết kế để bổ sung cho OpenTelemetry trong việc quan sát các ứng dụng AI
Cung cấp khả năng instrumentation tiêu chuẩn hóa cho các framework và thư viện machine learning, giúp nhà phát triển theo dõi các lệnh gọi LLM cùng với ngữ cảnh xung quanh như truy xuất vector store hoặc gọi công cụ bên ngoài tới API và công cụ tìm kiếm
Span có thể được xuất tới bất kỳ collector tương thích OTEL nào, bảo đảm khả năng đồng bộ với các pipeline telemetry hiện có
Trước đây chúng tôi đã đưa Langfuse — một nền tảng hiển thị LLM được sử dụng phổ biến — vào Radar, và OpenInference SDK có thể ghi trace vào Langfuse cũng như các nền tảng hiển thị tương thích OpenTelemetry khác

113. Valibot

Valibot là một thư viện xác thực schema cho TypeScript
Giống như các thư viện xác thực TypeScript phổ biến khác như Zod và Ajv, nó cung cấp khả năng suy luận kiểu, nhưng khác biệt nằm ở thiết kế mô-đun
Kiến trúc này cho phép bundler thực hiện tree shaking và code splitting hiệu quả để chỉ bao gồm các hàm xác thực thực sự được sử dụng
Valibot có thể giảm kích thước bundle tới 95% so với Zod trong các kịch bản tối ưu, khiến nó trở thành lựa chọn hấp dẫn cho xác thực schema trong các môi trường mà kích thước bundle là yếu tố quan trọng, như xác thực phía client hoặc hàm serverless

114. Vercel AI SDK

Vercel AI SDK là một bộ công cụ full-stack mã nguồn mở để xây dựng ứng dụng và agent dùng AI trong hệ sinh thái TypeScript
Gồm hai thành phần chính: AI SDK Core chuẩn hóa việc gọi LLM theo cách độc lập với mô hình, hỗ trợ sinh văn bản, sinh đối tượng có cấu trúc và gọi công cụ
AI SDK UI, tương tự assistant-ui, đơn giản hóa phát triển frontend với streaming, quản lý trạng thái và cập nhật UI theo thời gian thực trên React, Vue, Next.js và Svelte
Với các nhóm đã làm việc trong hệ sinh thái TypeScript và Next.js, Vercel AI SDK mang đến một cách nhanh chóng và liền mạch để xây dựng ứng dụng AI với trải nghiệm phía client phong phú

Thoughtworks công bố Technology Radar, Volume 33

Đưa điều phối hạ tầng vào AI

Sự trỗi dậy của agent dựa trên MCP

Quy trình làm việc lập trình với AI

Sự xuất hiện của các phản mẫu AI mới

ThoughtWorks Technology Radar Volume 33

[Techniques]

Adopt

Trial

Assess

Hold

[Platforms]

Adopt

Trial

Assess

[Tools]

Adopt

Trial

Assess

[Languages and Frameworks]

Adopt

Trial

Assess

Bài viết liên quan

Chưa có bình luận nào.