45 điểm bởi GN⁺ 2026-02-05 | Chưa có bình luận nào. | Chia sẻ qua WhatsApp
  • Trong thời đại AI viết toàn bộ phần mềm, phần mềm tiết kiệm token (chi phí suy luận) sẽ sống sót nhờ áp lực chọn lọc tiến hóa
  • Đo độ thích nghi của phần mềm bằng công thức tỷ lệ sống sót, và chỉ có thể tồn tại khi phần tiết kiệm nhận thức vượt quá chi phí nhận thức (lớn hơn 1)
  • Các công cụ như Git, grep là những ví dụ mà chi phí để AI tạo lại rồi dùng là phi lý, nhờ nén insighthiệu quả nền tảng tính toán
  • Để agent chấp nhận dùng công cụ, độ nhận biết (Awareness)ma sát tối thiểu (Friction) là điều bắt buộc, trong đó thiết kế Desire Paths đặc biệt hiệu quả
  • Ngay cả trong kỷ nguyên lấy AI làm trung tâm, hệ số con người (Human Coefficient) vẫn vận hành, nên những lĩnh vực nơi sự can thiệp và sở thích của con người trực tiếp tạo ra giá trị sẽ tiếp tục tồn tại

Bối cảnh: Dự báo phần mềm trong thời đại AI

  • Từ tháng 6/2024 với Death of the Junior Developer, dự đoán sự xuất hiện của orchestrator từ 10 tháng trước, và dự án Gas Town, tác giả đã liên tục dự đoán đúng đường cong phát triển của AI
  • Phát triển Gas Town bằng cách ngoại suy chuỗi tiến hóa: tự động hoàn thành mã năm 2023 → giao diện hội thoại năm 2024 → agent đầu năm 2025 → orchestration vào đầu năm 2026
  • Nền tảng của mọi dự đoán là tin nguyên vẹn vào đường cong phát triển theo cấp số nhân
  • Hoàn toàn tin tưởng vào hướng nhìn về tương lai phần mềm mà Dario Amodei và Andrej Karpathy đã nói đến
  • Gas Town là ví dụ cho thấy phép ngoại suy này thực sự hoạt động; thông qua các model cuối năm 2025 và nhiều biện pháp chắp vá tạm thời, tác giả đã xác nhận trước một hình thái chỉ vừa đủ để tồn tại

Hệ sinh thái phần mềm đang bị đe dọa

  • Áp lực lên các công ty SaaS ngày càng tăng; cấu trúc chi phí giữa mua và tự xây dựng (build) thay đổi, khiến các bộ phận kinh doanh trực tiếp tự tạo SaaS bằng vibe coding
  • Chỉ 3 năm trước GPT-3.5 còn khó viết nổi một hàm đơn lẻ, còn hiện tại đã có thể trực tiếp tạo ra SaaS quy mô nhỏ nhưng có giá trị thực tế
  • Stack OverflowChegg là những bên bị ảnh hưởng sớm nhất; sau đó áp lực lan sang phần mềm hỗ trợ khách hàng Tier-1, hệ thống low-code/no-code, công cụ tạo nội dung và nhiều công cụ năng suất khác
  • Các nhà cung cấp IDE cũng bắt đầu cảm nhận áp lực cạnh tranh sau khi Claude Code xuất hiện
  • Vì dự đoán của các nhà nghiên cứu AI đã cho thấy độ chính xác cao trong khoảng 40 năm, cần chuẩn bị với giả định rằng mọi lĩnh vực phần mềm đều có thể bị đe dọa

Mô hình áp lực chọn lọc (Selection Argument)

  • Suy luận cần token, tiêu thụ token dẫn tới sử dụng năng lượng, và năng lượng cuối cùng được quy đổi thành chi phí
  • {token, năng lượng, tiền} có thể được xem như cùng một ràng buộc tài nguyên và luôn trong trạng thái hữu hạn
  • Quy tắc đơn giản phần mềm làm giảm chi phí nhận thức sẽ sống sót định hình toàn bộ hệ sinh thái phần mềm
  • Đây là cấu trúc tương tự áp lực chọn lọc tiến hóa, nơi trong môi trường tài nguyên hữu hạn, thực thể nào sử dụng tài nguyên hiệu quả hơn sẽ đẩy lùi thực thể kém hiệu quả hơn

Công thức tỷ lệ sống sót (Survival Ratio)

  • Survival(T) ∝ (Savings × Usage × H) / (Awareness_cost + Friction_cost)
  • Savings: chi phí nhận thức được tiết kiệm khi dùng công cụ, tức số token giảm được so với việc tổng hợp cùng chức năng từ đầu
  • Usage: tần suất và phạm vi áp dụng để công cụ có thể được dùng lặp lại trong nhiều tình huống
  • H (Human Coefficient): hệ số phản ánh nhu cầu coi trọng những thứ do con người làm ra, bất kể hiệu suất
  • Awareness_cost: năng lượng cần để agent biết công cụ này tồn tại, ghi nhớ nó và chọn nó đúng lúc
  • Friction_cost: năng lượng bị tiêu hao do lỗi, thất bại, thử lại và hiểu nhầm phát sinh trong quá trình sử dụng thực tế
  • Tỷ lệ tối thiểu để sống sót là 1; trong môi trường có cạnh tranh, con số cần thiết sẽ cao hơn nhiều
    • Ví dụ: công cụ có tỷ lệ sống sót 1.2 có thể bị công cụ cạnh tranh đạt 2.5 lấn át

Đòn bẩy 1: Nén insight (Insight Compression)

  • Nén tri thức đã được ngành phần mềm tích lũy suốt thời gian dài và quá đắt để tái khám phá thành dạng có thể tái sử dụng
  • Git là ví dụ tiêu biểu; commit DAG, ref như con trỏ, index, reflog... là những cấu trúc cô đọng từ hàng chục năm thử và sai
    • Nếu AI phải tái hiện từ đầu, nó sẽ phải đi lại cùng một lịch sử trí tuệ, nên hoàn toàn không hợp lý về mặt kinh tế
  • Nguyên lý này cũng áp dụng cho cơ sở dữ liệu, compiler, hệ điều hành, workflow engine và hệ thống giám sát
  • Kubernetes phức tạp không phải vì thiết kế kém, mà vì bản thân hệ phân tán vốn dĩ phức tạp
  • Temporal cung cấp durable execution thay cho việc tự triển khai saga pattern cùng retry idempotent, vốn trên thực tế gần như là một dự án nghiên cứu
  • Điểm chung của phần mềm mạnh là mật độ insight cao đến mức bản thân ý định tái tổng hợp lại đã thấy phi lý
  • Trong Gas Town, mô hình vai trò nhân vật hay các động từ như gt sling cũng là ví dụ nén những khái niệm phức tạp thành các biểu đạt ngắn gọn, dễ nhớ

Đòn bẩy 2: Hiệu quả nền tảng tính toán (Substrate Efficiency)

  • grep là một ví dụ khác mà việc tái phát minh gần như là hành vi điên rồ
  • Dù đơn giản đến mức Ken Thompson có thể viết trong nửa buổi chiều, nó vẫn tiết kiệm lượng lớn chi phí nhận thức nhờ xử lý dựa trên CPU
  • Trong đối sánh mẫu văn bản, CPU áp đảo GPU với cách biệt nhiều bậc độ lớn
  • Cách LLM thực hiện phép nhân là ghép đối sánh mẫu để trước tiên ước lượng “khoảng 94”, rồi sau đó hiệu chỉnh chữ số bằng bảng tra cứu đã ghi nhớ
    • Toàn bộ phép tính đó diễn ra trên nền tảng cực kỳ kém hiệu quả là giai đoạn suy luận bằng GPU
  • Máy tính bỏ túi, parser, các công cụ biến đổi phức tạp như ImageMagick và nhiều tiện ích Unix CLI đều tận dụng mạnh đòn bẩy này
  • Áp dụng thuật toán tốt hơn, hoặc chuyển phép tính sang nền tảng rẻ hơn như CPU hoặc con người, để tiết kiệm token và năng lượng

Đòn bẩy 3: Tính hữu dụng rộng (Broad Utility)

  • Tương ứng với hạng mục Usage trong mô hình tỷ lệ sống sót
  • Phạm vi sử dụng càng rộng thì chi phí nhận biết càng được phân tán, và ngưỡng tiết kiệm token cần thiết cho mỗi lần dùng càng thấp
  • Với công cụ tiết kiệm token thực sự phổ dụng, ngay cả khi AI về lý thuyết có thể tái triển khai, lựa chọn đã hiện diện khắp nơi và được dùng rộng rãi vẫn sẽ được ưu tiên
  • Temporal dù có chi phí nhận biết và ma sát tương đối cao, vẫn cung cấp mô hình workflow phổ dụng gần như PostgreSQL
    • Nó sở hữu cả ba đòn bẩy: nén insight quyết liệt, tận dụng khéo léo nền tảng tính toán, và tính hữu dụng rộng
  • Dolt là cơ sở dữ liệu được quản lý phiên bản bằng Git, một dự án mã nguồn mở đã được duy trì 8 năm
    • Gần đây nó mới tìm thấy killer app trong workflow production và DevOps dựa trên agent
    • Ngay cả khi agent mắc lỗi trong môi trường production, vẫn có thể rollback/rollforward bằng toàn bộ khả năng của Git
  • Công cụ tìm kiếm mã nguồn trở nên quan trọng hơn đột biến khi LLM tạo ra lượng mã nhiều hơn trước từ 10 đến 100 lần
    • Hình thành một ngách phổ dụng quy mô lớn gọi là “quá lớn nên grep không xử lý nổi”
    • Vì giải quyết những vấn đề không tầm thường với nhiều edge case khó phát hiện, dùng nền tảng tính toán rẻ và có khả năng áp dụng phổ quát, chúng đáp ứng cả ba đòn bẩy

Đòn bẩy 4: Quảng bá (Publicity)

  • Chỉ tiết kiệm chi phí nhận thức là chưa đủ; còn phải giải quyết vấn đề nhận biết, tức vấn đề ở giai đoạn tiền lựa chọn
  • Dolt là ví dụ có đủ đòn bẩy 1~3 nhưng ban đầu thiếu đòn bẩy 4 nên không được dùng rộng rãi
  • Có nhiều cách để chi trả chi phí nhận biết
    • Tạo ra một sản phẩm xuất sắc, trở nên phổ biến, rồi để cộng đồng tự nhiên giúp nó được đưa vào dữ liệu huấn luyện
    • Hoặc đầu tư chi phí vào tài liệu dành cho agent hay chạy quảng cáo
  • Một cách trực tiếp hơn là hợp tác với những người phụ trách tại các frontier lab như OpenAI, Anthropic, Google để đưa công cụ vào quá trình huấn luyện model
    • Theo hình thức dịch vụ trả phí, có thể tạo eval thể hiện cả cách dùng đúng lẫn cách dùng sai của công cụ để các nhà nghiên cứu điều chỉnh huấn luyện
  • Khái niệm SEO cho agent đang thực sự xuất hiện
  • Nếu không thể chi ngân sách lớn, phải dựa vào năng lượng ở giai đoạn hậu lựa chọn, tức đòn bẩy 5; để làm vậy, cần thiết kế công cụ thân thiện với agent tối đa

Đòn bẩy 5: Giảm thiểu ma sát (Minimizing Friction)

  • Nếu độ nhận biết là vấn đề ở giai đoạn tiền lựa chọn, thì ma sát sản phẩm là vấn đề sau khi đã dùng
  • Agent luôn hành xử như đang bị thúc ép về thời gian; hễ gặp vướng mắc là lập tức thử đường vòng
  • Chỉ cần có một chút ma sát, đánh giá sẽ thay đổi và agent sẽ rút về cách làm kém hiệu quả hơn nhưng quen thuộc và dễ đoán hơn
  • Ngược lại, công cụ được thiết kế đúng sở thích sẽ khiến agent dùng lặp đi lặp lại gần như dai dẳng
  • Cách tiếp cận bằng tài liệu là phương thức trì hoãn chi phí nhận biết đến thời điểm suy luận, chứ không giải quyết ở giai đoạn huấn luyện
    • Tiêm trực tiếp vào ngữ cảnh thông tin về công cụ làm tốt điều gì, khi nào và vì sao nên dùng, hướng dẫn bắt đầu nhanh và lộ trình sang tài liệu tiếp theo
  • Nhưng lời giải tốt hơn là tạo ra chính công cụ mà agent cảm thấy trực quan
  • Ví dụ về thiết kế Desire Paths: Beads đã tiến hóa CLI trong 4 tháng qua hơn 100 subcommand, nhiều sub-subcommand, alias và cú pháp thay thế
    • CLI phức tạp này không được thiết kế cho con người mà cho mẫu hành vi sử dụng của agent
    • Quan sát cách agent thử thao tác, tác giả biến ảo giác thành tính năng thật, và giờ gần như mọi phỏng đoán đều hoạt động nguyên vẹn
  • Hallucination Squatting là kỹ thuật lần ngược các tên miền mà LLM thường ảo giác ra, đăng ký chúng rồi tải artifact lên đó để model thực sự tải xuống
    • Điều này cho thấy ngay cả các nhóm hacker cấp quốc gia cũng hiểu và tận dụng Agent UX
  • Agent UX có tầm quan trọng quyết định, nhưng vẫn đang bị phần lớn công cụ bỏ qua
  • Công cụ lý tưởng nên giống với những công cụ khác mà agent đã quen, hoặc có cấu trúc giải quyết vấn đề đúng theo cách agent muốn suy nghĩ

Đòn bẩy 6: Hệ số con người (Human Coefficient)

  • Có những phần mềm tạo ra giá trị chỉ nhờ bản thân sự thật rằng con người đã can thiệp, bất kể hiệu quả token
  • Giá trị có thể phát sinh từ tuyển chọn bởi con người, bằng chứng xã hội, tính sáng tạo, sự hiện diện vật lý hay sự phê chuẩn
  • Playlist do con người chọn có thể đánh bại playlist do AI tạo ra dù chất lượng tương đương và hiệu quả năng lượng cao hơn
  • Trong lĩnh vực game, môi trường có người thật thường chiến thắng; rất hiếm người chỉ muốn chơi với AI rõ ràng mạnh hơn con người
  • Mạng xã hội loại trừ agent thậm chí có thể được xem là hấp dẫn hơn
  • Dù AI trở thành giáo viên giỏi nhất, vẫn sẽ có những người cố ý chọn giáo viên là con người
  • Ngay cả ở những lĩnh vực có Human Coefficient cao, cạnh tranh vẫn rất khốc liệt
    • Trong thế giới mà Karpathy hình dung, agent có thể là bất kỳ thứ gì cho bất kỳ ai và về bản chất gây nghiện mạnh
  • Kết quả là có thể sẽ tồn tại rất nhiều phần mềm cực kỳ kém hiệu quả nhưng có giá trị H rất cao

Cơ sở để hy vọng

  • Những phần mềm đóng vai trò trung gian giữa con người và AI, hoặc đảm nhận “vai trò giả vờ thông minh” mà AI sớm có thể tự làm trực tiếp, về mặt cấu trúc là nhóm rủi ro
  • Dù vậy, lượng phần mềm cần được viết ra trên thực tế là vô hạn
    • Chữa mọi căn bệnh, mô hình hóa hành vi của mọi protein, khám phá mọi kịch bản thăm dò mọi hành tinh vẫn còn ở phía trước
  • Tham vọng của con người luôn vượt quá năng lực nhận thức sẵn có; ngay cả khi chi phí token giảm, chúng ta sẽ lập tức tiến tới những biên giới xa hơn
  • Vấn đề tập trung chú ý đã từng được giải quyết nhiều lần qua thời báo in, internet, mạng xã hội, quảng cáo thời gian thực và các aggregator
  • Thiết kế Desire Paths thực sự hiệu quả, và ngay cả khi không có ngân sách huấn luyện khổng lồ như OpenAI, vẫn có thể tạo ra công cụ mà agent tự nhiên muốn dùng
  • Hệ số con người chắc chắn tồn tại, và con người đã bắt đầu mệt mỏi với những thứ nồng mùi agent
    • Nếu thiết kế xoay quanh kết nối và sáng tạo giữa con người với nhau, cuối cùng vấn đề sẽ lại quy về marketing và branding truyền thống
  • nhiều con đường sống sót khác nhau do sáu đòn bẩy này mang lại
  • Nếu xây được thứ mà ngay cả ý định làm lại nó cũng nghe như điên rồ, đồng thời dễ được tìm thấy và dễ sử dụng, thì vẫn có thể tạo ra khả năng sống sót đủ vững chắc

Chưa có bình luận nào.

Chưa có bình luận nào.