2 điểm bởi GN⁺ 2 giờ trước | Chưa có bình luận nào. | Chia sẻ qua WhatsApp
  • Khung framework cốt lõi của Lean Analytics xuất bản năm 2013 (xác định giai đoạn, hiểu mô hình kinh doanh, OMTM, benchmark) vẫn còn giá trị, nhưng phần lớn các chỉ số cụ thể cần được định nghĩa lại để phù hợp với thời đại AI
  • Trong sản phẩm AI, thời gian đạt được giá trị (Time to Value) đã rút ngắn một cách cực đoan, và người dùng kỳ vọng kết quả chất lượng cao ngay từ lần thử đầu tiên, nếu thất bại sẽ nhanh chóng rời bỏ
  • Engagement không còn chỉ là cao hay thấp, mà đang chuyển thành chỉ số định hướng cần phân biệt thời gian được dùng vào việc gì (vật lộn, AI thực hiện công việc, hay khám phá)
  • Do đặc tính đầu ra mang tính xác suất của AI, chất lượng đã trở thành chỉ số hạng nhất, và nếu không có eval harness thì sản phẩm chẳng khác gì chỉ là "cảm tính (vibes)"
  • Do cấu trúc chi phí biến đổi dựa trên token, power user thậm chí có thể gây lỗ, nên việc theo dõi lợi nhuận gộp theo người dùng hoạt động và mô hình định giá dựa trên hiệu quả là bài toán cốt lõi

Tóm tắt các nguyên tắc cốt lõi của Lean Analytics

  • Lean Analytics được cấu thành dựa trên 4 ý tưởng cốt lõi: xác định giai đoạn, hiểu mô hình kinh doanh, OMTM (One Metric That Matters), benchmark (lines in the sand)
  • Mô hình 5 giai đoạn: Empathy → Stickiness → Virality → Revenue → Scale là quá trình mà mọi doanh nghiệp đều trải qua theo thứ tự đó
    • Nhiều nhà sáng lập tự dối mình về giai đoạn hiện tại, và xu hướng theo đuổi tăng trưởng hockey-stick khi chưa có nền tảng vững chắc vẫn y nguyên trong thời đại AI
  • 6 nguyên mẫu mô hình kinh doanh: SaaS, e-commerce, marketplace hai phía, nội dung do người dùng tạo/cộng đồng, ứng dụng di động, media
    • Cách phân loại này đã cũ, nhưng nguyên tắc tự nắm rõ cách doanh nghiệp của mình vận hành vẫn rất quan trọng
  • OMTM: Dù ở giai đoạn nào hay mô hình kinh doanh nào, luôn có một chỉ số duy nhất cần tập trung
    • Vì không thể sửa mọi thứ cùng lúc, nó được dùng để xác định cần làm gì và đo lường ra sao
  • Benchmark (lines in the sand): tiêu chuẩn cho biết bạn đã đủ điều kiện để bước sang giai đoạn tiếp theo hay chưa
    • Trong các sản phẩm AI và tác nhân, các chỉ số và ngưỡng mục tiêu đang biến động rất nhanh

Những điều không thay đổi trong thời đại AI

  • Các nguyên tắc cốt lõi không thay đổi, nhưng các doanh nghiệp được xây dựng ngày nay về bản chất đã khác
  • AI đang thay đổi giao diện người dùng, mô hình định giá, biên lợi nhuận, và các sản phẩm AI-first cũng như sản phẩm tác nhân có cách sử dụng hoàn toàn khác
  • Mô hình 5 giai đoạn không biến mất, nhưng ở mỗi giai đoạn đều xuất hiện dấu hỏi — cần tái định nghĩa từng giai đoạn bằng cách kết hợp các chỉ số cũ với chỉ số mới

Chỉ số sản phẩm: 6 thay đổi cốt lõi

  • Shift 1: Sự sụp đổ của Time to Value

    • SaaS truyền thống cho người dùng trải nghiệm giá trị qua quá trình onboarding theo từng bước, nhưng với sản phẩm AI, người dùng kỳ vọng kết quả chất lượng cao ngay lập tức
      • Đưa vào một tài liệu lộn xộn thì mong nhận được một bản đề xuất gọn gàng, tải lên một bảng tính thì mong có kết quả phân tích, đưa vào bản phác thảo wireframe thì mong có UI hoạt động được
      • Cách nhập liệu có thể đa dạng nhưng kỳ vọng thì nhất quán: đầu ra nhanh, chất lượng cao, ngay từ lần thử đầu tiên
    • Time to Competency cũng sụp đổ theo — ngay cả người dùng không chuyên kỹ thuật cũng có thể tạo ra kết quả ở mức chuyên gia mà không cần đường cong học tập
      • Nếu trước đây đường cong kích hoạt cũng chính là đường cong học tập, thì giờ nó được rút ngắn chỉ còn một hoặc hai lần tương tác
    • Đây là tín hiệu tích cực nhưng có thể ảnh hưởng tiêu cực đến mô hình kinh doanh: nếu một người xử lý khối lượng công việc của ba người nhờ AI, thì số lượng seat, doanh thu mở rộng và đường cong ACV sẽ bị tác động
      • Người dùng hạnh phúc hơn, ít seat hơn — sự căng thẳng này bắt đầu từ Shift 1 và lan sang mọi chỉ số ở hạ nguồn
    • Cần đo lường: thời gian đến kết quả hữu ích đầu tiên, tỷ lệ người dùng nhận được kết quả hữu ích ngay từ lần thử đầu tiên (bất kể là prompt, upload hay sketch)
  • Shift 2: Activation không còn mang tính quyết định nữa

    • Trong SaaS truyền thống, activation là một sự kiện mang tính quyết định (deterministic) — người dùng hoàn thành các bước được định sẵn thì sẽ cho ra kết quả có thể dự đoán được
    • Với sản phẩm AI, ngay cả khi hoàn thành toàn bộ các bước trong activation funnel, người dùng vẫn có thể nhận về kết quả chưa đạt yêu cầu
      • Trên dashboard thì được đánh dấu là đã activation, nhưng thực tế thì không phải vậy
    • Activation không phải là cổng nhị phân mà là một sự kiện có trọng số theo chất lượng
    • Mô hình Hooked của Nir Eyal (trigger → action → variable reward → investment) vẫn còn phù hợp, nhưng trong vòng lặp AI, sự biến động tồn tại ở cả hai phía của hành động
      • Người dùng thử sản phẩm theo những cách không được thiết kế sẵn, và chất lượng kết quả cũng biến động — một vòng lặp duy nhất nhưng có hai nguồn biến động
    • Activation phức hợp nhiều bước vẫn có hiệu quả với sản phẩm AI — khi thiết lập giúp nâng chất lượng lần chạy đầu tiên, như kết nối ngữ cảnh, tải lên tài liệu tham khảo, cấu hình template, thì thậm chí còn hiệu quả hơn
      • Thay đổi cốt lõi không phải là “activation ngắn hơn” mà là hoàn thành các bước không đảm bảo giá trị được tạo ra
    • Cần đo lường: cùng theo dõi các chỉ số hoàn thành funnel hiện có với tín hiệu chất lượng ở lần đầu của Shift 1 — funnel cho biết việc hoàn thành bước, còn tín hiệu chất lượng cho biết liệu giá trị thực sự có được tạo ra hay không, và cả hai cần được hiển thị song song trên dashboard
  • Shift 3: Engagement là chỉ số định hướng

    • Quan niệm truyền thống: thời gian ở trong sản phẩm càng lâu càng tốt — phiên dài, DAU cao, mức dùng tính năng sâu đều xuất hiện trong deck gọi vốn
    • Với AI, câu hỏi cốt lõi không phải là engagement tăng hay giảm mà là thời gian của người dùng được dùng vào việc gì
      • Thời gian vật lộn (regenerate, re-prompt, điều chỉnh đầu vào để có kết quả hữu ích) = engagement xấu, thất bại được ngụy trang thành engagement
      • Thời gian AI làm việc thay người dùng (thao tác bảng tính, tạo đề xuất, rà soát tài liệu) = engagement tốt, thể hiện lao động do AI thực hiện
      • Thời gian khám phá/sáng tạo (brainstorming, ideation, lặp thiết kế) = engagement tốt, trực giác truyền thống vẫn đúng
      • Không tốn thời gian người dùng mà công việc vẫn hoàn thành = kết quả lý tưởng của sản phẩm tác nhân và tự động hóa
    • GitHub Copilot xem tỷ lệ chấp nhận đề xuất là chỉ số cốt lõi, và toàn ngành hiện ở khoảng 27~30%
      • Đây là KPI không tồn tại trong SaaS truyền thống, trực tiếp đo “công việc AI làm có hữu ích không” thay vì “người dùng có ở lại không”
  • Shift 4: Stickiness không phải là rào cản mà là Flow

    • Stickiness truyền thống là cuộc chơi về tần suất (DAU/MAU, quay lại, vòng lặp thói quen), và Andrew Chen từng chỉ ra giới hạn của DAU/MAU — không phù hợp với sản phẩm có giá trị cao nhưng mang tính từng đợt, hay công cụ có nhịp sử dụng theo tuần
    • AI không loại bỏ DAU/MAU mà khuếch đại các giới hạn vốn có của nó
    • Hai điều xảy ra đồng thời:
      • Người dùng kỳ vọng sản phẩm AI có thể xử lý nhiều loại công việc hơn so với công cụ SaaS đơn chức năng trước đây — task diversity per user trở thành một vector tăng trưởng chưa từng có
      • Sản phẩm AI có stickiness không tồn tại như một rào cản nhốt người dùng mà tồn tại bên trong luồng công việc — phù hợp với khái niệm “Moats are dead. Long live canals” của Trace Cohen
        • “Moat mở rộng bằng cách loại trừ, còn canal mở rộng bằng thông lượng”
    • Cần đo lường:
      • Task diversity — liệu người dùng có mở rộng sản phẩm sang các use case ngoài phạm vi ban đầu hay không
      • Độ sâu tích hợp — có bao nhiêu công cụ và nguồn dữ liệu của người dùng được kết nối vào sản phẩm
      • Độ đa dạng trigger — yếu tố khiến người dùng quay lại là một hay nhiều loại
      • Workflow chaining — sản phẩm có handoff sang công cụ khác hoặc nhận handoff từ công cụ khác hay không
    • Khi con người không còn là người dùng chính, DAU/MAU truyền thống trở thành chỉ số có vấn đề
    • Chỉ số bổ sung replacement breadth: số công cụ lân cận, gói đăng ký hoặc quy trình thủ công mà khách hàng thay thế khi áp dụng sản phẩm
      • Nếu câu trả lời là 0 thì đó là một canal nhỏ có thể bị đi vòng qua; nếu con số đủ ý nghĩa thì nó trở thành tuyến đường mà mọi thứ đều đi qua
  • Shift 5: Chất lượng là chỉ số hạng nhất

    • Cùng nguyên nhân gốc với Shift 2: đầu ra AI mang tính xác suất chứ không mang tính quyết định — thay đổi này lan sang mọi chỉ số được thừa hưởng từ playbook SaaS
    • Truyền thống: tính năng hoặc hoạt động hoặc không — triển khai xong thì gắn đo lường và chuyển sang bước tiếp theo
    • Thực tế AI: đầu ra là một phân phối chứ không phải một thuộc tính — một sản phẩm tốt ở mức 80% và một sản phẩm tốt ở mức 95% sẽ được người dùng cảm nhận như hai sản phẩm hoàn toàn khác nhau
    • Trường hợp của Klarna: sau khi triển khai bộ phận hỗ trợ khách hàng chuyên dùng AI vào năm 2024, công ty tuyên bố AI làm khối lượng công việc tương đương 700 nhân viên tư vấn; nhưng đến giữa năm 2025, CEO công khai rút lại và nối lại việc tuyển người
    • Tính giòn vỡ (brittleness) — chất lượng có thể âm thầm thoái lui vì mô hình không do mình sở hữu, các tích hợp gần như không kiểm soát được, hoặc cập nhật từ nhà cung cấp upstream
      • Chất lượng có thể giảm ngay cả khi đội ngũ không đụng tới code — một loại rủi ro hoàn toàn mới
    • Cách phòng vệ: thực hiện đánh giá so sánh giữa các model trên prompt thực tế, chạy cùng một eval cho mọi model để phát hiện thoái lui và cải thiện
    • Cần đo lường:
      • Tỷ lệ thumbs-uptỷ lệ regenerate là các tín hiệu cốt lõi
      • Theo dõi điểm eval harness theo chuỗi thời gian như retention, áp dụng cho mọi model đang dùng
      • Phân phối chất lượng theo cohort — trải nghiệm sản phẩm của người dùng mới và power user là khác nhau, nhưng phần lớn đội ngũ không đo khoảng cách này
    • Theo quan điểm của Alistair Croll: nếu ở thời Lean Startup, MVP là thí nghiệm tối thiểu để kiểm thử giả định rủi ro nhất, thì trong thời AI, bộ eval suite chính là MVP — “tập hợp hành động tối thiểu có thể tự động hóa và đo lường cải tiến”
  • Shift 6: Niềm tin và mức độ thoải mái với AI là chỉ số dẫn dắt

    • Năng lực công nghệ luôn quan trọng, nhưng với AI, mức độ thoải mái với chính công nghệ này là một biến số và ảnh hưởng đến mọi chỉ số ở hạ nguồn
    • Nghiên cứu của Gallup tháng 2/2026 (23.717 nhân viên tại Mỹ): yếu tố phân biệt người chấp nhận AI và người không chấp nhận không phải là quyền truy cập công cụ, mà là việc họ có xem AI là hữu ích, có đạo đức và phù hợp với workflow của mình hay không
    • Stanford 2026 AI Index Report: tỷ lệ áp dụng của nhân viên trên toàn cầu là 58%, trong khi Mỹ chỉ đạt 28,3%, kém xa Singapore 61% và UAE 54%
      • Cùng một sản phẩm có thể tồn tại trên những nhóm người dùng rất khác nhau, nhưng phần lớn đội ngũ không đo điều này
    • Trong B2B, đường cong activation, stickiness và task diversity giữa người dùng AI-native và người dùng còn do dự với AI có thể khác nhau một cách đáng kể
      • Người dùng AI-native mở rộng công cụ, prompt theo những cách không được thiết kế sẵn và thu được nhiều giá trị hơn trong mỗi phiên
      • Người dùng còn do dự với AI sử dụng công cụ một cách dè dặt, chưa khai thác hết và âm thầm đi đến kết luận rằng “cái này không dành cho mình”
      • Nếu đo như một cohort duy nhất, giá trị trung bình sẽ che khuất câu chuyện thực
    • Trong B2C, các sản phẩm về bạn đồng hành, hỗ trợ sức khỏe tinh thần, tình bạn và an sinh cảm xúc đang nổi lên như một danh mục thực sự
  • Dữ liệu Stanford: 52% người tham gia khảo sát trên toàn cầu hào hứng với bạn đồng hành AI, ở Singapore và Indonesia vượt 80%

    • Trong bối cảnh này, việc tạo ra giá trị được đo bằng mức độ sẵn sàng tham gia lâu dài, trò chuyện và tương tác cảm xúc của người dùng
    • Niềm tin không phải là một khái niệm đơn lẻ mà có ít nhất 4 chiều độc lập:
      • niềm tin vào đầu ra (độ chính xác·tính hữu ích), niềm tin vào xử lý dữ liệu (prompt đi về đâu), niềm tin về bảo mật (khả năng bị lạm dụng·rò rỉ), niềm tin về độ tin cậy (liệu có hoảng hốt khi phụ thuộc vào nó hay không)
    • Đối tượng đo lường:
      • đường cong chấp nhận·kích hoạt theo từng cohort mức độ thoải mái với AI
      • tỷ lệ chấp nhận (accept rate) — khi phân tích theo từng cohort mức độ thoải mái với AI, có thể nắm được tốc độ xây dựng niềm tin; quan trọng không phải giá trị tuyệt đối mà là độ dốc của đường cong
      • tỷ lệ ghi đè (override rate) — tần suất người dùng viết lại·chỉnh sửa kết quả AI, xu hướng giảm là tín hiệu niềm tin tăng lên
      • với sản phẩm B2C có tính thân mật về mặt cảm xúc: độ sâu phiên, tỷ lệ quay lại với các tính năng nhạy cảm, sắc thái định tính của tương tác
      • tín hiệu lo ngại về dữ liệu·bảo mật: opt-out tính năng, ticket hỗ trợ kiểu "Cái này đi đâu vậy?", hành vi né tránh nhập dữ liệu nhạy cảm sử dụng

Chỉ số mô hình kinh doanh: 3 thay đổi cốt lõi

  • Chuyển dịch 1: chi phí cho mỗi tác vụ thành công là cách tính CAC mới

    • SaaS truyền thống: CAC, LTV, biên lợi nhuận gộp tương đối ổn định trên mỗi khách hàng, chi phí giảm khi quy mô tăng, chi phí cận biên để thêm người dùng gần như bằng 0
    • Thực tế AI: power user mới là bên thực sự gây ra chi phí — token là chi phí biến đổi, đăng ký trả phí cố định + người dùng nặng = biên âm trên mỗi tài khoản
      • Đường cong LTV của SaaS không còn đúng, và đây là cấu trúc đảo ngược nơi mức sử dụng càng cao thì unit economics càng xấu đi
    • Cần đo: biên lợi nhuận gộp trên mỗi người dùng hoạt động (dựa trên người dùng hoạt động chứ không phải người dùng trả phí), chi phí cho mỗi tác vụ thành công, tỷ lệ chi phí mô hình trên doanh thu, chi phí cận biên so với doanh thu cận biên của power user
    • Fin của Intercom: không tính phí theo seat mà $0,99 cho mỗi lần giải quyết thành công — mô hình định giá theo kết quả, trung thực về mặt toán học với chi phí vận hành thực của sản phẩm AI
    • ElevenLabs ngay từ ngày đầu đã tính phí theo mức sử dụng, còn Anthropic và OpenAI đang công khai vật lộn với economics của gói đăng ký tiêu dùng
    • Nếu định giá và chỉ số không phản ánh chi phí compute biến đổi thì coi như đang đi trong mù mờ
  • Chuyển dịch 2: định giá quyết định sản phẩm

    • Định giá theo mức sử dụng và theo kết quả vẫn còn ở giai đoạn đầu, và mô hình lai (phí tháng thấp + mức sử dụng + phần vượt mức) nhiều khả năng sẽ là hình thái cuối của đa số sản phẩm AI
    • Mô hình giá truyền đạt cho người dùng định nghĩa về thành công — nó phải khớp với unit economics nền tảng; nếu lệch nhau thì sẽ hoặc bào mòn biên lợi nhuận hoặc bóp nghẹt tăng trưởng (hoặc cả hai)
    • “AI query không giới hạn với giá 20 USD/tháng” và “0,99 USD cho mỗi kết quả thành công” không chỉ khác nhau ở mô hình giá mà còn là hai sản phẩm hoàn toàn khác nhau từ góc nhìn người dùng
      • Cách thứ nhất là “cứ tự do thử nghiệm, chi phí học hỏi do chúng tôi gánh”
      • Cách thứ hai là “chỉ khi bạn thắng thì chúng tôi mới thắng”
    • Trước đây phần lớn PM không cần suy nghĩ quá sâu về định giá, nhưng PM native AI phải coi định giá là trọng tâm của thiết kế sản phẩm
    • Không như tính năng SaaS truyền thống, tính năng AI không rẻ để chạy — một tính năng AI đắt đỏ nhưng không tạo ra nhiều giá trị cho người dùng có thể phá hỏng toàn bộ
  • Chuyển dịch 3: thử nghiệm không còn là chỉ số phù phiếm

    • Phát triển sản phẩm dựa trên AI khiến tốc độ triển khai tăng bùng nổ — chi phí phát hành tính năng sụp đổ
    • Nếu phát hành nhanh hơn mà không thực hiện thử nghiệm thực sự thì đó là “vibe-stuffing” — thêm tính năng chỉ vì có thể, chứ không có bằng chứng
      • Phần lớn tính năng không tạo ra giá trị, trong khi lại làm phình to sản phẩm và codebase, đồng thời tăng tải nhận thức cho người dùng
    • Mỗi tính năng AI đều phát sinh chi phí gọi liên tục mỗi lần được dùng — suy luận không miễn phí
      • Sự phình to do vibe-stuffing không chỉ là độ phức tạp đơn thuần mà là một loại thuế tăng theo lãi kép theo mức sử dụng
      • Sự cồng kềnh của sản phẩm trong thời đại AI là kẻ giết biên lợi nhuận
    • Thử nghiệm vững chắc là tuyến phòng thủ duy nhất, và giá trị của Lean Analytics thậm chí còn tăng lên
      • Kỷ luật trong việc chọn chỉ số, viết giả thuyết, pressure test và quyết định hành động tiếp theo là điểm khác biệt giữa đội ngũ biết học hỏi và đội ngũ chỉ biết phát hành
    • Một bộ lọc hữu ích: với mọi thử nghiệm, hãy ghi lại giả thuyết và tiêu chí ra quyết định trước khi phát hành — nếu không thì đó không phải thử nghiệm mà chỉ là một bản phát hành
    • Cần đo: số thí nghiệm mỗi quý, giả thuyết được ghi lại trước khi phát hành, số tính năng bị khai tử dựa trên dữ liệu, chi phí trên mỗi tính năng đang vận hành (không chỉ có được dùng hay không mà còn có biện minh được chi phí vận hành hay không)
  • Mật độ giá trị (Value Density)

    • Nguyên tắc xuyên suốt ba thay đổi của mô hình kinh doanh: cách diễn đạt của Ben Murray (The SaaS CFO) — “Nếu SaaS xoay quanh hiệu quả biên lợi nhuận, thì AI xoay quanh mật độ giá trị, tức tối ưu hóa lượng output, năng suất và lao động được thay thế trên mỗi 1 USD compute”
    • Báo cáo tháng 1/2026 của ICONIQ: ở các công ty AI B2B đang trong giai đoạn scale, suy luận chiếm 23% doanh thu; biên lợi nhuận gộp AI trung bình năm 2026 là 52% (tăng từ 41% năm 2024, nhưng vẫn thấp hơn SaaS trưởng thành ở mức 70~90%)
    • Bessemer: biên lợi nhuận gộp của các công ty AI-first ở mức 50~60%
    • Jason Lemkin: “Càng tăng trưởng thì càng cần nhiều suy luận hơn, và không thể cắt giảm nếu không làm chất lượng sản phẩm đi xuống”
    • Ba tỷ lệ để đo mật độ giá trị (biến động độc lập với nhau):
      • Chi phí cung cấp cho mỗi tác vụ — cần bao nhiêu chi phí token và compute để tạo ra một kết quả thành công
      • Doanh thu thu được trên mỗi 1 USD compute — mức thu có đủ bù chi phí biến đổi và biên lợi nhuận hay không
      • Giá trị chuyển giao cho người dùng trên mỗi 1 USD compute — chỉ số mà phần lớn đội ngũ bỏ qua; phải đo cả ba thì việc chẩn đoán mới hiệu quả

Tương lai: con người rời khỏi vòng lặp

  • “Build-too-much” là overfitting mới

    • Việc xây dựng trở nên quá dễ, kéo theo rủi ro phát hành nhiều hơn mức người dùng có thể hấp thụ, hoặc nhiều hơn mức dữ liệu thực sự hậu thuẫn
    • Alistair Croll: AI đã loại bỏ ma sát vốn từng buộc người ta phải xóa bớt — code cũ tồn tại vì chi phí viết lại, tính năng cũ tồn tại vì chi phí xây mới, nhưng giờ thì không còn gì được dọn dẹp nữa
      • Fallback tích tụ thành những “bức tường chịu lực vô hình”, còn các bài test do AI tạo ra thì được tối ưu để tự vượt qua chứ không phải để xác minh hành vi mong muốn
      • “Việc xóa bỏ có cảm giác rủi ro hơn giữ lại, và khi không còn ma sát thì mọi thứ đều ở lại”
    • PM nào đo lường việc xóa bỏ cẩn thận như việc bổ sung sẽ là người chiến thắng
  • Khi tác nhân là người dùng

    • Khi tác nhân Claude dùng sản phẩm thay con người mà không có UI — ai mới là người dùng, ý nghĩa của activation, độ dài phiên và engagement đều trở nên mơ hồ
    • Hành động thực dụng: đo lường riêng cohort lưu lượng tác nhân — dùng chuỗi user-agent, mẫu API... để phân biệt giữa “con người điều khiển UI” và “tác nhân gọi API”
      • Hành vi khác nhau, tiêu chuẩn thành công khác nhau, và nếu trộn vào một chỉ số thì cả hai phía đều cho ra câu trả lời sai
    • Khái niệm HX (Harness Experience) của Rob May: nếu 30 năm qua UX giúp con người nhấp đúng nút, thì tác nhân tự trị sẽ bỏ qua toàn bộ điều đó
      • “Không phải funnel bị hỏng mà là nó trở nên không còn liên quan
      • HX là lớp thiết kế dành cho con người để điều phối, tin cậy và kiểm toán cả một đội tác nhân — người dùng không còn là tài xế mà là đạo diễn
      • Thay vì đo click và conversion, hãy đo kết quả, giám sát và can thiệp
  • Khả năng được khám phá (Discoverability) và tái sử dụng (Reuse)

    • Hai vấn đề, một nguyên nhân gốc: AI không thuộc sở hữu của bạn quyết định sản phẩm có được dùng hay không
    • Khả năng được khám phá: khi người dùng nói với ChatGPT “hãy giúp tôi lên kế hoạch du lịch Mexico”, ChatGPT sẽ chọn giữa Expedia, Booking và Kayak — AI chứ không phải người dùng là bên chọn công cụ
      • Suốt 30 năm, phân phối là làm sao để con người tìm thấy và chọn bạn; nhưng trong thế giới tác nhân, bạn đang cạnh tranh để lọt vào logic lựa chọn của AI
    • Tái sử dụng: ngay cả khi người dùng trả phí Canva và cài ứng dụng ChatGPT, nếu họ yêu cầu thiết kế thông qua ChatGPT thì mỗi lần AI sẽ quyết định có gọi Canva hay không
      • Dù bạn “sở hữu” khách hàng, điều đó không có nghĩa bạn sở hữu khoảnh khắc giá trị thực sự được tạo ra — một rủi ro nền tảng mới
    • Cần theo dõi: khoảng cách giữa “người dùng sở hữu hoặc trả tiền cho sản phẩm” và “người dùng mà AI thực sự gọi đến”
      • Một thuê bao trả phí mà AI không gọi trong 30 ngày còn rủi ro hơn thuê bao không tự đăng nhập trực tiếp
  • Sản phẩm tác nhân với tác nhân

    • Khi sản phẩm là một mạng lưới tác nhân cộng tác với tác nhân của người khác — ý nghĩa của OMTM, stickiness và churn hiện vẫn chưa rõ ràng
    • Cả bốn bước của mô hình Hooked giờ đều gắn với những câu hỏi mà 5 năm trước chưa từng tồn tại:
      • Trigger nghĩa là gì khi AI là bên kích hoạt, action nghĩa là gì khi AI là bên hành động, làm sao thưởng cho một thực thể không trải nghiệm phần thưởng, và khái niệm đầu tư áp dụng ra sao với các hệ thống либо không có ký ức về vòng lặp trước, либо có ký ức hoàn hảo

Những việc nên bắt đầu ngay hôm nay

  • Kiểm tra chỉ số tương tác: Đừng hỏi "mức độ tương tác có tăng giảm không" mà hãy hỏi "thời gian của người dùng đang được dùng vào việc gì" — thời gian vật lộn là thất bại được ngụy trang thành tương tác
  • Thêm góc nhìn chất lượng theo cohort: Đo riêng chất lượng đầu ra của người dùng mới và power user — khoảng cách có thể lớn hơn dự kiến và chỉ ra chính xác điểm cần cải thiện trong onboarding
  • Kiểm tra lợi nhuận gộp trên mỗi người dùng hoạt động: Dựa trên người dùng hoạt động chứ không phải người dùng trả phí — dashboard hiện tại có thể không cho biết những người dùng tốt nhất là tài sản tốt nhất hay khoản nợ lớn nhất
  • Bắt đầu đo lường riêng lưu lượng agent: Dù hiện tại mới là 2%, vẫn cần thiết lập đường cơ sở trước khi hình thái lưu lượng thay đổi
  • Xây dựng bộ eval harness: Nếu không thể đánh giá một cách có hệ thống liệu AI có thực hiện đúng công việc mong muốn hay không, thì đó không phải sản phẩm mà là "vibes"
  • Đánh giá cách xây dựng tính năng: Kiểm tra xem có đang chạy các thử nghiệm nghiêm ngặt hay đang giết chết sản phẩm bằng cách nhồi nhét theo kiểu vibe stuffing

Chưa có bình luận nào.

Chưa có bình luận nào.