- Tính đến tháng 9 năm 2025, các mô hình AI mạnh mẽ như Claude Opus 4.1, GPT-5, Nano Banana đã xuất hiện, mở ra thời kỳ hoàng kim của phát triển phần mềm
- Trên nền bối cảnh AI hiện tại, bài viết đề xuất 28 công cụ AI mang tính đột phá tuy chưa thực sự tồn tại nhưng rất đáng mong đợi
- Các ý tưởng được đề xuất bao trùm nhiều lĩnh vực như năng suất cá nhân, phát triển mã nguồn, chăm sóc sức khỏe, sản xuất nội dung
- Điểm chung được nhấn mạnh là khả năng nhận biết ngữ cảnh, cá nhân hóa theo người dùng, và cải thiện thông qua học tự động cùng vòng lặp phản hồi
- Thay vì các agent phổ thông ngày nay, bài viết đề xuất khái niệm AI agent chuyên biệt cho một mục đích duy nhất cùng một marketplace nơi có thể trao đổi chúng
28 công cụ AI được đề xuất
1. Ứng dụng camera dựa trên Nano Banana
- Ứng dụng biến ảnh iPhone bình thường thành ảnh như được chụp bằng Leica
2. Agent tự động thêm chế độ sáng/tối
- Tự động thêm hỗ trợ light mode, dark mode và theme tùy chỉnh cho mọi dự án frontend
- Dùng vision để kiểm tra các thay đổi UI và chỉnh sửa lặp lại dựa trên UI đã render
3. Agent dịch ngược và debug mã bị làm rối
- Dịch ngược và debug mã đã minify thành codebase có thể đọc hiểu được
- Cần một vòng lặp code-debug mạnh mẽ
4. Bản hybrid giữa ứng dụng Strong và ChatGPT
- Mô hình truy cập dữ liệu tập luyện để đưa ra gợi ý cải thiện và coaching
- Có thể chat với mô hình biết ngữ cảnh chi tiết, bao gồm cả thời gian giữa từng hiệp tập
5. Công cụ gợi ý nội dung
- Phân tích lịch sử duyệt web để xác định các bài blog hay bài báo được đọc lâu nhất
- Mỗi đêm tìm trên web những nội dung nên đọc và gửi bản tổng hợp liên kết vào buổi sáng
- Cải thiện bản tổng hợp ngày hôm sau nhờ phản hồi về gợi ý tốt/xấu
6. Ứng dụng chat theo dõi calo
- Ứng dụng chat dựa trên cơ sở dữ liệu dinh dưỡng
- Giảm tối đa nỗ lực nhận thức cần thiết để ghi lại bữa ăn
7. Ứng dụng tối giản để viết nội dung dài
- Mô hình tô sáng các đoạn văn và để lại bình luận ở lề
- Có thể đặt nhiều "persona" khác nhau để rà soát nội dung đã viết
8. Agent tạo agent AI chuyên môn
- Khi nhận mô tả công việc như "hãy tạo agent dịch ngược code", nó sẽ tự động tạo agent siêu chuyên biệt
9. Trình đọc ebook tối giản
- Trong lúc đọc ebook, khi tô sáng một đoạn, mô hình sẽ giải thích sâu hơn ở bên cạnh
- Nhập vai persona của tác giả
- Phải mang cảm giác như phần mở rộng của cuốn sách, chứ không phải một phiên chat riêng biệt
10. Agent Deep Research suy luận trong nhiều ngày
- Có thể đưa vào những truy vấn cực kỳ phức tạp
- Tạo hàng trăm sub-agent và suy luận trong 3 ngày rồi mới trả về phản hồi
11. Ứng dụng làm phim kiểu paint-by-number
- Brainstorm ý tưởng phim ngắn và mô hình tạo storyboard chi tiết
- Người dùng chỉ cần quay từng cảnh trong storyboard bằng smartphone
- Đóng vai trò như bánh phụ cho quá trình làm phim
12. Ứng dụng quay màn hình và tóm tắt ngữ nghĩa
- Dùng mô hình cục bộ để tạo bản tóm tắt ngữ nghĩa chi tiết về mọi việc làm trên máy tính mỗi ngày
- Cung cấp làm ngữ cảnh cho ứng dụng chat: "Hôm qua mình quên trả lời ai nhỉ?"
- Tác giả đã dùng Rewind suốt 1 năm nhưng không hữu ích như kỳ vọng
13. Bộ lọc ngữ nghĩa cho Twitter/X/YouTube
- Có thể viết các bộ lọc mở như "ẩn các tweet có khả năng khiến mình bực bội"
- Loại bỏ nội dung dễ gây tức giận khỏi feed
- Ta định hình chính mình bằng cách định hình feed
14. Agent tạo giáo trình tùy chỉnh cho chủ đề ngách
- Các yêu cầu như "Tôi muốn học mọi điều chúng ta biết về khoa học của tiến bộ"
- Tìm trên web nhân vật, blog, video YouTube, essay, giáo trình
- Đọc toàn bộ nội dung và cung cấp giáo trình dẫn dắt từ người mới bắt đầu đến chuyên gia
15. Công cụ gợi ý sách thực sự tốt
- Trước tiên cho làm bài quiz về những gì đã đọc, mục tiêu và kiểu đọc yêu thích
- Khi đã biết đủ nhiều thông tin, một agent khác sẽ mô phỏng người dùng sẽ nghĩ gì về đề xuất của agent chính
- Chỉ đưa ra những cuốn sách có xác suất rất cao là người dùng sẽ thích
16. Công cụ tìm kiếm ngữ nghĩa cho TikTok và Instagram Reels
- Tiếp cận thông tin hữu ích đang bị mắc kẹt trong video ngắn
- Cần chức năng tìm kiếm có thể truy vấn được
17. Ứng dụng fitness cho giấc ngủ
- Tích hợp dữ liệu từ Apple Watch (nhịp tim, VO₂), Eight Sleep, Oura Ring và ứng dụng tập luyện
- Đưa ra khuyến nghị thực tế để cải thiện giấc ngủ và khả năng phục hồi
- Chủ động nhắn: "HRV của bạn tuần này đã giảm, liệu bạn có đang tập quá sức không?"
18. Thư viện component quy mô lớn
- Được thiết kế để render ngay trong giao diện chat
- Các thư viện hiện tại có primitive ở mức quá thấp
- Ưu tiên widget cấp cao hơn là khả năng tùy biến
19. Trợ lý giọng nói tối giản cho Apple Watch
- Dành cho những câu hỏi quá phức tạp với Siri nhưng phù hợp với ChatGPT
- Trả lời ngắn gọn chỉ vài từ
20. Ứng dụng viết có gợi ý danh sách đọc
- Tìm kiếm web về chủ đề đang viết để dựng danh sách tài liệu có thể hữu ích
- Ứng dụng viết không được viết thay người dùng
21. Ứng dụng chạy bộ
- Tạo kế hoạch cá nhân hóa, theo dõi pace chạy và nhịp tim
- Lặp lại và điều chỉnh chương trình tập luyện dựa trên dữ liệu thực tế
22. Siêu ứng dụng chỉnh sửa ảnh Nano Banana
- Cung cấp hàng trăm template mà không cần viết prompt
- Thử nhiều kiểu tóc, dự đoán con với bạn đời sẽ trông ra sao, biến mình thành The Rock, v.v.
23. Tìm kiếm video YouTube theo phong cách Same.energy
- Nhập URL để tìm những video có vibe tương tự
- Thuật toán YouTube hiện chỉ tập trung vào việc tối đa hóa mức độ tương tác của người dùng trung bình
24. Thiết bị kiểu Sony Walkman cho trẻ em
- Thiết bị ưu tiên giọng nói có thể đặt câu hỏi cho LLM
- Tập trung vào giải thích và hoàn toàn không có màn hình
- Nếu ưu tiên offline thì càng tốt
25. Công cụ tìm kiếm tiểu sử
- Truy vấn dựa trên bảng câu hỏi về vấn đề hiện tại, giai đoạn cuộc đời, lĩnh vực đang đối mặt
- Trả về các chương trong tiểu sử/tự truyện của những nhân vật vĩ đại trong lịch sử từng xử lý tình huống tương tự
26. Agent kiểm toán việc tiêu thụ nội dung qua quay màn hình
- Quan sát việc sử dụng máy tính và smartphone
- Kiểm toán nội dung đã tiêu thụ mỗi ngày
- Screen Time không đủ cụ thể
- Cần biết giá trị dinh dưỡng chính xác của các token mà ta đang tiêu thụ
27. Marketplace AI agent cho các tác vụ ngách
- Các agent được thiết kế cho use case cụ thể có thể sẽ tốt hơn agent đa dụng
- Danh mục agent siêu chuyên biệt cho các tác vụ ngách như tìm căn hộ cho thuê ở San Francisco
- Cần hàng chục nghìn agent có thể dùng qua web hoặc API
28. Tính năng xin phê bình từ nhà văn nổi tiếng
- "Hemingway sẽ nói gì về bài blog này?"
- Xác định những phần ông ấy thấy khó hiểu và những phần ông ấy thích
2 bình luận
Mục 2, 3 mà được tự động hóa thật thì quá tốt.
Có vẻ đây là một trong những công việc lặp đi lặp lại khá phiền vì cứ phải thêm từng cái một.
Ý kiến trên Hacker News
Tôi nghĩ cần thực sự thận trọng với ý "24. đưa cho trẻ một thiết bị kiểu Sony Walkman để chúng có thể hỏi LLM"
Tôi nghĩ có thể cho kết quả tốt hơn rất nhiều so với hỏi giáo viên ở trường
Hai ngày trước tôi đã nhờ ChatGPT giải thích hệ thống giá trị hàng (
place-value system) theo cách mà một đứa trẻ sáu tuổi có thể hiểu được. Nhưng nó lại nhầm lẫn giữa khái niệm giá trị theo vị trí và giá trị của chữ số nên đã giải thích sai. Tôi nhận ra lỗi đó và ChatGPT đã xin lỗi, nhưng nếu đứa trẻ tự hỏi thì có lẽ nó đã không nhận ra.Tôi cứ nghĩ xem con mình sẽ tin bao nhiêu thông tin sai từ kiểu thiết bị này là thật
Về mục 19, vài tuần trước tôi đã tự làm thử bằng iOS Shortcut
Điều tôi cảm nhận từ nhiều ý tưởng/bài viết là họ không "thinking with portals" về LLM. Chúng ta có công nghệ ở mức "portal gun" (ít nhất là cách nó được quảng bá), nhưng lại chỉ dùng nó như một cánh cửa tốt hơn mà thôi
Điều LLM có thể làm rốt cuộc chỉ là mở rộng văn bản theo mạch logic. Khả năng ứng dụng thì rộng, nhưng trên thực tế khó vượt quá một trình soạn thảo văn bản cao cấp. Ví dụ nếu muốn dùng vào biên tập video, bạn phải tạo ra một ngôn ngữ kịch bản, rồi còn phải đồng bộ tính năng với trình biên tập. Với các công ty lớn như Adobe thì giá trị so với nguồn lực bỏ vào khá mơ hồ, còn startup thì phải cạnh tranh lâu dài với Adobe về tính năng và khóa chặt người dùng. Cả hai bên đều không có nhiều lợi ích trừ khi LLM thực sự mang tính cách mạng. Hơn nữa LLM không thể trực tiếp nhìn thấy đầu ra video, và ở thời điểm hiện tại chỉ mới ở mức "tàm tạm"
Tôi đồng ý với góc nhìn này. Nếu có tài liệu nào đáng tham khảo về "thinking with portals" thì có thể chia sẻ không
Nếu có ví dụ nào về cách tư duy kiểu cổng dịch chuyển, mong là có thể chia sẻ ngắn gọn và dễ hiểu
Về mục 22, tôi muốn có một công cụ phân tích lịch sử duyệt web của mình để nhận ra kiểu blog/bài viết mà tôi đọc lâu nhất, rồi mỗi tối tìm ra những nội dung gợi ý mà tôi vẫn chưa xem
ChatGPT Pulse tồn tại theo hướng tương tự. Dịch vụ này không dùng lịch sử trình duyệt mà dùng lịch sử ChatGPT, nhưng với người hay dùng ChatGPT thì đây có thể là gợi ý đáng tin hơn
https://openai.com/index/introducing-chatgpt-pulse/
Tôi nghĩ phần lớn ý tưởng được đề xuất trong bài này thực chất chỉ là mong muốn có UI/UX tốt hơn một chút đặt trên LLM nền tảng
Tôi cảm thấy có một sự nhầm lẫn phạm trù cơ bản trong kiểu suy nghĩ này
Ví dụ có tính năng kiểu "Hemingway sẽ nhận xét bài viết của tôi thế nào?", nhưng thực ra đó là câu trả lời do AI tạo ra chứ không phải nhận xét thật của Hemingway
Nếu hỏi 100 mô hình thì sẽ có 100 câu trả lời khác nhau, và cách tư duy hay tính cách thực sự của Hemingway không thể được phục dựng trọn vẹn chỉ từ vài trăm nghìn từ trong các tác phẩm của ông.
Rốt cuộc đây là vấn đề "liệu nó có thể nghe hợp lý như thể chính người đó nói không"
Lý do chúng ta muốn nghe đánh giá từ người nổi tiếng là vì góc nhìn của một con người thật đang sống. Sự bắt chước của AI giống như ăn ảnh chụp chiếc sandwich thay vì sandwich thật
Có điều gì đó khiến tôi bất an khi nhiều người không thể vạch ra ranh giới rõ ràng hơn với ảo tưởng này
Đồng ý 100%
Nhưng khi đọc bình luận này tôi lại nghĩ tới holodeck trong Star Trek TNG. Ở đó họ tái hiện Einstein, Freud và các nhân vật nổi tiếng khác, và với tư cách khán giả, kể cả khi mới 15 tuổi tôi cũng không nghĩ "đây chỉ là câu trả lời ngẫu nhiên do máy tính tạo ra"
Thực tế có những tập phim cho thấy việc tái hiện người thật chỉ từ ghi chép đã mắc sai lầm (https://www.imdb.com/title/tt0708682/), và về sau cũng lộ ra sự khác biệt lớn đến mức nào (https://www.imdb.com/title/tt0708720/)
Tóm lại là,
Bài này khiến tôi suy nghĩ khá nhiều thứ
Có thể giải thích đơn giản vì sao không nhất thiết cần AI Hemingway. Thực ra khoảng 10 năm trước đã có những hướng dẫn viết tốt như hemingwayapp rồi https://hemingwayapp.com/
Nó dùng các quy tắc đơn giản để chỉnh ngữ pháp và gợi ý chuyển sang cách diễn đạt đơn giản hơn. Thậm chí việc nó không tự động viết lại có khi còn tốt hơn cho việc tự học
Nhìn vào nhiều ý tưởng như "ứng dụng chỉnh ảnh siêu nhỏ gọn như quả chuối, cung cấp hàng trăm mẫu không cần prompt...", tôi thấy rốt cuộc đó là mong muốn của con người được sống lười hơn bằng cách nào đó. Mấy thứ như "Hemingway sẽ nghĩ gì" cũng cho tôi cảm giác tương tự
Cốt lõi là "liệu đây có phải là câu trả lời nghe hợp lý theo kiểu người đó đến mức đánh lừa được con người không", và thật ra bản thân điều đó cũng hữu ích
Nếu con người nhận thức được sự đánh lừa ấy, ta gọi đó là
make-believe, hoặc sự đình chỉ hoài nghiMỗi khi chúng ta nhập vai ai đó, hoặc cố suy nghĩ từ một góc nhìn khác, ta đều trải qua quá trình này. Khi cố học từ ghi chép về người có thật hoặc từ nhân vật tiểu thuyết cũng vậy
Tôi lại nghĩ điều ngược lại mới đúng với ý "muốn nghe Steve Jobs/Hemingway đánh giá vì đó là con người thật"
Trên thực tế, đối tượng đối thoại không cần là con người thật, mà cá tính được tóm lược của một người nổi tiếng hay một nhân vật như ta tưởng tượng mới quan trọng hơn. Hầu như chẳng mấy ai bám chặt vào con người thật của họ
Chính "Hemingway người nổi tiếng" đã được thần thoại hóa mới hấp dẫn hơn. Thậm chí còn hữu ích và thú vị hơn bản gốc thật
Vì vậy, giống như ví dụ Star Trek TNG, tôi cho rằng kiểu mô phỏng nhân vật ảo như vậy thực ra hoạt động đúng như mục đích ban đầu
Feynman từng nói rằng "nguyên tắc đầu tiên của khoa học là đừng tự lừa dối chính mình", và tôi nghĩ điều này cũng áp dụng cho đầu ra của LLM
Thật sự rất thú vị
Tất cả chúng ta đều đã thấy rất nhiều bản demo trong danh sách này hoặc những công nghệ tương tự, và đã có rất nhiều startup đổ hàng trăm triệu đô trong nhiều năm để làm ra sản phẩm
Thế nhưng trên thực tế gần như không thấy sản phẩm nào thật sự dùng được, và những thứ gặp trong đời thường lại không hoạt động tốt như demo
Tôi rất tò mò rốt cuộc chuyện gì đang xảy ra.
Ý tôi là, có phải sản phẩm thực ra đã tồn tại nhưng gần như chẳng ai dùng, hay là vì dùng những mô hình đủ tốt thì quá đắt, hay đơn giản là làm một bản demo hào nhoáng dễ hơn rất nhiều so với làm một sản phẩm thật... Tôi tò mò về nhiều khả năng khác nhau
Khi nói chuyện với một agency chạy quảng cáo cho ứng dụng fintech, tôi nghe rằng phải đốt cỡ 20.000 USD tiền quảng cáo mỗi tháng trong 3 tháng mới hiểu được cách nó vận hành, rồi sau đó CAC mới giảm và mới có được người dùng mục tiêu
Ngay khi tắt quảng cáo, độ nhận biết về sản phẩm lại biến mất và người dùng mới cũng ngừng đến. Khi đó gần như không còn cách nào để cho họ biết sản phẩm này tồn tại
Khá nhiều ý tưởng kiểu này đòi hỏi phải nắm được sở thích, thói quen, cách giao tiếp, lịch trình và dữ liệu sức khỏe của người dùng
Apple có thể thực sự có lợi thế lớn ở mảng này.
Điện thoại và đồng hồ biết nhiều thông tin cá nhân nhất, nên Apple có thể kết hợp thông minh nhiều lớp ngữ cảnh với LLM trên tiền đề bảo vệ quyền riêng tư
Tôi bấm vào liên kết đó rồi thấy thất vọng vì nó không phải công cụ thật, mà chỉ giống một danh sách ý tưởng app chẳng liên quan mấy
"Một thiết bị kiểu Sony Walkman để trẻ em có thể hỏi LLM bằng giọng nói"
Không khớp hoàn toàn 100%, nhưng sản phẩm này https://www.aliexpress.com/item/1005009196849357.html khá giống.
Nó không hoạt động ngoại tuyến, nhưng chỉ to hơn quả bóng bàn một chút
Tôi cho các cháu mình (5 và 3 tuổi) làm quen trong 2 phút, rồi chúng bắn ra vô số câu hỏi như "Kể cho con nghe chuyện về kỳ lân Bob", "Chó và khỉ có thể làm bạn không?", và tất cả đều nhận được câu trả lời nghe khá ổn chỉ sau vài giây
Tôi nghĩ đến Giáng sinh kiểu sản phẩm này sẽ được tích hợp vào đồ chơi, và nếu có thì tôi sẽ mua ngay