Ask HN: Khi nào bạn nhìn GenAI và cảm thấy “ôi, to chuyện rồi”?
(news.ycombinator.com)- Một thread chia sẻ những trải nghiệm cụ thể về lúc ban đầu xem DALL-E và ChatGPT như trò đùa lỗi thời, nhưng sau khi dùng thực tế đã bị sốc khi nhận ra giới hạn năng lực của chúng
- Trường hợp được yêu thích nhất là reverse engineering firmware của phần cứng cũ/đã bị bỏ đi, như kinh nghiệm hồi sinh synthesizer, piano, Firestick bằng Claude/GHIDRA
- Ngoài lập trình, còn có nhiều ví dụ ở các lĩnh vực không chuyên dùng LLM để giải quyết vấn đề đời thường như sửa đồ gia dụng, kiểm tra bất động sản, kiện tụng pháp lý, chẩn đoán HVAC
- Một số người cũng kể lại những khoảnh khắc "oh shit" theo hướng tiêu cực như chất lượng mã giảm, ảo giác, sự tin tưởng mù quáng không kiểm chứng, lo ngại nghề nghiệp biến mất
- Các cú sốc của mỗi người rơi vào những bước ngoặt khác nhau theo từng thời điểm như lúc ChatGPT ra mắt (2022), GPT-2/GPT-3, tool calling, agent, v.v.
Reverse engineering firmware và phần cứng
- Để thay thế phần mềm đã ngừng hỗ trợ cho synthesizer Alesis QS8.1 từ thập niên 90, có người đã phân tích bằng GHIDRA các lệnh sysex và giao thức mã hóa wave không có tài liệu, rồi hoàn thành bản demo chạy được chỉ sau một đêm
- Sau khi piano Kawai CA49 bị brick vì firmware sai, Claude đã decompile APK Android để tìm khóa mã hóa hardcode, giải mã firmware và khôi phục máy trong 1 giờ bằng script flash qua Bluetooth
- Phân tích mã hóa Blowfish của The Complete New Yorker DVD bằng GHIDRA để ánh xạ thông tin xác thực rồi tái hiện bằng script Python, chuyển toàn bộ tệp sang PDF thông thường
- Lấy source kernel cho Amazon Firestick thế hệ đầu mà không cần public root exploit, rồi dùng "primitive ghi-zero vào kernel FBUF/VCHIQ" để vá bộ nhớ kernel đang chạy, root vĩnh viễn và debloat thành công
- Chỉ với binary C++ đã biên dịch của vendor và một đoạn network capture ngắn, có người reverse engineering giao thức độc quyền bằng NSA Ghidra disassembler và mô tả cảm giác như "bị giáng xuống làm QA không kỹ thuật"
-
Các ý kiến liên quan
- Data moat của SaaS vốn được hình thành nhờ khó tích hợp và khó di chuyển đang dần biến mất
- Dùng Claude Code để reverse engineering MCP của một SaaS bị giấu sau gói enterprise từ internal API, rồi nhanh chóng tạo ra MCP có nhiều tính năng hơn bản chính thức
- Claude ít phụ thuộc vào tên biến hơn con người nên giảm nhu cầu đổi tên/typedef
Giải quyết vấn đề đời thường và lĩnh vực không chuyên
- Vào kỳ nghỉ năm 2025, một lò furnace bị hỏng được Gemini chẩn đoán qua video; người dùng quay tay quạt xả để máy chạy lại, nhưng trong bình luận có cảnh báo về nguy cơ carbon monoxide do vô hiệu hóa cơ chế an toàn của quạt xả
- Tác giả giải thích rằng chỉ hỗ trợ khởi động do vấn đề ổ trục chứ không phải bypass, và thiết bị theo dõi carbon monoxide không hề báo động
- Khi điều hòa mất lạnh, ChatGPT chẩn đoán qua ảnh và hướng dẫn thay tụ điện giá $25, giúp tự sửa với chi phí chỉ bằng 1/4 phí gọi dịch vụ chẩn đoán
- Vấn đề máy sấy gas không nóng được Gemini chỉ ra vị trí thermal fuse trong ảnh và còn cung cấp link linh kiện; cuối cùng được xử lý bằng cầu chì $5 và vệ sinh ống thông gió
- Khi mua bất động sản, có người đưa ảnh Zillow và số serial thiết bị gia dụng để tạo báo cáo kiểm định nhà; kết quả AI phát hiện nguy cơ ngập ở vùng trũng, mạch receptacle lẫn lộn, lớp siding bị vênh mà inspector trả phí $750 đã bỏ sót
- Tuy vậy, cũng có ý kiến hoài nghi liệu chỉ từ ảnh có thể xác định được chúng có cùng một mạch hay không
- Khi nhãn model của máy bơm hồ koi đã bị xóa, AI xác định model từ ảnh và đo chiều dài (11 inch = 4500, 9 inch = 2500), giúp tự thay với giá $109 thay vì báo giá $700
- Trong vụ kiện lừa đảo ngân hàng, có người đối chiếu chéo ChatGPT, Grok, Claude và Gemini để theo đuổi phản tố hoàn toàn bằng AI, dù cũng có cảnh báo nên hỏi luật sư và lưu ý log chat không có đặc quyền bảo mật (có thể bị subpoena)
Chuyển đổi workflow lập trình và phát triển
- Khi bản cập nhật firmware máy in Brother khiến trang CSV chuyển thành HTML, chỉ với một thư mục chứa một file HTML tĩnh và Go "hello world", sau một lần
/initđã tự động viết Prometheus exporter bằng Go, thậm chí suy luận cả IP mặc định và cách parse metric - 70.000 dòng PL/SQL của ứng dụng web Oracle Apex được nén thành 700 dòng yêu cầu nghiệp vụ dạng Markdown chỉ trong 15–20 phút
- Ở một NGO nhỏ, một ứng dụng bị overengineer bằng NextJS, React và microservice đã được Claude viết lại 80% sang Django server-side rendering trong lúc chủ nhân đi ngủ, giúp giảm chi phí server và độ phức tạp
- ChatGPT Code Interpreter (2023.3) đã tải CSV vào Pandas, vẽ biểu đồ và xuất sang SQLite; được nhắc lại như "trải nghiệm đầu tiên trước khi khái niệm coding agent được đặt tên"
-
Trải nghiệm lập trình tiêu cực và hoài nghi
- Trường hợp AI tự động review PR bị ảo giác, khẳng định rằng một PR chỉ xóa code đã "thêm RPC mới" dù điều đó hoàn toàn không tồn tại
- Trường hợp đồng nghiệp bị loại khỏi dự án vì tạo ra hàng nghìn dòng slop, như đổi
assert status == 200thành== 500chỉ để test pass - Có quan điểm hoài nghi rằng nếu đặc tả mơ hồ thì code sẽ dài dòng hoặc thiết kế kém, nên mức tăng năng suất không lớn nếu xét theo chất lượng và khả năng mở rộng của dự án thực tế
- Có quan sát rằng từ Opus 4.6 → 4.7 → 4.8, năng lực ở các tác vụ nhỏ tăng lên nhưng "khả năng biết phải làm gì" lại tệ đi
Lĩnh vực phi lập trình, sáng tạo và nhận thức
- Khi cho Claude xem ảnh cây, nó nhận diện loài, chẩn đoán và còn hướng dẫn cách giâm cành; người dùng bị sốc vì "máy tính không còn chỉ nói về máy tính mà đang chẩn đoán cây cối"
- Suno đã soạn một bài hát với điệp khúc kiểu K-pop về chú chó của gia đình, khiến người dùng nghĩ lại về niềm tin rằng sáng tạo là thứ phân biệt con người và máy móc
- Khi tải lên tranh của chính mình (phác thảo giải phẫu), AI chỉ ra "vai tròn, phối cảnh sai, cơ delta không được thể hiện" rồi dùng script Python đánh tọa độ để gắn nhãn
- Trong thí nghiệm khoa học của con cái về điện từ học, cuộc gọi video với Gemini đã phát hiện chính xác lớp cách điện chưa được bóc ở đầu nối pin tốt hơn quan sát bằng mắt thường, từ đó giải quyết vấn đề
- Trong dự án làm emoji châm biếm cho các tổng thống Mỹ, AI gợi ý emoji quả anh đào cho Zachary Taylor (gắn với giai thoại chết vì ăn quá nhiều), tạo cảm giác cộng tác như đang workshop cùng nhau
Các bước ngoặt tiêu cực và đầy lo ngại
- Có người lo rằng phần còn lại của sự nghiệp sẽ là "làm việc cùng chứng loạn thần AI", khi đồng nghiệp gửi những PR khổng lồ toàn slop, nói rằng không cần review và dán log chat Claude trong lúc tỏ ra mất niềm tin vào kỹ sư con người
- Một góc nhìn cho rằng LLM khuếch đại năng lực của con người theo cả hướng tốt lẫn xấu, và sẽ làm tăng hành vi phản xã hội
- Có người phản ứng "chúng ta xong rồi" khi thấy một triển khai HTTP proxy trông có vẻ hợp lý và tự củng cố phán đoán của chính nó, nhưng thực ra hoàn toàn không an toàn vì không hiểu RFC
- Tại hackathon công ty, có người bị sốc khi thấy một nhóm định biến thành sản phẩm thứ đầu ra từ LLM mà không hề kiểm chứng, như thể họ tin bộ máy sinh văn bản này thực sự biết suy luận
- Có phê phán rằng lời thổi phồng của các CEO về việc "thay thế lao động trí óc trong 12–18 tháng" đã nâng kỳ vọng quá cao, trong khi thực tế đầy ảo giác và hướng dẫn kém tin cậy khiến người ta mất hứng thú
- Cũng có sự khó chịu trước việc cưỡng ép xây trung tâm dữ liệu bằng kiện tụng dù cư dân địa phương phản đối
- Với tính phi quyết định của LLM, có người đưa ra ví dụ tái hiện rằng ở câu hỏi như "số lượng chữ d trong các ngày trong tuần", Firefox ra 6 còn Chrome ra 7, tức là ngay cả tính nhất quán nội tại cũng không có
Sự đa dạng của các bước ngoặt theo thời điểm
- Việc Google Translate chuyển sang mạng nơ-ron năm 2016 khiến dịch Nhật–Anh lần đầu trở nên thực dụng, nhưng nhiều người vẫn cho rằng nó chưa dịch được meaning; rồi tới ChatGPT năm 2022 mới gây sốc với khả năng hiểu đại từ quy chiếu và ngữ cảnh đa nghĩa
- Có người xem công bố GPT-3 là một "bước nhảy chất lượng", còn chat hay tool calling về sau được đánh giá là tiến hóa mang tính kỹ thuật hơn là đột phá khoa học
- Có quan điểm xem GPT-2 năm 2019 và GAN là điểm chuyển từ "obviously fake sang sometimes real", còn sau đó phần lớn chỉ là cải tiến dần dần
- Khi ChatGPT ra mắt (2022.11.30), có người linh cảm đó là "sự kết thúc của thời đại lập trình viên truyền thống" và ngay ngày hôm sau thử vòng lặp coding agent đầu tiên
- Các khoảnh khắc nhận ra rằng "trí tuệ đã thực sự được mô hình hóa" cũng rất khác nhau, từ IMO huy chương vàng năm 2025, khả năng tạo câu hoàn toàn mới, cho tới tool calling
3 bình luận
Mình nghĩ việc nó giỏi ở những thứ mới và các tính năng ngày càng tốt hơn là một diễn tiến tất yếu, nhưng mỗi lần thấy chỉ nhờ làm một việc đơn giản mà chi phí bị tính lại khủng khiếp thì mình lại cảm thấy đúng là to chuyện rồi.
Quả thực có rất nhiều điểm đáng kinh ngạc ở phía phần cứng/firmware.
Có một phần cứng tôi nhận từ Kickstarter không có ứng dụng cho Mac, nên khi tôi đưa binary bản Windows và bảo nó phân tích,
Codex đã tạo một DLL giả chứa Windows API liên quan đến USB, chèn mã hooking vào, rồi bắt toàn bộ các thông điệp qua lại, sau đó dùng chính những thứ đó để làm ra một ứng dụng cho Mac gần như tương tự.
Điều tôi chỉ dẫn đơn giản chỉ là: "Phân tích bản Windows rồi làm cho tôi bản Mac".
Ý kiến trên Hacker News
jzemeocala: Tôi đã mua rất rẻ một cây Alesis QS8.1, loại piano số/synthesizer cao cấp từ thập niên 90, nhưng toàn bộ phần mềm liên quan đều đã quá cũ nên tôi chán ngấy việc phải dùng WINE mỗi lần
Vì vậy tôi định làm một bản thay thế hiện đại, đa nền tảng, gộp chức năng của nhiều chương trình lại với nhau; tôi nghĩ việc này sẽ rất khó vì giao tiếp gần như chỉ có lệnh SysEx, nhưng Claude đã hướng dẫn tôi phân tích phần mềm gốc bằng GHIDRA, và ngay trong đêm đó đã có bản demo chạy được, còn giờ thì tôi đang thêm tính năng mới
Khi OTA không hoạt động, nó còn giúp trích xuất và giải mã firmware của cây piano, rồi viết cả script flash để lập trình lại piano qua Bluetooth từ laptop, và trong vòng một tiếng thì cây đàn đã sống lại
Chỉ cần chút kiến thức là việc phân tích gần như bất kỳ giao thức nào và bẻ phần mềm trong vài giờ hoặc ít hơn đã trở nên quá đỗi tầm thường; điều này không lộ rõ vì trong ngành có rất nhiều bên liên quan không muốn câu chuyện này lan truyền công khai, nhưng tác động thì rất lớn
Không chỉ với phần cứng cũ mà ngay cả phần cứng mới, nhờ LLM/generative AI mà ngày càng có nhiều hoạt động khám phá việc vá, thay thế và phát triển firmware mới
[0] https://mforney.org/blog/2026-05-28-patching-my-guitar-amps-... [1] https://schwung.dev
SubiculumCode: Ngay từ đầu đã là vậy rồi
Nó là một kiểu game dungeon, mô tả căn phòng rồi để tôi chọn hành động; lúc đầu tôi tưởng dungeon được xây trên một cơ sở dữ liệu phức tạp nào đó
Nhưng khi tôi nói muốn ra ngoài thì nó dẫn tôi đến quán trọ, rồi tôi tán tỉnh cô phục vụ trong quán rượu, và chẳng bao lâu sau đã đến cảnh ngắm hoàng hôn trên đồng cỏ, lúc đó tôi thấy “ôi, tiêu rồi”
Cỗ máy dùng ngôn ngữ để đáp lại ngôn ngữ như thể đang mô phỏng sự thấu hiểu và trí thông minh, và tôi có cảm giác như lần đầu gặp người ngoài hành tinh mà lại biết ngôn ngữ của mình, nên thấy rằng thế giới sẽ không còn như trước nữa
monuszero: Vài năm trước, tôi đã dành một sprint một tháng để đưa chức năng lập kế hoạch chuyển động cho robot vào codebase, nhưng kết quả lúc nào cũng không vừa ý
Vì là một đội nhỏ nên chúng tôi vendor OMPL, tự làm caching và quản lý roadmap; tôi cũng biết rằng có thể song song hóa một phần thuật toán đang dùng bằng SIMD hoặc GPU kernel, nhưng vẫn lưỡng lự không biết có đáng để vật lộn với CUDA hay Metal/Accelerate hay không
Một buổi tối nọ khi đang nấu ăn, tôi đưa cho Opus 4.6 phần tổng quan tài liệu về planner cần thiết trong docs rồi bảo nó triển khai lại từ đầu một native-accelerated roadmap planner, và đến lúc nước luộc pasta sôi thì nó đã làm xong một bản triển khai biến thời gian lập kế hoạch vài giây của mã OMPL xuống còn vài trăm ms
Lúc đó tôi nhận ra giá trị kinh tế của thời gian chuẩn bị bữa tối giờ có thể so sánh với một công việc code tử tế kéo dài hai tuần, và những việc mà trước đây đầu tư thời gian vào là quá rủi ro hoặc quá xa xỉ nay trở thành lựa chọn đáng để cân nhắc
Với những đội nhỏ biết mình muốn gì và biết cách thiết lập để agent thành công, đây là một game changer hoàn toàn, còn các ông lớn hiện tại thì nên cẩn thận
andrewthornton: Vào kỳ nghỉ lễ năm 2025, lò sưởi nhà tôi bị hỏng, mà lịch sửa phải hai ngày sau mới đến nên trong nhà lạnh cóng
Tôi trèo lên gác mái, quay vài video cảnh lò sưởi cố khởi động rồi đưa cho Gemini, và nó chẩn đoán ra vấn đề ngay, bảo tôi quay chiếc quạt xả nhỏ trong lúc máy thử đánh lửa, thế là chạy được ngay
Tôi phải lặp lại vài lần cho đến khi thợ HVAC đến, nhưng như vậy là đủ để cầm cự
Người thuê nhà báo điều hòa không mát, tôi gọi cho công ty HVAC quen thì trợ lý giọng nói AI mới nhất trả lời, và trải nghiệm thật kinh khủng; họ nói văn phòng sẽ gọi lại nhưng rồi chẳng ai liên lạc
Cuối cùng tôi tự đến nơi, chụp ảnh bảng máy nén của dàn nóng rồi dùng ChatGPT để chẩn đoán; sau vài lượt hỏi đáp về các mục cần kiểm tra và mã chẩn đoán, nó còn hướng dẫn tôi đến mức sửa xong bằng cách thay một tụ điện giá 25 USD
Bình thường riêng phí tới kiểm tra nguyên nhân đã gần gấp bốn lần số đó, nên vì generative AI mà tôi mất niềm tin vào công ty HVAC, rồi cũng nhờ một generative AI khác mà trong một ngày đã tự sửa được
Tôi mở mặt sau, tải ảnh lên, và nó chỉ đúng vị trí cầu chì kiểu như “hình chữ nhật màu trắng phía trên dây màu xanh và đỏ”, rồi hướng dẫn cách kiểm tra; khi tôi đưa mã model máy sấy, nó còn tìm giúp cả link linh kiện cần mua
Cuối cùng nó nói rất có thể cầu chì đã đứt vì nhiệt không thoát ra được nên khuyên tôi vệ sinh ống thông gió; tôi làm sạch kỹ đường thoát khí và thay cầu chì 5 USD là máy hoạt động tốt
Có lẽ tôi đã không cần nó nếu tài liệu của IKEA không sơ sài đến vậy, nhưng cảm giác khá giống lợi thế mà một lập trình viên mới vào nghề có được
Chuyên gia hẳn sẽ cười chê cách tôi làm, nhưng họ thì đắt đỏ và khó cộng tác, còn tôi thì dù sao vẫn hoàn thành được công việc
Ngược lại, tôi không dùng AI cho công việc phát triển phần mềm, vì lo kỹ năng của mình sẽ bị mai một hoặc mình sẽ không học được cái mới một cách đúng đắn
shreddude: Gần đây Claude đã decompile firmware của chiếc camper van, tài liệu hóa giao diện CAN, rồi lập trình một mô-đun ESP32 để giao tiếp với các hệ thống tích hợp như nguồn điện, HVAC, đèn và bồn chứa
Kiểu tích hợp hệ thống nhúng này nằm ngoài chuyên môn của tôi, nhưng với vai trò Solution Architect lẫn các dự án cá nhân, tôi dùng Claude hằng ngày và đang làm được những dự án mà một mình tôi trước đây còn chẳng thể đụng tới, nên tôi khó mà hiểu được những người hoài nghi AI
Nếu dùng AI tạo sinh cho những việc trước đây mình không làm được thì nó là một công cụ đáng kinh ngạc, nhưng nếu dùng cho việc mình vốn đã giỏi thì chưa đến mức thay đổi cuộc chơi, với chuyên gia thì cùng lắm chỉ là một cú hích nhỏ
Công việc của nhiều người chính là làm những thứ mà họ là chuyên gia
Tuy vậy, điểm mấu chốt có lẽ là bạn phải vốn đã hiểu khá rõ mình đang nhìn vào cái gì
Bài toán nghìn tỷ đô mà AI giải quyết là gì?
loudmax: Đó là khi tôi tải torrent bộ trọng số 7GB bị rò rỉ từ Meta hồi đầu năm 2023 và chạy alpaca.cpp trên máy bàn
Tôi hỏi về Đế chế La Mã, nó trả lời bằng tiếng Anh; phần lớn là sai, nhưng cũng không tệ hơn những phỏng đoán của một sinh viên đại học Mỹ trung bình, và mức tự tin thì còn cao hơn nhiều
Điều cốt lõi là không phải các máy chủ hào nhoáng trong trung tâm dữ liệu khổng lồ của Google, mà chính CPU máy bàn của tôi đang trả lời câu hỏi tiếng Anh; việc câu trả lời có đáng tin hay không lúc đó không quá quan trọng
Có thể trò chuyện với CPU bằng tiếng Anh cho cảm giác gần như đang nói chuyện với một con chó
Chỉ trong 3 năm đã cải thiện 100 lần
jp57: Với tôi, đó là một khoảnh khắc rất đơn giản vào khoảng năm ngoái khi tôi tìm hiểu xem cần gì để kéo xe của con gái xuyên lục địa bằng xe tải
Ban đầu tôi hỏi ChatGPT từng câu nhỏ như với Google, nhưng rồi tôi chuyển sang hỏi kiểu “Tôi muốn kéo xe A bằng xe tải B từ C đến D, có những lựa chọn nào?”, và nó viết hẳn một bản báo cáo có bảng so sánh trailer/dolly, tính toán tải kéo, chi phí và mọi chi tiết liên quan
Lúc đó tôi nghĩ “cái này khác thật, và đây mới chỉ là bắt đầu”
Tôi đưa cho nó ảnh tin đăng Zillow, số serial của thiết bị gia dụng, bảng điện và các khu vực bổ sung tôi tự chụp trong lúc walkthrough; rồi bảo nó viết báo cáo như một thanh tra nhà ở, và nó thực sự làm tốt hơn, còn phát hiện ra những vấn đề mà người kiểm tra lấy 750 đô đã bỏ sót
Vì lười, tôi vài lần hỏi Claude và ChatGPT những dữ liệu đơn giản, xác định rõ như thông số mô-men xoắn của xe dirt bike, và lần nào chúng cũng thường trả lời sai hoàn toàn nhưng rất tự tin
Ngay cả khi đưa PDF vào ngữ cảnh bằng tìm kiếm tăng cường sinh (RAG), tôi vẫn thấy bất an, nên với dữ liệu số liệu chính xác thì tôi tuyệt đối không tin LLM
yauneyz: Tôi đã bảo nó viết một câu chuyện ngắn về việc Vader và Palpatine khám phá ra quy trình Gram-Schmidt
Dù không phải kiệt tác gì, nó bắt đúng không khí và còn hiểu được Gram-Schmidt là gì, mà hồi đó chuyện ấy khiến tôi thấy kinh ngạc đến điên người
AussieWog93: Ngay tối qua, tôi chỉ việc đưa nguyên một prompt cho Claude Code rằng Kodi bị crash khi chạy trên Chromecast 4k, hãy kết nối qua adb, debug để tìm đúng điểm crash và đề xuất cách sửa
Không cần con người can thiệp, nó tìm ra nguyên nhân crash, tải mã nguồn Kodi, vá một lỗi đã tồn tại từ năm 2016, rồi biên dịch lại, ký, đẩy sang Chromecast và vẫn giữ nguyên toàn bộ thiết lập
Tôi còn bảo nó tạo luôn PR; hiện vẫn chưa public và tôi dự định test thêm vài tuần nữa
Có lẽ là làm được, nhưng tôi muốn biết nó đã dùng công nghệ và chuỗi công cụ nào để vận hành theo cách đó
Tôi muốn biết việc đó có mất hơn vài phút không, và liệu có cần bản trả phí của Claude Code hay không
evdubs: Tôi đã thử xem liệu nhà cung cấp dịch vụ LLM có thể viết lại tài liệu pháp lý theo một định dạng nhất quán mà không bị ảo giác để tìm ra phần thiếu sót hay không, và hóa ra là làm được
Sau đó tôi thử xem LLM chạy cục bộ có làm được không, và Gemma-4 xử lý ổn trên card đồ họa 8GB với ngữ cảnh lớn 128k; cùng mô hình đó cũng làm OCR và dịch khá tốt
Lúc ấy tôi nhận ra LLM rất tuyệt để xử lý những việc mà tôi vốn đã biết mình muốn gì, biết cách làm, nhưng kỹ năng học được từ việc đó lại không mấy giá trị, và nếu tự làm thì có lẽ tôi cũng chỉ làm qua loa
Giờ tôi nhìn nó qua lăng kính “liệu có thể giao cho LLM những việc mà đằng nào tôi cũng chẳng quá bận tâm không?”
Những việc như vậy nhanh hơn rất nhiều so với để con người làm, và cũng ít bị ảnh hưởng bởi sự nhàm chán hơn, ít nhất là ở thời điểm hiện tại
Nó đang dùng Claude và Gemini để phản hồi đơn kiện ban đầu, và giờ còn đang tiến hành phản tố với 100% AI
Nó đưa vào nhiều AI khác nhau để chúng kiểm tra chéo lẫn nhau và khơi thêm ý tưởng; ban đầu là ChatGPT, rồi chuyển sang Grok và Claude, còn bây giờ thì Gemini đang cho ra kết quả mạnh nhất
Kiểu như “gọi Claude vào đây”
kstrauser: Ở chỗ làm tôi có ngân sách token khá lớn, và trong lúc kiểm thử lỗ hổng, một đồng nghiệp phát hiện một khai thác từ xa trông rất đáng sợ trong một dự án nổi tiếng rồi nhờ tôi cho ý kiến thứ hai
Tôi chạy dự án trên máy cục bộ và thử POC thì không có chuyện gì xảy ra, rồi nhận ra cần phải hạ bớt các thiết lập bảo vệ bảo mật mặc định
Thế là tôi bảo AI sửa POC để nó hoạt động cả với cấu hình mặc định, và chỉ vài phút sau nó đã vá thành một phiên bản đã được vũ khí hóa; bản tôi vừa tải về, tự biên dịch và chạy trên một instance cục bộ với cấu hình mặc định lập tức bị crash
Nhìn con trỏ nhấp nháy trên console, tôi toát mồ hôi lạnh như thể đang cầm một quả bom thông tin hạt nhân, rồi trằn trọc cả đêm và chỉ ngủ được chừng 30 phút
Nhưng bù lại, cả nhóm đã có một định hướng đạo đức rõ ràng: vì chúng tôi có thể làm việc này, nên phải làm và chia sẻ kết quả với các tác giả liên quan
Tôi muốn sống trong một thế giới nơi người tốt sửa vấn đề trước khi kẻ xấu tìm ra, nên giờ tôi quyết định góp phần tạo ra thế giới đó
Tôi không thấy cụm từ nào phía trước có vẻ là viết tắt cả
ddxv: Khi dùng mã do LLM tạo ra, phần lớn thời gian là cảm giác “ồ, hay đấy!”, nhưng vài tuần sau, khoảnh khắc thành “ủa?” là khi tôi nhận ra đoạn mã “hay” mà model đưa ra và nói là đã qua test lại có một lỗi rất tinh vi, còn tôi thì đã không đọc kỹ
Rủi ro lớn nhất là trở nên lười biếng, giao cho nó xử lý nhiều file và rất nhiều thay đổi cùng lúc, rồi YOLO dù bản thân không hoàn toàn hiểu nó đã làm gì
Với frontend thì thường còn tạm ổn, nhưng các tác vụ thao tác dữ liệu nếu không hiểu thì rất dễ không đúng như mình muốn, và vài tuần sau bạn lại phải quay lại đào bới xem rốt cuộc đã thay đổi cái gì
Nó giống cuộc sống trước thời LLM khi còn copy-paste từ StackOverflow, chỉ là giờ tốc độ copy-paste nhanh hơn nhiều và nó xử lý boilerplate rất tốt, để mình tập trung vào các edge case
UncleOxidant: Gần đây tôi đã cùng Claude làm một bộ phân loại MNIST mạng nơ-ron spiking chạy trên FPGA để demo
Claude đã đi từ ý tưởng đến PyTorch, huấn luyện, triển khai Verilog và tổng hợp FPGA, rồi tôi còn bảo nó làm một ứng dụng cho phép vẽ chữ số bằng chuột trên PC và bấm nút để phân loại
Tôi cần gửi dữ liệu từ USB sang FPGA qua SPI, nhưng bộ chuyển đổi SPI vẫn đang trên đường giao, nên tôi bảo nó hãy để ứng dụng giao tiếp với mã Verilog chạy trong trình mô phỏng Verilator qua SPI ảo rồi đi ăn trưa
Lúc quay lại, ứng dụng vẽ chữ số đã hiện trên màn hình; tôi vẽ số 2 thì nó phân loại là 2, còn ở cửa sổ khác trình mô phỏng Verilator đang hiển thị quá trình truyền dữ liệu
Tôi nổi da gà
HlessClaudesman: Khi đang nghe podcast trong quán cà phê, tôi nghe nói có một tác giả sci-fi viết hơn 40 cuốn một năm, và tôi nghĩ chắc либо là có đội viết thuê, либо là cocaine cực mạnh, либо là AI
Thời ChatGPT sơ khai, tôi tải ứng dụng xuống và cho nó đi qua mọi bước của việc viết tiểu thuyết — dàn ý, tóm tắt nhân vật, tóm tắt cốt truyện, chương nháp, chương hoàn chỉnh — rồi đến lúc tôi đang nghĩ tới ly cà phê thứ hai thì bản thảo trước biên tập đã xong
Đó là một cuốn tiểu thuyết kinh khủng, nhưng có những tia sáng có thể gặt ra và gọt giũa, và nó chứng minh giả thuyết rằng AI có thể sản xuất hàng loạt tiểu thuyết quy mô lớn
Nếu có sẵn thật nhiều cocaine thì có lẽ cùng với AI còn có thể cho ra 40 cuốn mỗi tuần
mindcrime: Tôi không nhớ một khoảnh khắc cụ thể nào, nhưng ngay từ lần đầu tương tác với ChatGPT tôi đã thấy nó khá ấn tượng
Tôi hoàn toàn chưa sẵn sàng gọi đó là AGI, nhưng nó là một thứ gì đó mới, và trực giác mách bảo rất rõ rằng “AI của hôm nay sẽ là trạng thái tệ nhất của nó về sau”, trong khi tốc độ thay đổi thì khó mà dự đoán
Càng dùng nhiều tôi càng chắc chắn 100% rằng ở một nghĩa nào đó, gọi chúng là thông minh là hợp lý
Nó vẫn chưa phải AGI hay trí tuệ ngang con người, nhưng theo kiểu “jagged intelligence” của Demis Hassabis, tôi xem đó là một dạng rất thông minh ở vài lĩnh vực và kém hơn nhiều ở các lĩnh vực khác
Tôi tin rằng có thể tồn tại những kiểu trí tuệ không vận hành như trí tuệ con người, nên các lập luận kiểu “đó không phải trí tuệ thật” gần như không có sức nặng với tôi
Liên quan chuyện này, tôi đã ủ một bản nháp blog tên là “The Marquee Sign Says 'Artificial' Intelligence” khá lâu rồi, nhưng không định để AI viết thay
Tôi dùng AI cho nghiên cứu, lập dàn ý và brainstorming, nhưng vẫn giữ ranh giới rằng những gì xuất bản dưới tên tôi phải mang giọng văn thật của tôi
ben_w: Tôi đã có vài khoảnh khắc như thế
Demo InstructGPT đầu tiên đã gây sốc vì tôi còn nhớ NLP tối tân ngày xưa tệ đến mức nào, và cũng không hề kỳ vọng từ chất lượng nối tiếp văn bản của GPT-3.x lại tiến tới khả năng làm theo chỉ dẫn
Năm 2019 có This Person Does Not Exist, năm 2016 có style transfer và các kỹ thuật tương tự (https://github.com/awentzonline/image-analogies) cũng như thứ mà giờ ta sẽ gọi là deepfake (https://www.youtube.com/watch?v=_S1lyQbbJM4), và năm 2015 là bản cập nhật OTA cho tính năng tự lái của Tesla (https://www.popsci.com/tesla-cars-become-autonomous-overnigh...); tất cả đều cho tôi cảm giác đó
Năm 2013, word2vec với “man” - “woman” ~= “king” - “queen” cũng khiến tôi phải “ủa?” vì tôi biết mức độ NLP trước đó ra sao, và còn hơn thế nữa khi nghĩ đến khả năng giám sát thông qua tự động hóa tuyên truyền hay hiểu tiếng lóng như Polari
Tôi cũng nhớ video demo Word Lens năm 2010 (https://www.youtube.com/watch?v=h2OfQdYrHRs)
alexfoo: Sau khi ai đó cập nhật firmware cho máy in Brother DCP-L3550CDW, trang CSV mà Prometheus exporter cũ dùng đã biến mất, chỉ còn lại một trang HTML với thông tin bị chôn trong nhiều
divTôi định tự parse HTML để viết exporter, rồi thử Claude: đưa vào một VM sandbox một file HTML tĩnh của trang trạng thái máy in và một file Go tối thiểu chỉ có
fmt.Printf("OK\n")Tên thư mục là
brother-exporter, và dù tôi không hề nói thêm chỉ dẫn nào, không mô tả việc cần làm hay ngôn ngữ dùng, chỉ với/initClaude đã suy ra rằng nó cần viết một Go Prometheus exporterChỉ trong 10 phút, nó đã tạo ra hoàn hảo mã lấy HTML từ máy in mặc định ở địa chỉ 192.168.1.1, parse dữ liệu và cung cấp các metric để Prometheus scrape
Nếu là tôi thì chắc phải mất vài tiếng; điều gây sốc nhất là nó đã đoán đúng được quá nhiều chỉ từ lượng thông tin ít ỏi ban đầu
tern: Lúc đầu là khi Opus 3.x tạo cho tôi một hệ thống năng suất bằng Obsidian MCP, rồi sau đó là lúc tôi phát hiện ra các prompt kiểu “hãy xây dựng mô hình toán học của bài toán và từ đó suy ra lời giải”
Khoảnh khắc thật sự “ơ?” là khi tôi đặc tả rất dài một compiler/runtime cho DSP thời gian thực với nhiều ý tưởng mới, và nó thực sự hoạt động
Trình tự đại khái là: giúp nó hiểu tôi → giúp tôi kết nối các ý tưởng hay → tạo ra ý tưởng mới nếu có đầu vào phù hợp → làm ra công cụ hữu ích trên máy của tôi → qua các vòng lặp tổng hợp ý tưởng tốt thành ý tưởng còn tốt hơn → tạo ra những hệ thống lớn vượt xa năng lực thông thường của tôi
Tiền tuyến hiện tại là tổng hợp những codebase lớn thành các hệ thống tốt hơn qua các vòng lặp, và mấu chốt là theo dõi xem quy trình đó có hội tụ và sinh lãi kép hay chỉ quay vòng tại chỗ hoặc phân kỳ
Tháng 3/2024, khi đang nghiên cứu và triển khai một bài toán nghiên cứu khó trong xử lý ngôn ngữ tự nhiên, tôi cảm thấy chỉ với prompt và completions API là đã có thể xấp xỉ đủ tốt
Đến giữa năm 2025, Llama 3 đã phân tích một codebase khá lớn mà tôi đang onboarding, rồi tổng hợp ra kết quả ở mức sơ đồ do chính tôi tạo, đủ để trở thành công cụ quyết định
Tháng 12/2025, Opus 4.5 gần như tạo ra hoàn hảo về mặt cú pháp các module đa lớp và test, và tôi nhận ra lỗi là do prompt của tôi đặc tả chưa đủ
Giờ tôi hầu như không còn viết code bằng tay, vì chất lượng đã đủ tốt và các phần phụ như test, tài liệu, script build cũng đi kèm như miễn phí
notthetup: Tôi có những bản ghi âm concert hiếm bị hỏng do di chuyển file trong lúc backup
Có vẻ dữ liệu vẫn còn đó nhưng không phần mềm nào phát được, nên sau 5 năm để đó tôi thử phục hồi bằng công cụ AI
Sau 20 phút với Copilot và rất nhiều lần lục hex dump, lúc đầu tôi có một cách giải nửa vời chỉ phát được vài giây đầu của file, nhưng cuối cùng đã khôi phục được toàn bộ file
nwhitehead: Một câu chuyện của vợ/chồng tôi: hôm nay họ dùng Claude để chẩn đoán một bug chặn tiến trình của một game Steam mà họ rất muốn chơi
Mất 18 phút, nhưng nó đã giải nén gói Godot, tìm ra bug, đề xuất cách sửa, và còn chỉ luôn cả cách lách trong game
Tôi chẳng phải làm gì; Claude dùng
stringsđể hiểu cấu trúc file.pck, rồi viết mã Python có cả chút phép thuật đặc thù Godot để giải nén một chunk cụ thểsimonw: Với tôi là khoảng tháng 3/2023, khi nhìn thấy ChatGPT Code Interpreter
Tôi tải lên file CSV về các vụ việc của cảnh sát San Francisco, nó đọc bằng Pandas, vẽ biểu đồ, rồi xuất dữ liệu thành file cơ sở dữ liệu SQLite để tôi tải xuống
Với góc nhìn của người làm phần mềm cho các nhà báo dữ liệu, chỉ riêng tác dụng phụ là có thể chạy Python trong thư mục chứa file được tải lên đã khiến nó trông như có thể làm mọi thứ tôi từng muốn ở phần mềm
Nhìn lại thì đó là lần đầu tôi tiếp xúc với coding agent, nhưng hồi đó còn chưa có tên gọi cho cả nhóm này
mlmonkey: Một người bạn làm tư vấn của tôi kiếm bộn tiền và chơi golf rất nhiều nhờ bám vào ngách Netsuite và Oracle; vốn là kế toán nên anh ấy chuyên cấu hình instance cho khách hàng
Ngay sau khi ChatGPT trở nên phổ biến, khi tôi hào hứng nói về tiềm năng AI thì anh ấy cố dội gáo nước lạnh rằng “nó không thể làm công việc của tôi đâu”, rồi về nhà mở laptop ra thử
Anh ấy nhập vào đặc tả cấu hình Netsuite mong muốn kiểu như nhận từ khách hàng, cùng đủ loại tùy chọn và cấu hình, rồi yêu cầu các lệnh thiết lập; ChatGPT lập tức liệt kê ra hàng loạt lệnh cần chạy và các tùy chọn cần đặt
Bạn tôi buồn hẳn đi và nói, “đây đúng là những lệnh chính xác mà tôi thực thi”, nhưng sau đó vẫn xoay sang giữ được vài công ty tư nhân của các ông chủ quen biết làm khách hàng ổn định, đủ để duy trì thú chơi golf
Khách hàng biết rằng dù họ có thể tự chạy ConsultBot 2.0 đi nữa, thì như mọi khi, công việc vẫn đang được giao cho những bàn tay đáng tin cậy
djfergus: Tôi có một chiếc Amazon Firestick đời đầu nằm trong ngăn kéo nhiều năm, đã được cập nhật lên phần mềm mới nhất nên không còn exploit root công khai nào
Tôi để Claude và Codex thay phiên nhau nghiên cứu suốt một ngày; sau khi tải source kernel về và thử exploit, cuối cùng chúng lấy được quyền root bằng “FBUF/VCHIQ kernel zero-write primitive to patch live kernel memory”
Tôi có thể giữ root vĩnh viễn, gỡ app Amazon và hạ cấp firmware; điều đó khiến tôi háo hức về một tương lai nơi nhiều phần cứng cũ lẫn mới hơn sẽ có thể được tái sử dụng
PopePompus: Tôi đang dùng Claude Code để làm lại thành ứng dụng Android một app thiên văn học cũ mà tôi từng viết cho Nokia N900 từ thời trước iPhone App Store
App gốc tạo ra nhiều trang hiển thị như vị trí các hành tinh, và tôi chỉ mô tả màn hình để nó tái tạo từng trang, hoàn toàn không hề nhắc đến mã nguồn gốc hay thậm chí sự tồn tại của app cũ
Sau khi tái tạo nhiều trang, Claude tự thêm vào một trang mà tôi không hề yêu cầu; trang đó vốn có trong app Nokia gốc, nhưng tôi còn chưa bảo nó thêm vào bản Android
Mã của app Nokia vẫn còn trên GitHub, và có vẻ Claude đã somehow nối được công việc tôi yêu cầu với mã Nokia trong kho GitHub của tôi, rồi triển khai chính xác trang còn thiếu đến mức khiến tôi há hốc mồm
vitorbaptistaa: Tôi là CTO của một NGO nhỏ chỉ có 10 người, và khi đó chỉ có đúng một lập trình viên junior, nhưng phải hỗ trợ hai ứng dụng do consultant xây dựng
Đó là một kiến trúc hỗn loạn với NextJS, React và 4 microservice gắn vào một trang chỉ có 50 người dùng mỗi tuần
Tôi chuẩn bị một devcontainer với codebase cũ và một repository trống, rồi bảo Claude viết lại thành một ứng dụng Django render phía máy chủ kiểu cũ trước khi đi ngủ, và đến sáng thì đã xong 80%
Sau thêm vài ngày prompt và review để đạt mức tương đương về chức năng, chúng tôi xử lý luôn ứng dụng còn lại theo cách tương tự
Giờ cả hai đều đã được triển khai, chi phí máy chủ và độ phức tạp đều giảm, tốc độ nhanh hơn vài bậc, và nếu không có AI agent thì đây là việc mà thông thường, như bao món nợ kỹ thuật khác, chúng tôi sẽ không thể làm nổi, nên với tổ chức nhỏ, AI hữu ích đến mức đáng kinh ngạc
dang: Khoảnh khắc lớn với tôi là khi thấy nó phân tích file log chỉ trong vài giây
Nếu là tôi làm thì phải mất vài tiếng, thực ra là vài ngày, và vì thế vốn dĩ tôi đã không làm việc đó
Nó cũng giúp tôi vượt qua rào cản gia nhập của những tối ưu hóa bị trì hoãn nhiều năm vì không có thời gian để học, và đặc biệt còn hỗ trợ truy vết các lỗi đồng thời như race condition
Nó còn tìm ra cả những thông tin mà Google Search không tìm được(https://news.ycombinator.com/item?id=42653136), và điểm chung là không phải vì những việc đó bất khả thi, mà vì tốn quá nhiều thời gian và công sức nên vốn dĩ đã không xảy ra, còn giờ thì nó khiến chúng thực sự xảy ra
Khi tôi chỉ vào extension ADO có vấn đề, nó tải VSIX xuống và decompile binary .NET để kiểm tra, rồi dựa trên thông tin đó đề xuất một cách workaround mà bản thân tôi vốn rất hoài nghi, nhưng nó thực sự hoạt động
Về mặt kỹ thuật thì tôi cũng làm được, nhưng phần thưởng không rõ ràng và sẽ tốn quá nhiều thời gian nên có lẽ tôi đã không làm
Hôm qua nó hiện ngay đầu GitHub của tôi, tôi giải thích vấn đề thì Claude lập tức tìm ra bug, rồi sau vài lượt trao đổi đã đưa ra bản sửa khiến tôi hài lòng
Giờ có lẽ tôi sẽ phát hành được bản cuối cùng, và thật tuyệt khi cuối cùng cũng khép lại được một việc đã bỏ dở quá lâu
hgoel: Gần đây tôi đã thử nhờ Claude giúp học vẽ, đặc biệt là giải phẫu
Tôi tải một bản phác thảo lên và xin phản hồi; trái với kỳ vọng, nó cực kỳ hữu ích và giải thích chính xác những chỗ mà tôi cảm thấy kỳ nhưng chưa ai từng chỉ ra
Vì tò mò, tôi bảo nó gắn nhãn các vấn đề ngay trên bản phác thảo, và nó đã tự viết một script Python chỉ định tọa độ để gắn nhãn trực tiếp
Vì tôi vẫn còn giữ nhận thức rằng vLLM chưa giỏi lắm với tác vụ thị giác, nên việc nhận được lời khuyên vẽ thực sự hữu ích đã khiến tôi khá bất ngờ
Là phản hồi về giải phẫu, kiểu như “cánh tay không gắn ở đó”, hay là mẹo kỹ thuật vẽ như đổ bóng?
takee: Tôi đang làm một thí nghiệm điện từ học với đứa con 10 tuổi để mang đến hội chợ khoa học ở trường thì gặp một vấn đề mà tự mình không debug được
Tôi bật cuộc gọi video trực tiếp của Gemini và nhờ nó giúp phân tích nguyên nhân, nó giải thích rõ ràng các khả năng có thể xảy ra, rồi cuối cùng chúng tôi đã làm cho thiết bị hoạt động như mong đợi
Nguyên nhân là lớp cách điện ở phần đầu nối pin của sợi dây quấn quanh con vít chưa được bóc đủ, và Gemini đã bắt được chi tiết mà mắt thường tôi không nhìn ra
Đứa trẻ và hai người bạn của nó không chỉ ấn tượng với chính thí nghiệm mà còn kinh ngạc vì cuộc trò chuyện thoại và video thời gian thực với AI gần như giống phép màu
lodovic: Tôi đã dán ảnh chụp màn hình một thread review PR và chỉ nói “có comment review nên sửa giúp tôi”, và tôi thật sự choáng khi nó giải quyết hoàn hảo, tạo các commit nhỏ và push lên upstream
Sau đó tôi cứ tiếp tục ném vào nó những bài toán bất khả thi, dự án khổng lồ và kiến trúc phức tạp để xem nó hiểu được ý đồ của tôi đến đâu
Gần đây, chỉ trong một tuần, làm vài giờ mỗi ngày, nó đã viết từ đầu một hệ điều hành hoàn chỉnh có cả MPI, TCP/IP, GUI, và còn chạy được Doom
Việc lập trình như một nghề đã kết thúc, nhưng khi tiếp cận bằng tư duy chuyên nghiệp thì khác biệt về kết quả lớn đến mức tôi vẫn cho rằng kỷ luật phần mềm vẫn có thể mang lại giá trị khổng lồ
jmkni: Không phải viết code mà là đọc log
Tôi đang tìm một bug ác mộng chỉ xảy ra ở production, và Claude Code có thể kết nối với Google Cloud để đọc log theo thời gian thực
Khi tôi tái hiện bug trên UI, nó lập tức xác định vấn đề trong log, và vì có cả ngữ cảnh của toàn bộ codebase nên còn chỉ ra đúng dòng code gây ra nguyên nhân
Đó đúng là một khoảnh khắc kiểu “ơ?”
marcus_holmes: Tôi chụp ảnh một cái cây đang héo và cho Claude xem, rồi nó chỉ tôi cách hồi phục cho cây khỏe lại và cách nhân giống bằng giâm cành
Những ví dụ về coding thì tôi hiểu vì đó là máy tính nói về máy tính, nhưng việc cho máy tính xem ảnh một cái cây rồi nó nhận ra cây gì, chẩn đoán được và biết phải làm gì, thật sự mang cảm giác như khoa học viễn tưởng và rất đáng kinh ngạc
bonoboTP: Khoảnh khắc lớn nhất là ngay sau khi ChatGPT ra mắt năm 2022, đặc biệt là những ví dụ kiểu nhập vai Linux terminal, mô tả rằng “trung tâm dữ liệu bị cháy” rồi “chạy”
nvidia-smithì nhiệt độ GPU hiện ra cao bất thườngCũng có thể “khám phá” thư mục home của mình hay thư mục home của người nổi tiếng, và nếu nó hiểu terminal tốt đến vậy thì tôi tin chắc việc dùng công cụ và agent đã ở rất gần
Opus 4.5 khiến tôi cảm thấy điều đó cuối cùng cũng đã đến, nhưng vào năm 2022 thì thực ra tôi đã nghĩ nó sẽ đến sớm hơn, vào khoảng 2023~2024
Ở mảng hình ảnh, khi thấy nano banana tôi cảm nhận rằng ảnh AI thật sự dùng được, và rõ ràng những vấn đề tạm thời như tay/chân hay kiểu “không thể làm cảnh phi hành gia cưỡi ngựa” rồi cũng sẽ biến mất
Việc sản xuất phim điện ảnh dài cũng đã bước vào phạm vi khả thi theo cách agent phối hợp kịch bản, nhân vật và các cảnh quay để tạo ra, và bất kể có phải là một câu chuyện đáng xem hay không thì nó vẫn sẽ là một “bộ phim”
Về sau có nhiều bài toán còn ấn tượng hơn, nhưng chưa có gì khiến tôi rơi vào cảm giác kinh ngạc thuần túy như lúc đó
jb_briant: Tôi đang làm một game 3D, và vì ghét một thế giới phẳng nên muốn dùng hành tinh
Bề mặt không mở rộng nên về gameplay thì là hữu hạn, nhưng đồng thời lại không đụng vào biên thế giới nên tạo cảm giác như vô hạn, điều đó rất thanh nhã
Tọa độ Descartes không thật sự phù hợp với người chơi, nên cần một hệ lưới vĩ độ/kinh độ/độ cao, và tôi cũng có thể lục StackOverflow vài ngày rồi debug một triển khai đầy lỗi
Nhưng đến năm 2024, bản web của ChatGPT gần như tạo ra các helper đó chỉ trong một lần, và điều này rất ấn tượng vì ở đây thực sự có rất nhiều bẫy
Một game arcade retro chạy trong trình duyệt lấy cảm hứng từ Rally-X: https://linsomniac.github.io/rally-xy/
Tôi cũng làm một game bắn súng mê cung multiplayer qua mạng theo phong cách nsnipes, dù chạy trên trình duyệt nhưng multiplayer mạng thì cần server: https://github.com/linsomniac/isnipes
vishvananda: Đó là đầu năm nay, khi tôi lôi lại những dự án cũ bị bỏ dở và giao cho agent xử lý
Trong vài ngày, nó làm một bản clone của phần triển khai AlphaZero mà tôi từng làm ở team Oracle (https://medium.com/oracledevs/lessons-from-implementing-alph...), port NES emulator sở thích của tôi từ JavaScript sang Rust (https://github.com/vishvananda/popeye), và triển khai toàn bộ các bài học của C++ Grandmasters Challenge, cuối cùng dẫn đến cả một trình biên dịch C++ hoàn chỉnh (https://medium.com/@vishvananda/i-spent-2-billion-tokens-wri...)
Đặc biệt, việc port NES emulator mất chưa tới 30 phút và chạy được ngay từ lần thử đầu tiên
Chính việc tôi bảo nó làm lại những thứ trước đây mình từng đổ mồ hôi xây dựng đã bật công tắc, và vì tôi biết độ khó của chúng nên nó tác động đến tôi mạnh hơn nhiều so với các dự án khác
a_bonobo: Ở công việc trước, tôi từng xử lý các bản ghi nhận nhìn thấy động vật chưa được xác minh, và riêng ra còn có một cơ sở dữ liệu về xác suất xuất hiện động vật dựa trên bản đồ phân bố loài
Tôi không phải nhà thống kê, nhưng khi có dữ liệu quan sát, xác suất xuất hiện nền của khu vực đó, cùng các giả định về nhiễu trong quan sát, thì việc tính xác suất loài đó thực sự có mặt trông đúng là bài toán dành cho định lý Bayes
Claude đã hỏi tôi ba câu, rồi truy vấn bản đồ và viết ra một triển khai Python rất đẹp, xuất ra bảng xác suất đã hiệu chỉnh
Tôi có cảm giác rất mạnh rằng giờ đây mình có thể tự làm những việc như vậy mà không cần chờ tìm được đúng người hay học đúng kiến thức trước
dannyobrien: Đó là khoảng năm 2019, khi tôi có quyền truy cập sớm vào OpenAI API trước cả ChatGPT, và ở chỗ làm chúng tôi đang chuẩn bị một trò JackBox livestream cho sự kiện từ thiện
Trước đây tôi từng làm biên kịch cho bản Anh của game gốc You Don't Know Jack, công việc là nghĩ ra thật nhiều câu đùa một dòng vui nhộn về chủ đề rồi chỉ chọn một phần trong số đó để ghi âm
Tôi thử nghiệm bằng cách đưa những câu thiết lập kiểu đó vào OpenAI API, và dù 90% là nhạt hoặc incoherent, thì cứ khoảng 10 câu lại có 1 câu không tệ hoặc khá ổn
Có thể điều đó không gây ấn tượng với người khác, nhưng vì tôi từng ở trong môi trường phòng biên kịch nơi mọi người dành hàng giờ cho đúng việc này, nên tôi nhận ra nó có thể trở thành một công cụ hỗ trợ sáng tạo hoàn hảo
Nó cũng chơi JackBox khá ổn
xtracto: Có thể sẽ bị chỉ trích, nhưng tôi đã viết một chương trình nhỏ với sự trợ giúp của LLM để chụp video game FPS online Xbox Live trên màn hình trình duyệt, nhận diện hình người bằng một mạng nơ-ron nhỏ đã được huấn luyện rồi hiển thị trên màn hình khác
Cách làm là đặt một lớp phủ màu xanh lá lên trên kẻ địch trong trận PVP để dễ nhìn hơn, và toàn bộ chỉ khoảng 100 dòng mã, bao gồm cả việc huấn luyện/tinh chỉnh một mạng nơ-ron YOLO nhỏ
Với người không biết thì có thể trông giống gian lận, nhưng về bản chất đây là bài tập thị giác máy tính
Các công cụ kiểu DMA trong lĩnh vực mod game cũng kiếm tiền bằng mô hình đăng ký thuê bao, nên vừa ấn tượng vừa bí mật một cách kỳ lạ, và việc những công cụ đó cùng phần cứng mux hoạt động tốt đến mức nào cũng rất đáng quan tâm
Nếu còn kết hợp với phần cứng như DGA có bộ nhớ onboard và interconnect nhanh hơn, thì đây sẽ là giai đoạn cực kỳ thú vị đối với những ai làm reverse engineering, phân tích mã độc và pháp chứng số
tejohnso: Tôi chưa từng có khoảnh khắc hoảng loạn rõ rệt, nhưng trong năm qua cách tôi tiếp cận việc lập trình đã thay đổi
Trước đây khi bắt đầu một dự án, tôi tự mình suy nghĩ về cấu trúc, cách các phần lớn tương tác với nhau, chi tiết triển khai, các phương án thay thế và hệ quả của chúng
Giờ thì thay vì suy nghĩ một mình, tôi trao đổi với LLM trong suốt quá trình, nhanh chóng gom thông tin từ nhiều nguồn, yêu cầu link đến tài liệu chuẩn, hỏi về trade-off giữa các phương án mà tôi có thể chưa nghĩ tới để đi đến phân tích chi tiết hơn
Trong lúc phát triển, tôi cũng liên tục giữ một agent partner mới trong ngữ cảnh để dùng cho thảo luận, đề xuất và giải quyết vấn đề
Tôi không thể tin tưởng hoàn toàn, nhưng nó đã trở thành một công cụ quy trình làm việc đủ đáng tin cho mục đích của tôi, và tốc độ nó chuyển từ món đồ chơi thú vị sang công cụ tích hợp hoàn toàn là cực kỳ nhanh
tobyhinloopen: Nhân viên không chuyên kỹ thuật của một khách hàng đã làm ra một ứng dụng bằng vibe coding, rồi nhờ tôi review và triển khai nó
Kết quả khá ổn và không có vấn đề nghiêm trọng nào
Đồng thời, tôi ném toàn bộ PDF phản hồi của khách hàng, ảnh chụp màn hình v.v. vào Claude, và nó gần như tự hoạt động suốt 7 tiếng để tái hiện và sửa lỗi, tạo ra nhiều MR
Phần lớn các chỉnh sửa đều tốt; một vài cái thì đúng về mặt kỹ thuật nhưng không phải thứ khách hàng muốn, nên khi tôi nói vậy thì Claude đã sửa lại
Vì thế tôi đã xây một startup xoay quanh ý tưởng đó
rerdavies: Tôi đang làm một trình biên dịch Spice để biến sơ đồ mạch pedal guitar cổ điển thành mã thực thi thời gian thực
Tôi đưa cho Claude số trang và số phương trình trong The Spice Manual 2nd ed. rồi yêu cầu nó triển khai, thật ra tôi không kỳ vọng nó sẽ thành công
Nhưng nó không chỉ triển khai các phương trình đó mà còn cả phép tính Lagrangian của một hàm nằm cách đó 30 dòng bên dưới, việc này đòi hỏi phải lấy đạo hàm riêng ký hiệu của một hàm không hề đơn giản và xác định biến nào là gì trong ma trận kết quả
Bản gốc chỉ ghi “Lagrangian of” và không cung cấp các phương trình đạo hàm riêng, vậy mà nó vẫn làm được, thậm chí còn thêm chú thích số trang và số phương trình nguồn cho phương trình Lagrangian đó
Tôi đoán là cứ bảo Claude làm thôi, nhưng tôi tò mò không biết bạn có định chia sẻ nó không