Ask HN: Sau khi AI xuất hiện, bạn đã tự làm công cụ nào cho chính mình?
(news.ycombinator.com)- Với sự phổ biến của các công cụ lập trình AI, xu hướng cá nhân lập trình viên tự tạo công cụ riêng cho mình đang lan rộng; nhiều tiện ích nhỏ, tùy biến cao vốn trước đây bị bỏ qua vì hiệu quả không tương xứng với thời gian bỏ ra nay xuất hiện hàng loạt
- Các công cụ chuyên biệt cho sở thích và đời sống hằng ngày như thử nghiệm âm nhạc·âm thanh, chuyển đổi media, tự động hóa nhà ở, theo dõi sức khỏe là nổi bật nhất; cũng có nhiều trường hợp thay thế ứng dụng thương mại bằng bản tự triển khai
- Các công cụ sandbox và orchestration để cô lập, chạy song song coding agent, cùng các công cụ workflow phát triển dựa trên tmux/worktree liên tục được nhắc đến
- Có cả tranh luận xoay quanh chủ thể tạo ra sản phẩm, như nhận xét kiểu “đó không phải bạn làm mà là AI làm”, và phản biện rằng việc lập trình với AI không phải lúc nào cũng là vibe coding
- Ở những lĩnh vực mà ứng dụng tải về chỉ đáp ứng được khoảng 80~90% nhu cầu do quảng cáo, thuê bao hoặc giới hạn tính năng, giờ đây đang chuyển sang nhận thức rằng tự tạo phần mềm cá nhân hóa khớp chính xác với từng người còn nhanh hơn
- Quan điểm ủng hộ rằng ngay cả việc khai thác AI để tạo ra ứng dụng thực sự dùng được cũng là một kỹ năng, đối đầu với phản bác rằng dùng LLM thì chẳng có kỹ năng gì đặc biệt và chỉ vài ngày là học được
Những thay đổi mà lập trình viên cảm nhận
- Có nhận thức rằng phải học cách quên đi (unlearning) “cảm giác về chi phí” tích lũy suốt sự nghiệp, tức là những việc trước đây tránh làm vì quá tốn thời gian thì nay không còn như vậy nữa
- Mặt thận trọng cũng song hành: nếu đặt tiêu chuẩn cao về chất lượng, hiệu năng và khả năng bảo trì thì vẫn tiếp tục tự viết code thủ công, và giới hạn của LLM được cảm nhận giống như giới hạn phần cứng
- Dự báo về một tương lai nơi phần mềm tiêu dùng được tạo ra ngay lập tức, theo nhu cầu, và phần mềm cá nhân hóa sẽ trở nên phổ biến
- Tuy vậy, cũng có góc nhìn cân bằng rằng mọi ví dụ này có thể chỉ ở mức “đã in gì bằng máy in”, và giá trị của các công cụ tùy biến kiểu này chỉ được hiện thực hóa khi có các công cụ nền tảng đáng tin cậy và có tính xác định
1 bình luận
Ý kiến trên Hacker News
ddahlen: Tôi nghiên cứu cơ học quỹ đạo của tiểu hành tinh, sao chổi và bụi, nên đã làm một công cụ trực quan hóa chính xác cho thấy chuyển động của mọi tiểu hành tinh đã biết trong Hệ Mặt Trời
Khi bấm vào một tiểu hành tinh cụ thể, nó sẽ hiển thị quỹ đạo siêu chính xác khớp với tính toán quỹ đạo của JPL, đồng thời phản ánh toàn bộ vật lý, bài toán nhiều vật thể, thuyết tương đối và các hành tinh không cầu. Không thân thiện lắm với di động https://dahlend.github.io/ketev/
yungbeto: Tôi làm khá nhiều thử nghiệm âm thanh cho vui. Chúng có thể ngốn CPU kha khá
https://www.noisetable.xyz/ là một bộ kênh âm thanh dựa trên xác suất với giao diện mang cảm giác VCR, còn https://concrete95.net/ là một ứng dụng web musique concrète trông như Windows 95. Nó lấy âm thanh ngẫu nhiên từ freesound.org, lặp lại các đoạn ngắn và cho phép chồng thêm synth pad hoặc vòng lặp synth giai điệu để tạo ambience nền. https://windso.me là một step sequencer dựa trên sample mà bạn không thể tự chọn sample, nên khá vui nhưng vẫn còn nhiều chỗ cần chỉnh sửa
michaelbuckbee: Thứ buồn cười nhất là Moniker, một tiện ích miễn phí nhìn vào nội dung tệp rồi đổi tên sao cho phù hợp với ngữ cảnh. Nó dùng mô hình AI chạy cục bộ, và tên miền cũng rất chuẩn https://finalfinalreallyfinaluntitleddocumentv3.com/
Hữu ích nhất là HutchDB, một dịch vụ MCP để lưu dữ liệu khi được gọi từ chat AI hoặc agent. Nếu bạn nói “save that to Hutch”, nó sẽ suy luận schema và các trường, tạo các chế độ xem web như Kanban, Timeline, Grid, Calendar, và cũng có thể chia sẻ kết quả. Tôi dùng nó để theo dõi thời gian, bàn giao giữa agent và con người, và so sánh hoạt động marketing với số lượng người đăng ký https://hutchdb.com
Tôi cũng thắc mắc vì sao nó miễn phí dù được host trên Vercel. Nếu nó lan truyền dù chỉ một chút thì tôi cần có đảm bảo rằng nó sẽ không bị đóng vì chi phí hoặc chuyển sang tính phí 500 USD/tháng. Sau khi đăng ký thì nó chuyển hướng từ https://hutchdb.com/ sang https://hutchdb.com/dashboard nên cũng không xem được trang chính sách quyền riêng tư và điều khoản sử dụng
Jordan-117: Gemini đã giúp tôi rất nhiều trong việc chuyển từ Windows sang Linux
Tôi cũng khá rành, nhưng khi chuyển sang hệ điều hành mới thì có đủ thứ câu hỏi ngẫu nhiên và edge case kỳ quặc; nếu chỉ có một mình chắc tôi đã thiếu tự tin, kiên nhẫn và thời gian. Việc có câu trả lời ngay cho vấn đề cụ thể, không bị phán xét và không phải chờ ai trả lời thật sự rất tốt. Khi quay từ Chrome về Firefox, Gemini cũng hữu ích trong việc tìm lựa chọn thay thế cho các extension tôi hay dùng, hoặc tự làm nếu không có sẵn. Tôi cũng đang làm plugin tùy chỉnh cho Quod Libet với Gemini và Claude, bao gồm tải metadata và lời bài hát đồng bộ, một thanh bên highlight lời đang phát, và nút đánh dấu những đoạn yêu thích của bài hát. Tiếp theo tôi muốn làm tính năng tìm kiếm lời cho toàn bộ thư viện
Trong lĩnh vực chuyên môn của mình, bạn không phải lãng phí thời gian đọc mớ dài dòng dành cho người mới; còn ở lĩnh vực không chuyên, bạn cũng không phải nghe mấy câu kiểu RTFM hay LMGTFY chỉ vì hỏi câu hỏi cơ bản
Có lẽ là kết quả của việc Google ngày càng tệ hơn, trong khi các vấn đề thường ngày lại trở nên phức tạp đến mức phải dùng script gì đó mới giải được. Gần đây còn có cả việc tìm “một khu cắm trại rẻ, hiện đang mở, gần Pacific Crest Trail” nữa
ingvay7: Tôi tập shred guitar vào buổi tối, nhưng vì công việc bận rộn nên gần như không có thời gian tinh chỉnh tone trong amp simulator, nên tôi đã làm một công cụ mà chỉ cần prompt như “Brian May Solo Bohemian Rhapsody” thì LLM sẽ điền một hợp đồng JSON, rồi script sẽ tạo XML để nạp thẳng vào plugin
Chỉ mất 2 phút là gần như có cảm giác đang chơi ở Wembley ’85. Nếu khái quát hóa mẫu này, LLM có thể tìm preset, cho phép tải tệp lên để khớp chính xác hơn, rồi mã sẽ được xác thực và nạp vào plugin. Tôi cũng đang dùng cách tiếp cận hợp đồng/adapter này cho Terraform, preset game engine và pipeline CI https://vishsubramanian.me/lm-guitar-tone-generator-polychro...
Với người mới chơi guitar như tôi thì vừa đáng sợ vừa là một cái hang thỏ thú vị. Sẽ vui nếu có các prompt “chuyên gia” cho nhiều nguyên mẫu và thể loại khác nhau
netcoyote: Có một số công cụ tôi làm để dùng cá nhân
sandvault https://www.codeofhonor.com/projects/sandvault/ chạy agent trong một tài khoản người dùng macOS riêng biệt và được tăng cường bằng
sandbox-exec. Nó cũng hỗ trợ duyệt web không giao diện và iOS Simulator trong sandbox. clodpod https://www.codeofhonor.com/projects/clodpod/ chạy agent bên trong một máy ảo macOS. git-multi-hook https://www.codeofhonor.com/projects/git-multi-hook/ là một dispatcher giải quyết vấn đề mỗi sự kiện hook của git chỉ cho phép một script. TubeGate https://www.codeofhonor.com/projects/tubegate/ là một tiện ích mở rộng Chrome chặn video YouTube theo từ khóa, còn push10k https://www.codeofhonor.com/projects/push10k/ là một ứng dụng iOS để theo dõi tiến độ 10.000 lần chống đẩy. Blog được code bằng AI với Zola, Sveltia CMS, Cloudflare Pages/Workers và GitHub Actions https://www.codeofhonor.comBalgair: Hơi ngớ ngẩn, nhưng tôi đã làm một scraper thu thập toàn bộ tin tức, tìm tin liên quan đến chiến tranh, tóm tắt lại rồi trình bày bằng phần crawl mở đầu của Star Wars kèm nhạc
Rantenki: Tôi đã tự tay làm một GUI cho pen plotter và bộ gửi G-code bằng Rust. Làm rất thủ công, kiểu như lao vào làm tới bến, và người dùng cũng chỉ có mình tôi
Đôi khi chính quá trình mới là điều quan trọng, và việc vận dụng đầu óc cũng quan trọng. Tôi hiểu nỗi lo hiện sinh rằng AI sẽ cướp việc làm và loại con người khỏi quá trình sáng tạo, nhưng nếu để thỏa mãn cá nhân thì cứ viết code thôi https://github.com/armyofevilrobots/bap-egui
wizenheimer: Tôi đã phát hành một QA harness cho Claude Code. Thay vì tự bấm qua các luồng màn hình, nó đọc khác biệt trong code, tìm các luồng UI bị ảnh hưởng và kiểm thử chúng trên trình duyệt thật
Sau mỗi lần chạy, nó cung cấp bản ghi màn hình, log console, network request, HAR và Playwright trace để bạn có thể kiểm tra chính xác agent đã làm gì https://github.com/wizenheimer/canary
Tôi đã thử đăng Show HN nhưng vì lý do nào đó nó bị gắn cờ
DonaldFisk: Dartmouth Summer Research Project on Artificial Intelligence là vào năm 1956, còn bản thân AI thì có thể truy ngược xa hơn tới các robot như Elmer và Elsie của William Grey Walter năm 1948, khi đó nó được gọi là cybernetics
Từ những năm 1980 tôi có làm AI biểu tượng theo từng đợt, nhưng cái đang được nói đến ở đây có lẽ là LLM. Tôi chưa trực tiếp dùng LLM, và gần đây thì để học tập tôi đã tự cài đặt một mạng nơ-ron nhân tạo nhiều lớp bằng C. Trước đây tôi đã nối một spectrogram giọng nói viết bằng Lisp với các Unix pipe để thử nhận diện âm vị bằng một lớp ẩn; khi chỉ có nguyên âm thì hoạt động khá ổn, nhưng khi thêm các âm như l, r, s, z thì hiệu năng giảm đi. Có vẻ code C không có bug, nhưng tôi không biết cách huấn luyện ANN một cách hiệu quả. Tôi đã thử tăng tập huấn luyện, thêm lớp và thay đổi số nơ-ron ở lớp ẩn, nhưng các kỹ thuật debug thông thường không thực sự hiệu quả
linsomniac: Đã thiết kế lại hệ điều hành workstation với NixOS và Claude Code và thành công lớn
Tôi thích cấu hình có thể tái tạo dựa trên kho git của NixOS và khả năng khởi động lại vào cấu hình trước đó khi làm hỏng thứ gì đó, nhưng việc tự học và tự triển khai thủ công thì quá nặng. Tôi đã vọc khoảng 2 năm nhưng vẫn chưa đạt tới một cấu hình workstation hoàn chỉnh, và vì phải nâng cấp Ubuntu 22.04 nên đã quyết định thử NixOS một cách nghiêm túc trước khi lên 26.04. Lần này tôi cấu hình mọi thứ bằng Claude Code và đã dùng được một tuần mà chưa thấy thiếu gì. Tôi áp dụng cách tiếp cận từng bước: cài trước lên một laptop cũ rồi sau đó cài lại workstation hiện tại, và nhờ NixOS nên việc cấu hình máy thứ hai chỉ còn là chuyện nhỏ. Giờ thì dù phần cứng có chết, tôi chỉ cần lấy
/etc/nixosra và build lại. Tôi cũng đã dùng Claude Code để tạo mộtneovim.nixkhoảng 700 dòng chỉ chứa đúng những tính năng mình muốn thay vì LunarVim/AstroVim, bao gồm cả LSP và TreeSitterrockmeamedee: https://github.com/amedeedaboville/mish là một bản clone của mosh dùng lớp truyền tải QUIC
Nó có thể dùng cả datagram không đáng tin cậy kiểu UDP lẫn stream đáng tin cậy kiểu TCP, nên có buffer cuộn ngược. Nhờ QUIC, nó cũng có thể giao phần mã hóa cho giao thức này xử lý, nên không cần phải tin một LLM tự triển khai mã hóa. Nó dùng alacritty để xử lý terminal, và nhờ russh, một bản triển khai SSH bằng Rust, nên chạy được cả ở môi trường không cài SSH, ví dụ như Windows mà mosh truyền thống không hỗ trợ. Claude đã chạy kiểm thử end-to-end, mô phỏng mạng kiểu FoundationDB, kiểm thử thứ tự luồng bất đồng bộ tokio, 12 mục tiêu fuzzing, và kiểm tra mô hình giao thức nhẹ theo cả hai chiều, và nó tìm ra lỗi ở mỗi vòng fuzzing. Ngoại trừ kiểu trường hợp “có thể có lỗi nhưng tôi đã chứng minh được tính đúng đắn”, nó có vẻ đáng tin cậy ngang, thậm chí có thể hơn bản gốc
stonlyb: Workhorse là một bộ script/công cụ CLI biến laptop cũ thành node tính toán/lưu trữ headless qua SSH, rồi để máy chính offload công việc sang đó
Thành phần chính là onpro, một script định tuyến kiểm tra box, chạy lệnh từ xa và tự động fallback về cục bộ nếu máy kia đang ngủ hoặc bị rút nguồn. Hook PreToolUse trong thiết lập AI coding sẽ chặn các lệnh nặng như build, test, ffmpeg, OCR, hay các tác vụ pandas lớn để chạy chúng trên workhorse thay vì MacBook Air. Agent quyết định sẽ chạy gì, còn lớp quyết định bảo đảm các tác vụ nặng được chuyển tới đúng máy. Tôi sẽ chia sẻ sau khi thử nghiệm thêm một chút. https://motate.app/ là một thử nghiệm ban đầu để giúp việc viết toán dễ hơn khi tôi đang ôm trẻ sơ sinh trong lúc ôn lại đại số tuyến tính, và giờ tôi đang nghĩ cách làm nó hữu ích rộng hơn cho việc viết và giảng dạy khoa học/toán
xlii: Có vài cái, nhưng có những thứ tôi đặc biệt tự hào
https://github.com/exlee/pikchr_pl là DiagramIDE, nơi bạn có thể script sơ đồ Pikchr bằng TCL, Prolog, Pikchr, và gần đây là mruby trong một workbench kiểu Amiga. https://svg.axk.sh là một công cụ chỉnh sửa SVG bán thủ công để dễ vector hóa các hình ảnh gần-vector do AI tạo ra. https://github.com/exlee/rik là một harness AI dùng trình soạn thảo văn bản làm UI, và nó khiến tôi bật cười mỗi lần dùng. Nó có cá tính nên hay buông vài bình luận kỳ quặc, nhưng ngoài ra là một agent bị giới hạn rất chặt. Đây không phải vibe coding, nhưng AI giúp vượt qua những điểm ma sát lớn dễ hơn nhiều, ví dụ như phần tôi không muốn phải tự làm lại thuật toán căn chỉnh SVG
melvinroest: Tôi đã làm một ứng dụng ghi chú giọng nói tương tự Apple Voice Memos
Giờ tôi tải các ghi chú giọng nói lên iCloud, Claude Code biến chúng thành ghi chú có cấu trúc, và ứng dụng cũng hiển thị những ghi chú đó. Cách dùng là tôi đi bộ một tiếng và nói ra dòng ý thức của mình, rồi Claude sắp xếp lại. Tôi thích việc chỉ cần nói thành tiếng suy nghĩ là nó sẽ cấu trúc hóa chúng. Tôi đã vibe coding nó, và tính cả test thì giờ gần 20 nghìn dòng. Nó hoạt động khá tốt nhưng vẫn có lỗi nên cần làm kỹ phần engineering hơn, còn UX thì hoạt động tốt
vtbassmatt: Làm xong mới thấy phần lớn đều là công cụ cho sở thích xoay quanh game
sách nấu ăn để lưu các công thức cả nhà yêu thích nhằm một ngày nào đó chia tay Pinterest https://github.com/vtbassmatt/Cookbook, pipeline trích xuất dữ liệu và công cụ tìm kiếm cho game thẻ bài Mood Swings https://moodswingsdata.github.io và https://moodswingsdata.github.io/feelings, ứng dụng để cùng bạn bè lặp đi lặp lại việc dựng Magic: the Gathering cube https://github.com/vtbassmatt/popcorn-cube, engine wiki tùy biến cho hệ podcast yêu thích https://github.com/vtbassmatt/totalus-wikium, và trình xem log systemd trên web https://github.com/vtbassmatt/djournal
aleqs: Tôi đã làm một công cụ lint repository đa dụng https://alint.org/ https://github.com/asamarts/alint
Ban đầu mục tiêu là thay thế nhiều script kiểm tra vệ sinh và cấu trúc repo mà tôi thêm vào khi nhìn những thay đổi AI cẩu thả. Sau đó tôi xem qua nhiều repo mã nguồn mở để biết họ đang script hóa những kiểm tra nào, rồi đưa chúng vào công cụ dưới dạng các kiểu quy tắc phổ quát và có thể mở rộng. Nó cho phép định nghĩa theo kiểu khai báo về cấu trúc repo, độ sạch và các quy tắc khác, đồng thời rất nhanh nên hợp với luồng pre-commit và CI https://alint.org/benchmarks/
shibel: Với Tailscale, nếu trỏ FQDN của một máy đang được chia sẻ vào một domain thì domain đó chỉ hoạt động với người được chia sẻ https://www.youtube.com/watch?v=Vt4PDUXB_fg
Tuy vậy, để người dùng không cần biết cổng ứng dụng cụ thể, bạn phải cho phép truy cập cổng 443/80 của host đó trong Tailscale ACL. Khi đó immich.familydomain.com thì tiện cho gia đình, nhưng serveradmin.familydomain.com trên cùng host đó cũng sẽ có thể truy cập được ở góc độ mạng. Khoảng tháng 1, tôi đã cùng Claude viết trong vài giờ một gateway xác thực bằng Go nhỏ, truy vấn cả Tailscale public API lẫn
localapi, rồi phản hồi cho Caddy dựa trên việc người dùng gửi yêu cầu có thật sự được phép vào cổng đó hay không. Giờ tôi có thể chia sẻ các ứng dụng và subdomain khác nhau theo từng người mà không mất khả năng kiểm soát truy cập chỉ bằng file policy của Tailscale. Lý do không dùng kiểu Authentik là vì người dùng đã đăng nhập vào Tailscale rồi, nên tôi không thấy cần cài và cấu hình thêm một ứng dụng lớn riêng để làm lại cùng việc đó và bắt họ xác thực hai lầnSerenacula: Tôi có một script nhận prompt đầu vào để tạo script mới, rồi tiếp tục chạy các kỹ năng để dần dần kiểm tra và loại bỏ bug
Tôi cũng dùng nó để tạo một script khác nhằm liệt kê và theo dõi toàn bộ các script tùy chỉnh. Còn có công cụ nạp script cục bộ để giới hạn phạm vi các lệnh CLI theo môi trường của từng thư mục cụ thể. Gộp tất cả lại, tôi đang làm và dùng bất cứ thứ gì mà tôi nghĩ có thể tự động hóa được. Tôi từng định viết một bài blog về chuyện này, và chỉ gần đây mới thật sự cảm nhận được rằng thế giới phần mềm cá nhân hóa đã thay đổi thật rồi
neonglow: Tôi đã làm một tiện ích mở rộng trình duyệt mặc định dừng tự động phát ảnh động như GIF
Việc trình duyệt tự động phát ảnh động luôn làm tôi khó chịu, và đến giờ vẫn chưa có điều khiển tích hợp sẵn. Tiện ích mở rộng này hiển thị khung hình đầu tiên và gắn nút phát/dừng lên trên ảnh. Ban đầu nó chỉ là tiện ích cá nhân, nhưng tôi đã đưa nó lên cửa hàng tiện ích của Firefox và Chrome. Đây là một dự án nhỏ giải quyết vấn đề tôi gặp hằng ngày. Firefox: https://addons.mozilla.org/en-US/firefox/addon/gif-control/ Chrome: https://chromewebstore.google.com/detail/gif-control/nhoihin... Rất hoan nghênh báo lỗi và phản hồi. Tôi từng đăng nó lên Show HN trước đây nhưng không có phản hồi nào https://news.ycombinator.com/item?id=48208916
thatmf: Tôi đã vibe code một web app nhỏ có thể cài lên màn hình chính để cho biết cuộc họp đầu tiên ngày hôm sau là lúc nào
Tôi có rất nhiều cuộc họp và chúng thay đổi liên tục, nhưng tôi không muốn đăng nhập tài khoản công việc trên điện thoại hay phải nghĩ tới cả thế giới đó. Tôi chỉ muốn biết mình phải thức dậy lúc nào. Ứng dụng chỉ hiển thị thời gian, và khi chạm vào thì có thể xem tiêu đề. Phông chữ và màu sắc cũng thay đổi tùy theo cuộc họp sớm đến mức nào, và nếu trước 8 giờ sáng thì nó dùng Nosifer. Tôi hoàn toàn có thể tự làm, nhưng có lẽ đã không làm. Tôi nghĩ những tiện ích tùy biến đơn giản và siêu chuyên biệt như thế này rất hợp với vibe coding
asciimoo: Tôi đang làm Hister, một dịch vụ tìm kiếm tự host để giảm phụ thuộc vào công cụ tìm kiếm trực tuyến và câu trả lời AI https://hister.org/ https://github.com/asciimoo/hister
Hister là một bộ lập chỉ mục toàn văn cho website và tệp cục bộ, đồng thời tự động lưu các trang đã truy cập theo đúng cách trình duyệt render. Nó cung cấp giao diện tìm kiếm web và terminal với xem trước kết quả ngoại tuyến và ngôn ngữ truy vấn chi tiết, đồng thời có thể nhanh chóng chuyển sang công cụ tìm kiếm truyền thống khi cần. Với kiểu tìm kiếm “hồi tưởng” để tìm lại nội dung đã từng truy cập, nó mang lại trải nghiệm thân thiện với quyền riêng tư; nhưng với kiểu tìm kiếm “khám phá” để tìm nội dung mới, nó vẫn còn chưa đủ mạnh
hakunin: Tôi đã làm một trình quét dựa trên SQLite, quét qua các bản scan, ghi chú, PDF và hình ảnh trong hệ thống tệp, lưu đường dẫn, rồi cho phép tìm kiếm phần mô tả và văn bản do Mistral OCR cung cấp
Bạn có thể đặt các câu hỏi như “Khi nào tôi cần bảo dưỡng xe?” hoặc “Tìm bức tranh mà con tôi vẽ tặng Ngày của Mẹ”. Tôi dùng một tệp thực thi bash chạy trên Raspberry Pi để mở giao diện chat với các tài liệu này https://github.com/maxim/ringbinder
alphaBetaGamma: Tôi đã làm một công cụ để thiết kế trang sức lấy cảm hứng từ khoa học máy tính và khoa học trong CAD
Tôi viết một DSL để biểu diễn trang sức, rồi để LLM tạo một trình thông dịch sinh ra tệp CAD bằng cadquery. Tôi cũng rút ra bài học rằng LLM khá yếu trong suy luận 3D. Nếu không có AI thì chắc tôi đã không thể dành thời gian cho việc này. Vì tôi không phải lập trình viên frontend, tôi cũng dùng AI để thiết kế cửa hàng trực tuyến, và thật ấn tượng khi vợ tôi, người không có nền tảng kỹ thuật, cũng có thể chỉnh sửa website bằng Claude Code. Kết quả cuối cùng là một cửa hàng bán trang sức như sơ đồ lambda tính số Graham (sơ đồ Tromp) hoặc có hình dạng như toán tử điểm cố định gần với Y-combinator. Y-combinator thực tế lại kém đẹp hơn dưới góc nhìn trang sức https://studio-galois.com
mybbor: Từ trước khi kiểu lập trình agent trở nên phổ biến, tôi đã làm thiết kế sticker cho concert và lễ hội âm nhạc. Làm sticker để phát cho mọi người là cách rất tốt để gặp gỡ người mới.
Tôi cũng làm một agent huấn luyện sức khỏe/wellness bằng OpenClaw để theo dõi calo và lượng rượu bia, rồi ghi vào dashboard cá nhân. Chỉ cần gửi ảnh bữa ăn, nó sẽ ước tính calo để ghi lại, hỗ trợ quyết định ăn uống và còn động viên nữa. Tôi đã dùng kho lưu trữ HAM dashboard https://github.com/VA3HDL/hamdashboard để tạo một dashboard tùy biến tập hợp video địa phương và feed thời tiết, và từ cùng “rabbit hole” đó tôi cũng làm một hướng dẫn tham khảo vô tuyến cho khu vực Sonoma County https://mybbor.com/petaluma-sonoma-ham-radio.html Tôi cũng đã làm gần 12 website nhỏ, dùng một lần cho nhiều sở thích và dự án khác nhau, và rất thích dùng một trình tải tệp lên trên domain ngắn để host nhanh Markdown và HTML rồi chia sẻ cho gia đình, bạn bè và đồng nghiệp. Nó chạy trên Caddy và DigitalOcean VPS, và tôi đã public code https://github.com/RobbyMcCullough/honeydrop
yablak: Tôi đã làm một công cụ sao lưu Google Photos theo kiểu tăng dần hơn so với Google Takeout https://github.com/ebrevdo/gphoto-pull
Sau khi rời Google, tôi cũng làm một phiên bản linter cho IFTTT mà mình từng nhớ nhung https://github.com/ebrevdo/ifttt-lint
jfim: Tôi đã làm cả đống công cụ.
Tôi tạo một công cụ lưu trữ web tự host hỗ trợ pipeline xử lý mở rộng, ví dụ như trích xuất bài viết → dịch → tóm tắt → tạo tag, hoặc tải video → tách audio → chép lời → tóm tắt. Trong quá trình đó, tôi cũng làm một trình duyệt Chromium được quản lý có hỗ trợ extension và WARC, cùng một bộ tổng hợp RSS để tạo feed từ các trang danh sách bài viết bất kỳ không có RSS. Tôi còn có một vòng lặp active learning cho mô hình dọn sạch bài viết bằng cách loại bỏ nhiễu như native ads và các khối tài trợ. Tôi cũng làm một terminal theo tab có tính năng quản lý dự án, kiểu như khởi chạy đồng thời database, app server và Claude Code theo từng tab, rồi nếu terminal đọc được
http://localhost:4000/thì tự động mở trình duyệt đến đúng URL. Ngoài ra còn có một MCP server dạng mô-đun, MCP proxy và OAuth2 DCR để có thể thêm ý tưởng MCP server rồi triển khai cùng Claude chỉ trong vài phút. Tôi cũng có một công cụ nhỏ render hội thoại Claude để có thể liên kết trong Obsidian vault bằng các link nhưconvo://claude-code/-home-jfim-projects-foo/, và nhìn chung tôi dùng khá nhiều cho việc triển khai container Docker trong môi trường tự host. Phần lớn đều nằm trên GitHub nhưng mức độ sẵn sàng thì rất khác nhau.joddystreet: Tôi đã làm vài thứ.
Có một lựa chọn thay thế POPSQL tự host https://github.com/p-raj/collab-sqlc, một lựa chọn thay thế CleanMyMac dựa trên công cụ mã nguồn mở https://github.com/p-raj/open-cleanmymac, một công cụ biến cuộc họp standup thành truyện tranh https://github.com/p-raj/standup-to-comics, và một Pomodoro có thể cấu hình https://github.com/p-raj/open-tomato. Tôi còn vài công cụ riêng tư khác, thậm chí còn chưa gần tới mức hoạt động được.
SdtEE: Quá mệt mỏi với đủ kiểu hành vi kỳ quặc khi mở CSV bằng Excel, tôi bắt đầu làm một trình xem CSV nhanh và gọn nhẹ.
Về sau tôi nhận ra kỹ thuật tải ngay các tệp CSV có kích thước bất kỳ có thể được khái quát thành parser combinator tăng dần và dùng cho mọi định dạng. Vì vậy nó không chỉ đọc file mà còn đọc được cả các nguồn hướng dòng như pipe. Tôi có dùng AI trong quá trình phát triển, nhưng do phải dành nhiều thời gian cho việc thiết kế UX trực quan và nhất quán nên không có mức tăng tốc quá lớn. Nó vẫn chưa thật sự sẵn sàng cho production, nhưng ai quan tâm thì có thể xem https://github.com/Verticalysis/Hitomi
AJRF: Khoảnh khắc kiểu “không ngờ cái này lại làm được” của tôi là tạo driver chạy trong user space cho Nintendo Switch Pro 2 Controller trên Ubuntu bằng GLM 5.
Khi cắm vào thì thiết bị được nhận ra, nhưng bấm nút lại cứ cố bắt đầu quy trình ghép cặp, còn
evtestthì không nhận gì cả. Mô tả đó gần như được dùng nguyên xi làm prompt, và 10 phút sau tôi đã có một driver kèm theo systemd unit vẫn hoạt động được cả sau khi khởi động lại. Thật đáng kinh ngạc.josh_p: Tôi đã làm một bot Telegram về cơ bản gửi danh sách việc cần làm vào buổi sáng và buổi chiều. Nó kết nối với Google Calendar và một cơ sở dữ liệu bộ nhớ tạm khá chắp vá (SQLite), và bọn trẻ bảo nó hãy nói chuyện như Yarnaby trong Silksong
Tôi cũng làm tự động sao lưu Steam save để phòng khi bọn trẻ chơi cùng một game bằng tài khoản của tôi rồi Steam Cloud làm lệch save, và một script tự động chạy lại GitHub Actions thất bại trong các repository có test hay bị flaky. Kiểu mục đích mà bạn tự hỏi liệu có đáng sửa triệt để không. Nó còn tự động cập nhật branch theo main. Tôi cũng có một phần mở rộng YNAB cho bộ harness agent pi để hỗ trợ nhập các khoản mua cần phân loại, rồi đưa nó vào bot Telegram để có thể mô tả khoản mua bằng giọng nói. Trước đây tôi đã có script Python tạo PDF để in proxy cho Magic: The Gathering, và với LLM tôi cho nó tạo các tờ ngăn có tên bộ và biểu tượng để việc sắp xếp những hộp thẻ lớn dễ hơn nhiều
geedy: Tôi đang tự làm một nhân CAD BRep từ đầu
Khi fillet chạy thật sự tốt, tôi dự định sẽ mã nguồn mở nó. Sẽ mất thời gian, nhưng từ lúc bắt đầu 10 tuần trước đến nay đã tiến triển khá nhiều. Mục tiêu trung hạn là phát hành một ứng dụng GUI có thể nhập file STEP và chỉ xử lý fillet chất lượng rất cao. Tôi nghĩ nó sẽ hữu ích với nhiều người dùng đam mê
smeej: Tôi đã dùng Logseq từ lâu, và may mắn là cả Logseq lẫn plugin đều mã nguồn mở
Việc clone plugin tôi hay dùng rồi nói “Claude, hãy làm cho nó hỗ trợ cả X nữa” để thêm tính năng tôi luôn muốn rất thú vị
mike-cardwell: https://gitlab.com/grepular/calendiff theo dõi URL .ics và gửi email thông báo khi lịch thay đổi
https://gitlab.com/grepular/foxcage chạy Firefox bên trong podman để cách ly với host, và tôi chỉ thêm vào vài tính năng mình muốn. https://gitlab.com/grepular/claude-sandbox là một sandbox khác cho Claude, cũng chạy trong podman và có hệ thống proxy mạnh để bảo vệ thông tin xác thực. Hiện tôi đang làm một công cụ làm sạch email, và khi nó đủ tốt để người khác dùng được, tôi sẽ viết bài trên https://www.grepular.com/blog/. Nó áp dụng chính sách cho các phần HTML/SVG/calendar/vcard để cho phép/chặn tag, thuộc tính, CSS và URL schema, làm sạch URL, lấy nội dung từ xa tại thời điểm phân phối rồi đính kèm vào email để chống theo dõi, cùng vô số tính năng khác như tự động mã hóa/giải mã PGP và S/MIME
eternityforest: Tôi đã làm một ứng dụng theo dõi tồn kho chỉ chạy trong trình duyệt bằng yjs và đồng bộ qua peer.js, nhưng dạo này không dùng nhiều nữa https://eternityforest.github.io/Stuffer/
Không phải ứng dụng, nhưng tôi cũng có một hệ thống năng suất cá nhân. Mỗi khi tôi quên điều gì đó, tôi nói với AI và nhờ nó tìm tài liệu tham khảo nghiên cứu về lỗi của con người liên quan đến đúng kiểu sai sót đó, rồi tinh chỉnh dần một chút https://github.com/EternityForest/THUNDERWARS
david_shi: Trong 3 tháng qua tôi đã xây được cách thiết lập cực nhanh agent OpenClaw mới trên cloud https://operator.io
Việc chạy nhiều agent tách biệt trong Telegram, mỗi agent có bộ nhớ và tác vụ riêng, rất hữu ích cho tự động hóa thông báo, theo dõi ngữ cảnh và đóng vai trò như một lớp vỏ não ngoài cho cá nhân
flutas: Tôi đã tạo một cấu hình Home Agent, với các agent chuyên biệt tùy chỉnh quản lý nhiều khía cạnh trong nhà thông qua Home Assistant
Tôi đang cố để chúng học từ phản hồi của người trong nhà nhằm điều chỉnh cho đúng thời điểm. Tôi cũng đã làm vài MCP liên quan. Tôi còn có một máy chủ Claude Code từ xa để có thể xem tổng quan ở cấp độ dự án và chạy/phát triển dự án trên home server thay vì cục bộ trên laptop. Nó hỗ trợ SSH và web UI; web UI có danh sách dự án, một shell được render bằng https://xtermjs.org/, và một bảng tổng quan dạng ô để xem thời điểm kết thúc lượt khi làm nhiều dự án. Tương tự, phiên bản cục bộ sẽ tự động dựng container podman theo phạm vi dự án, truyền thư mục làm việc vào, cài CC/Codex/Grok, chuyển tiếp xác thực và cấu hình của từng agent, rồi đưa bạn vào một shell có cờ môi trường và alias để tắt prompt xin quyền. Ví dụ, claude =
claude --dangerously-bypass-permissions. Tôi cũng có một MCP rất lớn cho phép agent truy cập các tính năng nâng cao của Obsidian, gợi ý/cài đặt/cấu hình plugin, v.v. Nó giúp ích cho năng suất hằng ngày, nhưng phần lớn thời gian tôi vẫn thích tự chạm vào code hơn là bảo mọi thứ bằng promptdanielvaughn: Tôi đang làm một trình duyệt cho nhà thiết kế. Nó cũng là cho người khác, nhưng chủ yếu là để chính tôi dùng
Tôi làm việc với code, nhưng thường không muốn tạo branch hay làm bừa bộn codebase bằng các component demo và file chỉ để thử nhiều ý tưởng. Nếu trình duyệt thông thường có công cụ cho nhà phát triển, thì trình duyệt này có công cụ thiết kế tích hợp. Bạn truy cập ứng dụng, mở vùng canvas xung quanh, kéo các mảnh vào canvas để làm công việc kiểu thiết kế, rồi gộp trở lại vào code. Tất cả diễn ra trong cùng một UI. Nó đủ ngầu để tôi sẽ phát hành công khai, nhưng ngay lúc này nó đã rất hữu ích cho chính tôi https://matry.design/
margarita_dev: Ngay từ đầu tôi luôn có ngôn ngữ lập trình trong danh sách những thứ muốn tự xây dựng, và đã hoàn thiện nó nhờ sự hỗ trợ của AI
Ở công ty tôi thấy hai vấn đề lớn với workflow AI và thư viện kỹ năng: khi toàn bộ workflow là một tệp Markdown 100 bước thì thiếu tính xác định, còn thư viện kỹ năng bằng Markdown thì khả năng kết hợp kém nên vi phạm nguyên tắc DRY. Margarita cho phép Markdown và các toán tử logic cùng tồn tại, để có thể đưa tính xác định vào bằng cấu trúc mã khi cần, rồi chuyển sang mã động bằng LLM khi phù hợp. Ngoài ra nó còn cho phép các prompt có thể kết hợp kiểu như React, nhờ đó giải quyết luôn vấn đề thư viện kỹ năng bị phân tán khắp nơi trong văn bản. Phản hồi trên Reddit khá hờ hững nên chắc tôi sẽ gác lại, nhưng quá trình xây dựng thì cực kỳ thú vị. Tôi cũng đã làm các code agent cho hầu như mọi nhà cung cấp LLM và tự xây harness riêng; đây là một trải nghiệm học hỏi rất tốt nên tôi khuyến khích thử https://www.margarita.run https://github.com/Banyango/margarita
jtap: Tôi vẫn đang tiếp tục làm công cụ quét và lập chỉ mục thẻ Pokemon cho con gái, bạn bè của con bé và cho chính mình https://MyBulkCards.com
Nó gồm một ứng dụng điện thoại và một website; ứng dụng dùng camera để quét thẻ, đưa hình ảnh qua một vài mô hình rồi lưu lại thông tin thẻ cùng vị trí cất giữ. Khá cơ bản thôi, nhưng nó lưu được vị trí hộp như “Box 1 AAA, Box 1 BBB …” để dễ tìm thẻ. Cũng có tính năng bạn bè nên có thể xem những thẻ mà bạn bè xung quanh đang có, và bọn tôi thường xuyên cho nhau mượn thẻ. Quá trình làm ra nó thực sự rất vui, và tôi vừa mới được duyệt trên cửa hàng ứng dụng Android. Sau khi dọn dẹp lại một chút, tôi sẽ sớm phát hành công khai.