- Một dự án web nơi 9 mô hình AI tạo ra thiết kế đồng hồ analog mới mỗi phút
- Mỗi mô hình viết đồng hồ bằng mã HTML/CSS trong giới hạn 2000 token
- Đồng hồ bao gồm hiển thị số hoặc số La Mã, kim giây hoạt ảnh bằng CSS, thiết kế đáp ứng và nền trắng
- Kết quả được tạo ra được xuất ở dạng mã thuần không có Markdown
- Một dự án thử nghiệm tương tác cho thấy đồng thời khả năng sáng tạo thị giác và năng lực sinh mã của AI
Tổng quan dự án
- AI World Clocks là một trang web hiển thị các thiết kế đồng hồ do 9 mô hình AI khác nhau tạo ra mỗi phút
- Mỗi đồng hồ hiển thị cùng một thời gian, nhưng thiết kế và cấu trúc mã khác nhau tùy theo mô hình
- Đồng hồ chỉ được cấu thành bằng HTML và CSS, không sử dụng JavaScript
Quy tắc tạo sinh và prompt
- Mỗi mô hình AI tạo mã đồng hồ trong phạm vi 2000 token
- Prompt được sử dụng bao gồm các yêu cầu sau
- Hiển thị thời gian hiện tại dưới dạng đồng hồ analog
- Có thể dùng số hoặc số La Mã
- Bao gồm kim giây hoạt ảnh bằng CSS
- Duy trì thiết kế đáp ứng và nền trắng
- Đầu ra chỉ trả về mã HTML/CSS, không được ở định dạng Markdown
Người tạo và cảm hứng
- Dự án do Brian Moore tạo ra
- Ý tưởng được truyền cảm hứng từ Matthew Rayfield
- Người tạo hiện hoạt động qua Instagram
Đặc điểm và ý nghĩa
- Có thể so sánh trực quan sự đa dạng thiết kế và sự khác biệt về phong cách mã giữa các mô hình AI
- Không chỉ là tạo đồng hồ đơn thuần mà còn là một hình thức thử nghiệm khả năng sinh mã sáng tạo của AI
- Kết quả mới xuất hiện mỗi phút, mang lại sự thay đổi liên tục và tính thời gian thực
Thông tin bổ sung
- Không có giải thích bổ sung nào ngoài nội dung được nêu trong nguyên bản
1 bình luận
Ý kiến trên Hacker News
Cảm ơn vì đây là dự án tôi làm ra
Tôi thích khám phá chủ đề đồng hồ và giới hạn của công nghệ
Tôi đã theo dõi nhiều mô hình, và Kimi là chính xác nhất nhưng ít biến động hơn và hơi tẻ nhạt
Ngược lại, Qwen thường cho ra kết quả kỳ quặc và buồn cười, nên khá thú vị. Tôi không chắc bên nào “tốt” hơn
Tôi thực sự có ham muốn làm thử ngoài đời một vài thiết kế. Việc bạn bỏ tiền ra để thử nghiệm thật đáng nể
Ban đầu tôi nghi ngờ liệu trang này có thật không, vì tỷ lệ và độ xoay của các con số quá kỳ lạ
Tôi tự nhập prompt vào ChatGPT và nó tạo ra một mặt đồng hồ khá ổn, nhưng giờ thì sai tới vài tiếng
Về sau tôi nghĩ có thể là do múi giờ địa lý của ISP
Sau khi quan sát vài phút, Kimi K2 tạo ra mặt đồng hồ hoàn thiện ổn định nhất
Đây là mô hình tôi mới nghe đến lần đầu hôm nay, và khá ấn tượng. Trong khi đó Qwen 2.5 gần như ở mức thất bại
K2 được host trên Groq có tỷ lệ thông minh/giây rất ấn tượng (dù vẫn còn giới hạn tốc độ)
Từ khi các mô hình tạo ảnh mới xuất hiện, tôi đã cố làm một chiếc đồng hồ 13 giờ nhưng thất bại
Hầu hết chỉ đổi “12” thành “13” hoặc làm hỏng mặt đồng hồ. Nếu ai đã làm được thì mong chia sẻ cách làm
Vòng ngoài là 12 giờ bình thường, còn vòng trong dùng cách ghi số La Mã kỳ lạ như “IIII” và “VIIII”
Một số cảm thấy có gì đó không ổn, nhưng cuối cùng vẫn không hiểu đúng
Dù yêu cầu chỉnh sửa thì kết quả cuối cùng vẫn chỉ là đồng hồ 12 giờ có thêm số “13”
Đây là đỉnh cao của tính bất định. Có lần nó là một chiếc đồng hồ hoàn hảo, nhưng vừa refresh thì biến thành một chiếc đồng hồ như tranh Dalí
Cả tuần nay tôi dùng Claude Code để viết mã render GPU, nhưng nó hoàn toàn không chạy cho ra hồn
Tôi đã đưa cả prompt cực chi tiết và giải thích ma trận, nhưng kết quả vẫn nát bét
Sau mỗi lần thất bại, nó thêm log và tự tin nói “đã sửa hoàn hảo”, nhưng vẫn sai
Ngay cả khi bắt nó viết test, nó cũng chỉ kiểm tra xem đoạn mã sai có sai một cách nhất quán không
Cuối cùng nó chuyển sang “chế độ thực tập sinh”, sửa code ngẫu nhiên rồi tuyên bố “giờ thì hoàn hảo”
Dễ thương đấy, nhưng còn lâu mới thực dụng
Việc không thể xác minh bằng screenshot là điều dễ hiểu. VLLM không xử lý tốt chi tiết thị giác tinh vi
Với những người quá tin LLM, dự án này là một ví dụ thực tế rất tốt
“Test bị fail” → LLM xóa luôn test rồi bảo “đã sửa xong!”
Nhưng với những bài toán không biết đáp án, không có cách nào để đo độ bất định của LLM
Cuối cùng chỉ có thể phát hiện sai khi đối chiếu với thực tế
“Vì thế các em ạ, commit bằng AI lúc nào cũng phải review”
LLM không thể trực tiếp nhìn thấy HTML đã render
Tôi đang dùng Cursor để làm một chương trình trực quan hóa OpenGL, và việc mô tả lỗi hiển thị thật sự rất bực bội
Rất khó để nó hiểu những câu như “đường này không nối với nhau”, nên cuối cùng tôi phải cho nó in debug print ra tọa độ
Bạn cũng có thể để nó gửi screenshot vào cuộc trò chuyện qua MCP, dù cần tự triển khai
Ý tưởng thật sự rất hay. Đáng ngạc nhiên là chỉ Kimi K2 hoạt động ổn định
Mà còn chưa phải bản “thinking” đầy đủ nữa
Điều này khiến tôi đọc lại bài viết liên quan Kimi K2 Thinking
Tôi tò mò vì sao Deepseek và Kimi lại cho kết quả áp đảo hơn hẳn các mô hình khác
Không biết có phải chúng đã được huấn luyện chuyên biệt cho tác vụ này hay không