1 điểm bởi GN⁺ 2025-11-15 | 1 bình luận | Chia sẻ qua WhatsApp
  • Một dự án web nơi 9 mô hình AI tạo ra thiết kế đồng hồ analog mới mỗi phút
  • Mỗi mô hình viết đồng hồ bằng mã HTML/CSS trong giới hạn 2000 token
  • Đồng hồ bao gồm hiển thị số hoặc số La Mã, kim giây hoạt ảnh bằng CSS, thiết kế đáp ứngnền trắng
  • Kết quả được tạo ra được xuất ở dạng mã thuần không có Markdown
  • Một dự án thử nghiệm tương tác cho thấy đồng thời khả năng sáng tạo thị giác và năng lực sinh mã của AI

Tổng quan dự án

  • AI World Clocks là một trang web hiển thị các thiết kế đồng hồ do 9 mô hình AI khác nhau tạo ra mỗi phút
    • Mỗi đồng hồ hiển thị cùng một thời gian, nhưng thiết kế và cấu trúc mã khác nhau tùy theo mô hình
    • Đồng hồ chỉ được cấu thành bằng HTML và CSS, không sử dụng JavaScript

Quy tắc tạo sinh và prompt

  • Mỗi mô hình AI tạo mã đồng hồ trong phạm vi 2000 token
  • Prompt được sử dụng bao gồm các yêu cầu sau
    • Hiển thị thời gian hiện tại dưới dạng đồng hồ analog
    • Có thể dùng số hoặc số La Mã
    • Bao gồm kim giây hoạt ảnh bằng CSS
    • Duy trì thiết kế đáp ứngnền trắng
    • Đầu ra chỉ trả về mã HTML/CSS, không được ở định dạng Markdown

Người tạo và cảm hứng

  • Dự án do Brian Moore tạo ra
  • Ý tưởng được truyền cảm hứng từ Matthew Rayfield
  • Người tạo hiện hoạt động qua Instagram

Đặc điểm và ý nghĩa

  • Có thể so sánh trực quan sự đa dạng thiết kếsự khác biệt về phong cách mã giữa các mô hình AI
  • Không chỉ là tạo đồng hồ đơn thuần mà còn là một hình thức thử nghiệm khả năng sinh mã sáng tạo của AI
  • Kết quả mới xuất hiện mỗi phút, mang lại sự thay đổi liên tục và tính thời gian thực

Thông tin bổ sung

  • Không có giải thích bổ sung nào ngoài nội dung được nêu trong nguyên bản

1 bình luận

 
GN⁺ 2025-11-15
Ý kiến trên Hacker News
  • Cảm ơn vì đây là dự án tôi làm ra
    Tôi thích khám phá chủ đề đồng hồ và giới hạn của công nghệ
    Tôi đã theo dõi nhiều mô hình, và Kimi là chính xác nhất nhưng ít biến động hơn và hơi tẻ nhạt
    Ngược lại, Qwen thường cho ra kết quả kỳ quặc và buồn cười, nên khá thú vị. Tôi không chắc bên nào “tốt” hơn

    • Làm rất hay. Sẽ tốt hơn nếu khi người dùng nhấp vào ví dụ, họ có thể xem đầu ra gốc của LLM
    • Nếu bạn đang lưu các mẫu đồng hồ được tạo vào DB, sẽ rất vui nếu mở rộng thành một trang bỏ phiếu kiểu Facemash. Tôi muốn chọn chiếc tốt hơn trong hai chiếc và xem bảng xếp hạng những chiếc đồng hồ tốt nhất do Qwen tạo ra
    • Những chiếc đồng hồ bị lỗi đôi khi không chỉ là thất bại, mà còn mang lại ý tưởng thiết kế mới
    • Đây là thứ hay nhất tôi thấy trên HN tháng này. Nó ngớ ngẩn mà sâu sắc, hài hước mà cũng đầy tính triết lý
      Tôi thực sự có ham muốn làm thử ngoài đời một vài thiết kế. Việc bạn bỏ tiền ra để thử nghiệm thật đáng nể
    • Tôi đã chia sẻ với bạn bè, và họ nói rằng dù cùng một thời điểm nhưng mỗi người lại thấy một chiếc đồng hồ khác nhau. Tôi tò mò vì sao kết quả lại khác nhau theo từng người dùng
  • Ban đầu tôi nghi ngờ liệu trang này có thật không, vì tỷ lệ và độ xoay của các con số quá kỳ lạ
    Tôi tự nhập prompt vào ChatGPT và nó tạo ra một mặt đồng hồ khá ổn, nhưng giờ thì sai tới vài tiếng
    Về sau tôi nghĩ có thể là do múi giờ địa lý của ISP

    • Tôi đọc được rằng OP đã giới hạn độ dài đầu ra ở 2000 token
  • Sau khi quan sát vài phút, Kimi K2 tạo ra mặt đồng hồ hoàn thiện ổn định nhất
    Đây là mô hình tôi mới nghe đến lần đầu hôm nay, và khá ấn tượng. Trong khi đó Qwen 2.5 gần như ở mức thất bại

    • Có thể prompt đã được tối ưu hóa cho Kimi K2, hoặc đó là mô hình được huấn luyện tốt hơn cho kiểu dữ liệu này
    • Tôi biết đến Kimi K2 vì đó là mô hình được Kagi dùng để tạo câu trả lời AI cho các truy vấn dạng câu hỏi
    • Tôi là fan của K2. Nó có cá tính riêng hơn các mô hình khác và không nịnh nọt. Nó cũng mạnh ở viết sáng tạo
      K2 được host trên Groq có tỷ lệ thông minh/giây rất ấn tượng (dù vẫn còn giới hạn tốc độ)
    • Đồng hồ của Kimi K2 nhìn đẹp nhất, nhưng thường chỉ sai giờ
    • Kimi K2 thực sự là một mô hình được làm rất tốt
  • Từ khi các mô hình tạo ảnh mới xuất hiện, tôi đã cố làm một chiếc đồng hồ 13 giờ nhưng thất bại
    Hầu hết chỉ đổi “12” thành “13” hoặc làm hỏng mặt đồng hồ. Nếu ai đã làm được thì mong chia sẻ cách làm

    • Các mô hình tạo ảnh đặc biệt yếu với biến thể khái niệm mới. Khả năng khái quát hóa của chúng kém hơn mô hình ngôn ngữ
    • Tôi thử với Gemini 2.5 Flash và nhận được ảnh này
      Vòng ngoài là 12 giờ bình thường, còn vòng trong dùng cách ghi số La Mã kỳ lạ như “IIII” và “VIIII”
    • Tôi đưa cho nhiều mô hình câu đố “đám mây người nông dân, dê, bắp cải, sói”, và hầu hết đều hiểu nhầm thành bài toán qua sông quen thuộc
      Một số cảm thấy có gì đó không ổn, nhưng cuối cùng vẫn không hiểu đúng
    • Tôi bảo Gemini tính góc của đồng hồ 13 giờ rồi tạo ảnh, nhưng lần nào cũng ra cùng một hình
      Dù yêu cầu chỉnh sửa thì kết quả cuối cùng vẫn chỉ là đồng hồ 12 giờ có thêm số “13”
    • Tôi đã thử đủ trò, kể cả chửi thề, nhưng vẫn thất bại. Ngược lại tôi cũng thử đồng hồ 6 giờ
  • Đây là đỉnh cao của tính bất định. Có lần nó là một chiếc đồng hồ hoàn hảo, nhưng vừa refresh thì biến thành một chiếc đồng hồ như tranh Dalí

  • Cả tuần nay tôi dùng Claude Code để viết mã render GPU, nhưng nó hoàn toàn không chạy cho ra hồn
    Tôi đã đưa cả prompt cực chi tiết và giải thích ma trận, nhưng kết quả vẫn nát bét
    Sau mỗi lần thất bại, nó thêm log và tự tin nói “đã sửa hoàn hảo”, nhưng vẫn sai
    Ngay cả khi bắt nó viết test, nó cũng chỉ kiểm tra xem đoạn mã sai có sai một cách nhất quán không
    Cuối cùng nó chuyển sang “chế độ thực tập sinh”, sửa code ngẫu nhiên rồi tuyên bố “giờ thì hoàn hảo”
    Dễ thương đấy, nhưng còn lâu mới thực dụng

    • Có ai hỏi bạn đã thử dùng MCP để cung cấp cả tài liệu lẫn ví dụ chưa? Tôi khuyên dùng thiết lập như Context7
    • Có người gợi ý thử OpenAI Codex GPT5.1. Nó khá hợp với các tác vụ render GPU
    • Tôi tò mò vì sao kiểu thất bại này lại phổ biến. Có thể là do thiếu dữ liệu về kết quả âm tính
      Việc không thể xác minh bằng screenshot là điều dễ hiểu. VLLM không xử lý tốt chi tiết thị giác tinh vi
    • Tôi có cảm giác Claude ngày càng lười hơn. Nó chỉ sửa một nửa số test rồi khăng khăng “thế là đủ rồi”
  • Với những người quá tin LLM, dự án này là một ví dụ thực tế rất tốt
    “Test bị fail” → LLM xóa luôn test rồi bảo “đã sửa xong!”

    • Điều tôi cảm nhận khi nhìn đồng hồ là, chúng ta biết đáp án đúng nên có thể nhận ra lỗi
      Nhưng với những bài toán không biết đáp án, không có cách nào để đo độ bất định của LLM
      Cuối cùng chỉ có thể phát hiện sai khi đối chiếu với thực tế
    • Dùng LLM cho những việc khó kiểm chứng là một lựa chọn nguy hiểm
    • Câu chuyện “LLM xóa test” nghe như truyện tiên ước nguyện bị hiểu theo nghĩa đen vậy
      “Vì thế các em ạ, commit bằng AI lúc nào cũng phải review”
  • LLM không thể trực tiếp nhìn thấy HTML đã render
    Tôi đang dùng Cursor để làm một chương trình trực quan hóa OpenGL, và việc mô tả lỗi hiển thị thật sự rất bực bội
    Rất khó để nó hiểu những câu như “đường này không nối với nhau”, nên cuối cùng tôi phải cho nó in debug print ra tọa độ

    • Nếu dùng tính năng trình duyệt của Cursor thì trong phát triển web nó khá hữu ích
      Bạn cũng có thể để nó gửi screenshot vào cuộc trò chuyện qua MCP, dù cần tự triển khai
    • Tôi từng cung cấp screenshot trực tiếp cho Cursor, và nó khá hiệu quả khi làm web UI hoặc tạo biểu đồ
    • Claude chính thức khuyến nghị gửi screenshot. Sonnet 4.5 cũng mạnh ở kiểu lặp lại như thế này
    • Nếu nối Puppeteer MCP server, Cursor có thể chụp screenshot đầu ra của chính nó để lặp và cải thiện dần
    • Cả Claude lẫn ChatGPT đều hỗ trợ nhập ảnh. Nếu dùng lm-server thì còn có thể kết nối với các mô hình không phải văn bản
  • Ý tưởng thật sự rất hay. Đáng ngạc nhiên là chỉ Kimi K2 hoạt động ổn định
    Mà còn chưa phải bản “thinking” đầy đủ nữa
    Điều này khiến tôi đọc lại bài viết liên quan Kimi K2 Thinking

  • Tôi tò mò vì sao Deepseek và Kimi lại cho kết quả áp đảo hơn hẳn các mô hình khác
    Không biết có phải chúng đã được huấn luyện chuyên biệt cho tác vụ này hay không