2 điểm bởi GN⁺ 2023-11-17 | 1 bình luận | Chia sẻ qua WhatsApp

Ứng dụng chuyển ảnh chụp màn hình thành mã

  • Một ứng dụng đơn giản chuyển ảnh chụp màn hình thành HTML/Tailwind CSS
  • Dùng GPT-4 Vision để tạo mã, và DALL-E 3 để tạo hình ảnh tương tự
  • Xem phần ví dụ bên dưới để xem bản demo

Nội dung cập nhật

  • Thêm tùy chọn tắt việc tạo ảnh DALL-E nếu không cần tạo hình ảnh
  • Có thể xem trực tiếp mã ngay trong ứng dụng
  • Nếu AI áp dụng sai kiểu dáng hoặc bỏ sót phần nào, có thể yêu cầu cập nhật mã

Bắt đầu

  • Ứng dụng gồm frontend React/Vite và backend FastAPI
  • Cần khóa API OpenAI có quyền truy cập GPT-4 Vision API
  • Có hướng dẫn chạy backend và frontend để dùng ứng dụng trên máy cục bộ

Câu hỏi thường gặp (FAQ)

  • Có hướng dẫn cách xử lý khi gặp lỗi trong lúc cấu hình backend
  • Có hướng dẫn cách lấy khóa API OpenAI bao gồm mô hình GPT4 Vision
  • Có hướng dẫn cách gửi phản hồi, yêu cầu tính năng và báo lỗi

Ví dụ

  • Có các ví dụ so sánh bản gốc và bản sao của NYTimes, Instagram, Hacker News, v.v.

Phiên bản được host

  • Bạn phải có khóa OpenAI và cần có quyền truy cập GPT-4 Vision
  • Có thể xem hướng dẫn cài đặt cục bộ trong phần Bắt đầu

Ý kiến của GN⁺

Ứng dụng này là một công cụ đột phá để chuyển ảnh chụp màn hình thành mã web, với điểm quan trọng nhất là tận dụng các công nghệ AI mới nhất như GPT-4 Vision và DALL-E 3. Công nghệ này đặc biệt thú vị và hấp dẫn vì giúp các nhà phát triển web và nhà thiết kế tiết kiệm thời gian, từ đó tập trung nhiều hơn vào công việc sáng tạo. Ngoài ra, tính năng cho phép người dùng trực tiếp chỉ dẫn AI để chỉnh sửa mã còn giúp cải thiện trải nghiệm người dùng và nâng cao độ chính xác của AI.

1 bình luận

 
GN⁺ 2023-11-17
Ý kiến Hacker News
  • Có ý kiến cho rằng công nghệ này giống như phép màu; dù hiểu khái niệm mạng nơ-ron mô hình hóa một tập hàm ánh xạ đầu vào sang đầu ra, việc GPT mô hình hóa quá trình ánh xạ hình ảnh thành các token văn bản HTML+Tailwind rồi để trình duyệt render chúng vẫn rất đáng kinh ngạc.

    Bày tỏ sự kinh ngạc trước việc GPT ánh xạ cường độ pixel của hình ảnh thành các token văn bản HTML và Tailwind, rồi mô hình hóa quá trình trình duyệt diễn giải và render các token đó.

  • Có câu hỏi liệu có thể xem công cụ này như một trình biên dịch sơ đồ hay không, và liệu nó có thể trở thành một phần của pipeline build chuyển đổi các artifact được tạo từ những công cụ như Sketch hoặc Figma sang HTML/CSS/JS hay không.

    Suy ngẫm về khả năng công cụ đóng vai trò như trình biên dịch sơ đồ và khả năng được sử dụng trong pipeline build.

  • Có ví dụ về prompt dùng Tailwind, HTML và JS để xây dựng ứng dụng single-page dựa trên ảnh chụp màn hình trang web do người dùng cung cấp, đồng thời nhấn mạnh chỉ dẫn phải sao chép thiết kế thật chính xác.

    Ví dụ prompt chỉ đạo việc tái tạo chính xác thiết kế trang web bằng Tailwind, HTML và JS.

  • Có ý kiến cá nhân rằng một hướng tiếp cận khác, thay vì defensive prompting, có thể sẽ tốt hơn, nhưng bản thân việc công nghệ này hoạt động được đã là điều đáng kinh ngạc.

    Góc nhìn hoài nghi về defensive prompting và sự thán phục trước việc công nghệ này thực sự hoạt động.

  • Có người nhắc đến một video nghiên cứu trên YouTube nói rằng thêm câu "điều này rất quan trọng với sự nghiệp của tôi" sẽ cải thiện chất lượng đầu ra, và cho rằng cụm này giúp cải thiện chất lượng cho nhiều loại tác vụ khác nhau.

    Nhắc đến tác dụng của một cụm từ cụ thể trong việc nâng cao chất lượng đầu ra.

  • Có ý kiến cho rằng công nghệ này làm mở rộng phạm vi vấn đề có thể giải quyết, từ đó dẫn đến băn khoăn nên tạo ra điều gì và cần nhìn nhận, giải quyết vấn đề theo cách khác đi.

    Suy ngẫm về sự thay đổi trong cách giải quyết vấn đề và cách nhận diện vấn đề mới do tiến bộ công nghệ mang lại.

  • Có người cho rằng việc dùng một mô hình tổng quát để làm việc này là rất ấn tượng, nhưng dữ liệu cho supervised learning cũng có thể được tạo ra khá dễ dàng.

    Ý kiến về sự dễ dàng trong việc tạo dữ liệu cho supervised learning.

  • Có thông tin rằng sẽ cung cấp phiên bản được host thông qua Pico trên GitHub Pages, kèm theo câu hỏi vì sao lại chọn Pico.

    Kế hoạch cung cấp dịch vụ host qua Pico và câu hỏi về lý do lựa chọn này.

  • Có lời khen rằng cách hiển thị bản demo website được tạo ra theo thời gian thực bằng iframe với srcdoc vừa đơn giản vừa thanh lịch.

    Khen ngợi sự ngắn gọn và thanh lịch của cách hiển thị demo website được tạo theo thời gian thực.

  • Có ý kiến cho rằng nếu muốn sao chép một website có sẵn thì dùng Httrack có thể cho kết quả giống hơn và tiết kiệm được chi phí API của GPT.

    Ý kiến về hiệu quả của việc dùng Httrack để sao chép website có sẵn.

  • Có lo ngại rằng công nghệ này sẽ khiến việc tạo các trang phishing trở nên nhanh hơn rất nhiều.

    Lo ngại về việc tốc độ tạo trang phishing sẽ tăng lên.

  • Có ý kiến rằng công cụ này hoàn hảo để đáp ứng các yêu cầu thay đổi liên tục từ quản lý dự án, đồng thời đặt câu hỏi liệu nó có hoạt động cả với những đầu vào mơ hồ như "Make it pop" hay không.

    Câu hỏi về mức độ phù hợp của công cụ với các yêu cầu thay đổi từ quản lý dự án và khả năng xử lý đầu vào mơ hồ.