7 điểm bởi GN⁺ 27 ngày trước | Chưa có bình luận nào. | Chia sẻ qua WhatsApp
  • Mô hình tạo ảnh mới nhất Gemini 3 Pro Image (tên mã "Nano Banana Pro") đang đồng thời khơi dậy cả sự hào hứng lẫn lo lắng trong ngành trực quan hóa kiến trúc
  • Điểm cốt lõi tạo nên khác biệt so với các công cụ AI hiện có là khả năng đọc hiểu bản vẽ (blueprint literacy), tức diễn giải mặt bằng không phải như những đường nét trừu tượng mà như chỉ dẫn kiến trúc
  • Midjourney là "kẻ mộng mơ", DALL-E 3 là "người giao tiếp", còn Nano Banana Pro là "kỹ sư" — vai trò của từng công cụ đang dần phân hóa rõ rệt
  • Trong cộng đồng Reddit r/ArchViz, quan điểm chủ đạo là AI hữu ích cho concept art nhưng chưa đạt độ chính xác ở mức tài liệu thi công
  • Ở thời điểm hiện tại, đây là công cụ hỗ trợ ideation chứ chưa phải vật thay thế cho tài liệu hóa; trong vòng 5 năm tới, AI literacy có thể trở thành năng lực nền tảng của ngành kiến trúc giống như AutoCAD hay Revit

Phản ứng cộng đồng: hào hứng vs. lo lắng

  • Trên Reddit, các cộng đồng r/GeminiAI và r/ArchViz đang thảo luận sôi nổi về Nano Banana Pro, chia sẻ workflow và đồng thời đặt ra câu hỏi khó chịu: "Liệu nghệ sĩ con người có trở nên lỗi thời không?"
  • Một người dùng ở r/ArchViz đưa ra góc nhìn sắc thái hơn: AI rất mạnh, nhưng thiếu độ chính xác cần thiết cho các công việc chuyên môn có rủi ro cao
    • "Khi xin phê duyệt của hội đồng, họp với các bên liên quan hay nộp hồ sơ cho chính quyền địa phương, bạn phải mô tả chính xác bối cảnh xung quanh, và mức độ chi tiết cùng khả năng kiểm soát như vậy là điều AI không làm được"
    • Hallucination của AI (hiện tượng mô hình tạo ra các chi tiết không tồn tại) có thể chấp nhận được trong concept art nhưng lại là vấn đề chí mạng trong tài liệu thi công
  • Với các nhà thiết kế nội thất cần chỉ định loại vải của một nhà sản xuất cụ thể hoặc chi tiết mối nối cụ thể, việc AI chỉ "đoán mò" đáp án là chưa đủ

Góc nhìn chuyên gia: khả năng đọc hiểu bản vẽ

  • Kiến trúc sư kiêm người ủng hộ AI Ismail Seleit đã chia sẻ kết quả thử nghiệm trên LinkedIn
    • Ông đặc biệt ấn tượng với chất lượng đồ họa, đồng thời ngạc nhiên về cách mô hình diễn giải bản vẽ dù đây không phải mô hình dựa trên vector
    • Nano Banana Pro diễn giải bản vẽ theo cách tạo ra ideation kiến trúc thực sự, chứ không chỉ đơn giản là tạo hình ảnh đẹp
  • Người dùng X (Twitter) @ai_for_success cũng có phản ứng tương tự
    • "Tôi đã chuyển bản vẽ này thành hình ảnh 3D chân thực; đây không chỉ là tạo ảnh đơn thuần mà là đọc bản vẽ cho đúng trước, rồi mới tạo ra kết quả cuối cùng phản ánh mọi chi tiết"
  • Chính năng lực "đọc" thay vì chỉ "mơ" mới là điểm khác biệt cốt lõi của thế hệ AI này

Thử nghiệm: bài test thực tế

  • Đã tiến hành thử nghiệm trực tiếp với Nano Banana Pro, từ concept thô tới bản render
  • Công thức prompt được nhiều người dùng khuyến nghị: Subject + Action + Environment + Style + Lighting + Details

Bước 1: Concept

  • Yêu cầu Gemini tạo mặt bằng ý tưởng dạng văn bản cho một bảo tàng
    • Tầng 1: sảnh atrium trung tâm, cầu thang lớn, đại sảnh triển lãm lớn, quán cà phê, cửa hàng quà tặng
    • Tầng 2: sảnh triển lãm phụ, lớp học, văn phòng nhân viên
    • Bên ngoài: khu vườn với lối đi dạo uốn lượn, hữu cơ

Bước 2: chuyển sang "kỹ sư"

  • Khi được yêu cầu tạo "mặt đứng chính diện", mô hình cho thấy khó khăn trong việc duy trì tính nhất quán
  • Khi tải bản vẽ lên và yêu cầu render, Nano Banana Pro trả lời rằng họ không thể trực tiếp tạo file render nhưng có thể đóng vai trò prompt engineer
  • Quá trình này cho thấy "human in the loop" vẫn là yếu tố thiết yếu — con người vẫn cần hướng dẫn và phê duyệt khi AI chuyển dữ liệu thị giác thành prompt mô tả

Bước 3: Thực thi

  • Kết hợp công thức của cộng đồng với đề xuất từ "prompt engineer" để tạo prompt cuối cùng
    • Subject: bảo tàng mỹ thuật hiện đại 2 tầng với mái bằng và ốp đá vôi
    • Environment: khu vườn có lối đi uốn lượn và tác phẩm điêu khắc kim loại trừu tượng
    • Style: render kiến trúc photorealistic, độ phân giải 8K, góc rộng điện ảnh
    • Lighting: giờ vàng, ánh sáng nhân tạo ấm áp tràn ra từ cửa sổ
    • Details: đá bị phong hóa, cụm HVAC trên mái, các silhouette người để tham chiếu tỷ lệ

Kết quả

  • Kết quả đầu ra "tốt nhưng chưa hoàn hảo"
  • Khi yêu cầu các góc nhìn khác hoặc các sơ đồ kiến trúc cụ thể (chẳng hạn isometric cutaway), mô hình thường đi chệch hướng
  • Để giữ sự nhất quán về vị trí vườn điêu khắc hay độ đồng nhất của thanh chia cửa sổ, cần re-prompting liên tục

Nano Banana Pro vs. Midjourney vs. DALL-E

  • Với sự xuất hiện của Nano Banana Pro, "big 3" trong mảng hình ảnh do AI tạo ra đang được định hình thành ba vai trò riêng biệt
  • Midjourney: "kẻ mộng mơ" — mạnh về ánh sáng điện ảnh, chi tiết nghệ thuật và bầu không khí
  • DALL-E 3: "người giao tiếp" — mạnh về tính dễ dùng và độ bám prompt, nhưng thiếu độ chân thực ở kết quả cuối
  • Nano Banana Pro (Gemini): "kỹ sư" — đang mở ra một niche mang tính kỹ thuật hơn
    • Tiềm năng trực quan hóa chân thực và chỉnh sửa tinh vi cao hơn rõ rệt
    • Tái hiện được texture thực tế như độ phong hóa cụ thể của đá vôi hay phản xạ kính chính xác, cho ra kết quả gần với ảnh chụp hơn là tranh vẽ
  • Điểm khác biệt cốt lõi là khả năng đọc hiểu bản vẽ (blueprint literacy)
    • Midjourney xử lý mặt bằng như tập hợp các đường nét trừu tượng và tạo ra các cách diễn giải "nghệ thuật" nhưng không khớp về mặt cấu trúc
    • Nano Banana Pro diễn giải các đường nét như chỉ dẫn kiến trúc, từ đó tạo ra kết quả tôn trọng logic không gian dự kiến

Kết luận: công cụ truyền cảm hứng chứ chưa phải vật thay thế

  • Ở thời điểm hiện tại, vị thế của nhà thiết kế vẫn an toàn; Nano Banana Pro là một cỗ máy ideation xuất sắc, nhưng chưa thể thay thế tài liệu hóa
  • Trong vòng 5 năm tới, trong ngành kiến trúc và xây dựng, AI literacy có thể trở thành năng lực tiêu chuẩn giống như biết AutoCAD hay Revit
    • Ngành này có thể chuyển sang workflow lai, trong đó AI được dùng để lặp đi lặp lại việc khám phá "mood" và "atmosphere" ở giai đoạn đầu, còn độ chính xác cần cho thi công thực tế vẫn được xử lý bằng phần mềm BIM truyền thống
  • Một câu hỏi quan trọng chưa được đưa vào thử nghiệm lần này là chi phí môi trường của việc huấn luyện các mô hình lớn và năng lượng tiêu thụ cho mỗi lần tạo đầu ra
  • Nano Banana Pro không phải là kiến trúc sư hay nhà thiết kế mà là "tấm gương" — phản chiếu ý tưởng rõ ràng và rực rỡ hơn, nhưng vẫn cần bàn tay con người để giữ nó vững vàng

Chưa có bình luận nào.

Chưa có bình luận nào.