2 điểm bởi kiyeonjeon21 20 ngày trước | Chưa có bình luận nào. | Chia sẻ qua WhatsApp

Xin chào.

Dạo gần đây, trong lúc thử nghiệm xem có thể làm video đến đâu với các coding agent như Codex / Claude Code / Cursor, tôi đang xây dựng một CLI tên là VibeFrame.

Tôi cảm thấy phần lớn các công cụ video hiện có đều giữ trạng thái bên trong UI nên agent khó thao tác. Vì vậy, tôi đang phát triển theo hướng để dự án video có thể được xử lý giống như một dự án mã nguồn nhiều nhất có thể.

Luồng cơ bản như sau.

  • STORYBOARD.md: cảnh, lời thuyết minh, thời điểm, cue tạo ảnh/video
  • DESIGN.md: tông, bố cục, typography, hướng chuyển động
  • vibe build: tạo asset + scene composition
  • vibe render: render MP4
  • vibe inspect: kiểm tra kết quả render

Trên thực tế thì dùng như thế này.

curl -fsSL https://vibeframe.ai/install.sh | bash  
vibe setup --scope project  
vibe init launch --from brief.md  
  
# Sau khi để Codex / Claude Code / Cursor v.v.  
# cập nhật STORYBOARD.md và DESIGN.md dựa trên nội dung đã nghiên cứu  
  
vibe build launch --dry-run  
vibe build launch  
vibe render launch  
vibe inspect render launch --cheap  

Phần scene composition chịu ảnh hưởng rất nhiều từ ý tưởng của Hyperframes. Cách tiếp cận là xem các cảnh video như một HTML/CSS/JS composition trên timeline, rồi capture một cách deterministic trong trình duyệt để render thành MP4.

VibeFrame gần hơn với việc đặt thêm một lớp dự án mà coding agent có thể xử lý dễ dàng lên trên mô hình đó. Lấy STORYBOARD.md / DESIGN.md làm source of truth, rồi gắn vào các workflow mang tính agentic như tạo ảnh/video/lời thuyết minh/nhạc với nhiều provider, edit/remix dựa trên FFmpeg, đầu ra JSON, dry-run, cấu hình theo phạm vi project, và inspect report.

Trong demo lần này, ở trạng thái chỉ mới chạy vibe setup --scope project rồi vibe init launch, tôi đã ghi lại quá trình để coding agent nghiên cứu một chủ đề cụ thể, cập nhật STORYBOARD.md / DESIGN.md, rồi build đến MP4 cuối cùng bao gồm cả cue tạo ảnh.

Video toàn bộ quy trình:
https://t.co/YD0SYyODcQ

Vì vẫn còn ở giai đoạn đầu, nên tôi đặc biệt muốn nhận phản hồi về các điểm dưới đây.

  • Việc dùng STORYBOARD.md + DESIGN.md làm giao diện agent cho công việc video có tự nhiên hay không
  • Việc phân tách ba workflow lane là build / generate / edit-remix có dễ hiểu hay không
  • CLI surface có quá rộng hay ngược lại là còn thiếu tính năng nào rõ ràng hay không

Đây là một nỗ lực đưa biên tập video từ GUI sang agentic CLI, nên tôi muốn nghe ý kiến từ những ai từng gặp vấn đề tương tự.

Chưa có bình luận nào.

Chưa có bình luận nào.