1. Giới thiệu bản thân
Xin chào.
Tôi là nhà phát triển độc lập đã từng giới thiệu trình đọc eBook (Folio) lần trước.
Khi chỉnh sửa video, đôi lúc bạn muốn xóa nền mà không cần chroma key,
hoặc muốn tách riêng giọng hát hay chỉ một nhạc cụ cụ thể từ bản nhạc,
vì vậy tôi đã tự làm ra công cụ này với ý tưởng giải quyết cả xóa nền và tách âm thanh trong một công cụ duy nhất.
2. Tóm tắt dịch vụ trong một câu
AlphaClip là ứng dụng desktop có thể tự động xóa nền video bằng AI và tách âm thanh thành các track riêng lẻ (vocal, drum, bass, guitar, v.v.).
3. Giới thiệu dịch vụ
AlphaClip (Habom) là công cụ AI tập trung vào hậu kỳ video.
- Tự động xóa nền video bằng AI (khuyến nghị nền trắng hoặc nền đen)
- Tách âm thanh thành các track riêng lẻ (vocal, drum, bass, guitar, v.v.)
- Có thể xóa nền sạch sẽ mà không cần thiết bị chroma key
- Tự động hóa tính năng xóa nền của After Effects theo cách đơn giản và tiện hơn
Có thể sử dụng cho việc tạo video nhân vật, chỉnh sửa âm nhạc và hậu kỳ video.
4. Tính năng chính
🎬 Xóa nền video
- Xóa nền tự động dựa trên AI
- Tách riêng chủ thể mà không cần chroma key
- Hỗ trợ tăng tốc GPU (CUDA) để cải thiện tốc độ xử lý
🎵 Tách âm thanh
- Trích xuất các track riêng như vocal / drum / bass / guitar
- Có thể tách riêng đúng nhạc cụ mong muốn từ bản nhạc
🎞️ Tạo video nhân vật
- Tạo video nhân vật hoàn chỉnh bằng AI
5. Tech stack
- Python (phát triển dựa trên vibe coding)
- CUDA (tăng tốc GPU)
- Mô hình AI (xóa nền / tách âm thanh)
6. Những khó khăn trong quá trình phát triển
- Tối ưu việc sử dụng GPU thông qua thiết lập CUDA
- Cân bằng giữa chất lượng xóa nền và tốc độ xử lý
- Xử lý các lỗi còn sót lại do mới phát triển được 1 tuần bằng vibe coding
7. Trạng thái hiện tại
- Đã phát triển khoảng 1 tuần bằng vibe coding
- Hiện đang tập trung vào việc hiện thực tính năng, vẫn còn một số lỗi
- Dự kiến sẽ công khai miễn phí trong thời gian tới và tiếp tục cải thiện
- Về sau có kế hoạch sử dụng để tạo nhân vật hoạt hình và background (78 lá) cho ứng dụng tarot card
- Mục tiêu cuối cùng là gom các dự án nhỏ lại để tạo thành một pipeline tự động hóa thống nhất
Hiện tại tôi đang đồng thời xử lý 2~4 đầu việc, nên có lẽ cần chọn lọc và tập trung hơn một chút!
Nói ngắn gọn thì,
- RVC, nói đơn giản là dùng học/suy luận speech-to-speech để thay đổi giọng nói nhân vật
- Trang market bên dưới cũng đã mất khoảng 1 tháng để hoàn tất tới phần thanh toán, nhưng vẫn sẽ tiếp tục cải thiện
- Công cụ quản lý thông báo ứng dụng (APNs/FCM), công cụ phân tích funnel (tương tự google analysis)
Ngoài ra còn nữa, nhưng dù có mất thời gian tôi cũng sẽ từ từ giới thiệu từng cái một!!
8. Mong muốn là gì?
- Phản hồi từ người dùng thực tế (rất hoan nghênh báo lỗi!! Gửi qua video hoặc SNS lúc nào cũng được!)
- Ý kiến về workflow chỉnh sửa video
Nếu có điểm nào còn thiếu sót hoặc ý tưởng cải thiện, hãy thoải mái chia sẻ nhé!
Mong mọi người xem video thật vui!
Tôi đã thử làm video dưới đây bằng chương trình này, mong mọi người xem vui vẻ(?) :)
Video demo
https://www.youtube.com/watch?v=lZhiMreW94Q
- Công cụ theo dõi CPU/GPU xuất hiện trong video cũng đã được tôi đưa lên market nữa nhé!!
(Tôi làm nó chỉ trong 30 phút đến 1 tiếng khi nghỉ giữa lúc làm alphaclip Habom tools!! )
⬇️ Link tải xuống
📥 Tải xuống: https://market.habom.kr
Chưa có bình luận nào.