mdpresent - Công cụ NO LLM render Markdown thành PPTX/HTML/PDF
(github.com/ch040602)Xin chào. Tôi đang phát triển mdpresent, một công cụ CLI chuyển tài liệu Markdown thành tài liệu thuyết trình có cấu trúc và render ra PPTX, HTML, PDF.
GitHub: https://github.com/ch040602/MdPr
Xem trước theme: https://ch040602.github.io/MdPr/theme-preview/
Khi dùng các công cụ Markdown-to-PPTX hiện có, tôi thường cảm thấy chúng gần giống với việc “đẩy nguyên tài liệu Markdown vào slide”, nên rất khó kiểm soát ổn định việc tách slide, bố cục, tràn nội dung và biểu diễn sơ đồ.
mdpresent không hẳn là công cụ chuyển trực tiếp Markdown sang PPTX, mà hoạt động theo cách trước tiên chuyển Markdown thành Presentation IR là cấu trúc bài thuyết trình, sau đó tạo Layout IR, rồi renderer sinh ra PPTX / HTML / PDF.
Các điểm tôi tập trung gồm:
- NO LLM runtime: Không dùng lời gọi LLM/API bên ngoài trong các bước parsing, phân chia, layout, kiểm chứng và render.
- Giữ Markdown làm nguồn gốc: Dù tài liệu thuyết trình là đầu ra được tạo ra, tài liệu gốc vẫn được giữ ở dạng Markdown để con người có thể tiếp tục đọc và chỉnh sửa.
- Phân chia dựa trên cấu trúc: Chia slide dựa vào heading, density, số lượng list, đơn vị câu, tín hiệu sơ đồ, v.v.
- PPTX có thể chỉnh sửa: Không phải cách đóng phẳng thành ảnh, mà cố gắng tạo text, shape, nhấn mạnh, badge đánh số... dưới dạng các đối tượng có thể chỉnh sửa trong phạm vi có thể.
- So sánh theme/preset: Có thể render cùng một cấu trúc thuyết trình bằng nhiều preset thiết kế để so sánh.
[IMG] mdpresent markdown semantics
Ví dụ, tôi cố gắng không làm phẳng list, phần nhấn mạnh, block quote, hay cách biểu diễn pipeline dựa trên mũi tên trong Markdown thành văn bản thuần túy, mà bảo toàn chúng như thông tin ngữ nghĩa cần thiết cho bài thuyết trình.
Ví dụ sử dụng đơn giản như sau.
Vì vẫn đang ở giai đoạn đầu, đây gần với một engine dựa trên rule để diễn giải Markdown thành cấu trúc thuyết trình hơn là một công cụ tạo PPT đa dụng đã hoàn thiện. Tôi đặc biệt hình dung luồng sử dụng trong đó các agent như Codex/Claude Code tạo bản nháp Markdown, rồi CLI cục bộ render file thuyết trình một cách deterministic như một kỹ năng tự động hóa hỗ trợ.
Những điểm tôi muốn nhận phản hồi gồm:
- Trong cú pháp Markdown, liệu còn cấu trúc nào nên được bảo toàn khi chuyển thành tài liệu thuyết trình hay không
- Khi xuất ra PPTX, nên đặt điểm cân bằng giữa khả năng chỉnh sửa và mức độ hoàn thiện về mặt thị giác ở đâu
- Khi chọn cách chia slide/layout theo kiểu rule-based không dùng LLM, tiêu chí nào sẽ là hợp lý và dễ chấp nhận
Xin cảm ơn.
Chưa có bình luận nào.