- Xây dựng một mô hình máy học tạo sinh (ML) mang tên
FontoGen để tạo phông chữ
- Mô hình nhận mô tả phông chữ làm đầu vào và xuất ra tệp phông chữ
- Tác giả được truyền cảm hứng từ sự trỗi dậy của AI vào năm 2023 nên bắt đầu khám phá việc tạo SVG từ văn bản, từ đó nảy ra ý tưởng tạo phông chữ
- Mô hình được xây dựng dựa trên bài báo IconShop2, và tác giả phát hiện rằng việc tạo phông chữ có thể thực hiện tương tự như tạo SVG
- Mô hình là một sequence-to-sequence được huấn luyện trên chuỗi gồm embedding văn bản theo sau bởi embedding phông chữ
- Embedding văn bản được tạo bằng mô hình encoder BERT được huấn luyện trước, còn embedding phông chữ được tạo bằng cách chuyển phông chữ thành chuỗi token
- Mô hình là một transformer tự hồi quy chỉ gồm encoder với 16 layer và 8 block, có tổng cộng 73,7 triệu tham số
- Tác giả sử dụng attention BigBird3 để tập trung vào prompt ban đầu và quan sát N token trước đó nhằm nắm bắt phong cách của nhiều glyph trước đó
- Mô hình được huấn luyện trên bộ dữ liệu 71k phông chữ độc nhất, trong đó GPT-3.5 được dùng để tóm tắt nhiều loại mô tả thành một vài từ khóa
- Quá trình huấn luyện kéo dài 127 giờ và dừng lại khi validation loss hầu như không còn cải thiện
- Tác giả đã cải thiện hiệu năng gấp ba lần bằng cách chuyển nhiều bước xử lý sang giai đoạn tiền xử lý bộ dữ liệu nhất có thể
- Tác giả cũng đề xuất các ứng dụng tiềm năng trong tương lai, chẳng hạn tích hợp mô hình vào trình chỉnh sửa phông chữ hiện có để tạo toàn bộ các glyph khác dựa trên một glyph đơn lẻ do nhà thiết kế tạo ra
2 bình luận
Hãy tạo cho tôi một phông chữ dễ thương.
Ý kiến trên Hacker News