- Có thể suy luận mô hình Llama 2 cỡ nhỏ trong C thuần túy.
- Đoạn mã này cho phép huấn luyện kiến trúc Llama 2 LLM trong PyTorch và lưu trọng số thành tệp nhị phân thô.
- Sau đó có thể tải các trọng số đó vào tệp C.
- Tệp C có thể chạy các mô hình khá lớn với tốc độ rất nhanh.
- Dự án này được tạo như một dự án cuối tuần, không phải là thư viện dùng cho production.
- Có thể tải xuống mô hình đã được huấn luyện sẵn và chạy trong C.
- Mã C stream các token thô, và có thể chuyển chúng thành văn bản bằng một wrapper đơn giản.
- Mã C chạy với tốc độ khoảng 100 token/giây trên M1 MacBook Air.
- Đầu ra của mã C là văn bản được sinh ra dựa trên mô hình.
- Dự án này tập trung vào một ứng dụng cụ thể và huấn luyện cùng một kiến trúc từ đầu.
- Có thể tải xuống bộ dữ liệu nguồn, tiền token hóa trước, rồi huấn luyện mô hình.
- Có thể điều chỉnh hyperparameter để tạo mô hình tốt hơn.
- Cũng có thể chạy script suy luận PyTorch để so sánh.
- Có thể thực hiện kiểm thử chi tiết bằng script kiểm thử được cung cấp.
- Dự án này cần các tệp
model.bin và model.ckpt từ quá trình huấn luyện PyTorch.
- Trong văn bản có đề cập đến một vài việc cần làm và câu hỏi.
- Dự án này được phát hành theo giấy phép MIT.
1 bình luận
Ý kiến trên Hacker News