OpenOrca - Bộ dữ liệu & mô hình ngôn ngữ đã được tinh chỉnh theo chỉ dẫn mã nguồn mở

xguru · 2023-07-01T10:32:01+09:00

Được tạo bằng cách lấy nội dung từ bài báo Orca của Microsoft và tái tạo lại dưới dạng mã nguồn mở Khoảng 1 triệu mục FLANv2 được tăng cường bằng GPT-4 Completion Khoảng 3,5 triệu mục FLANv2 được tăng cường bằng GPT-3.4 Completion Bao gồm toàn bộ 75k CoT có trong bộ dữ liệu FLAN-1m Hiện đang tiến hành fine-tune toàn bộ trọng số trên nền tảng LLaMA-13B, nên hiệu năng sẽ trở nên tương tự với bản của Microsoft Có thể phát hành OpenOrca-LLaMA-13b vào khoảng giữa tháng 7 Đang tìm nhà tài trợ GPU computing để áp dụng OpenOrca cho các nền tảng khác (Falcon, LLaMA, MPT, v.v.)

(huggingface.co)

6 điểm bởi xguru 2023-07-01 | 2 bình luận | Chia sẻ qua WhatsApp

Được tạo bằng cách lấy nội dung từ bài báo Orca của Microsoft và tái tạo lại dưới dạng mã nguồn mở
- Khoảng 1 triệu mục FLANv2 được tăng cường bằng GPT-4 Completion
- Khoảng 3,5 triệu mục FLANv2 được tăng cường bằng GPT-3.4 Completion
Bao gồm toàn bộ 75k CoT có trong bộ dữ liệu FLAN-1m
Hiện đang tiến hành fine-tune toàn bộ trọng số trên nền tảng LLaMA-13B, nên hiệu năng sẽ trở nên tương tự với bản của Microsoft
- Có thể phát hành OpenOrca-LLaMA-13b vào khoảng giữa tháng 7
Đang tìm nhà tài trợ GPU computing để áp dụng OpenOrca cho các nền tảng khác (Falcon, LLaMA, MPT, v.v.)

2 bình luận

ninebow 2023-07-02

Ôi, link bị 404 rồi.

Bạn có thể xem dataset tại Open-Orca/OpenOrca của HuggingFace! :D

xguru 2023-07-02

Ồ, có vẻ bài viết đã bị xóa rồi.

Vẫn còn trên WaybackMachine.

https://web.archive.org/web/20230629002546/…

Tôi đã sửa liên kết thành liên kết HuggingFace mà bạn đã đăng.

OpenOrca - Bộ dữ liệu & mô hình ngôn ngữ đã được tinh chỉnh theo chỉ dẫn mã nguồn mở

Bài viết liên quan

2 bình luận