Tin tức Meetup tháng 1 năm 2025 của Instruct-Korea: "Những ý tưởng và thử thách của tôi khi nghiên cứu mô hình ngôn ngữ"

(lu.ma)

7 điểm bởi sigridjineth 2024-12-25 | Chưa có bình luận nào. | Chia sẻ qua WhatsApp

Cộng đồng Instruct Korea 2024 https://instruct.kr đã trở thành một trong những cộng đồng mô hình ngôn ngữ mã nguồn mở lớn nhất tại Hàn Quốc, nơi khoảng hơn 700 nhà nghiên cứu tự nguyện chia sẻ thành tích của mình, cùng với việc ra mắt bảng xếp hạng LogicKor.

Nhân dịp đón năm mới 2025, chúng tôi muốn tạo cơ hội để các thành viên cộng đồng Discord Instruct Korea chia sẻ xu hướng nghiên cứu, tin tức và có dịp networking. Chủ đề của meetup lần này là "Những ý tưởng và thử thách của tôi khi nghiên cứu mô hình ngôn ngữ". Chúng tôi hy vọng có thể cùng lắng nghe kinh nghiệm của người khác, chia sẻ ý tưởng nghiên cứu của bản thân và giao lưu giữa những người có nhiều quan điểm khác nhau.

Sự kiện diễn ra vào ngày 25/01/2025 (thứ Bảy), 14~18 giờ.

Địa điểm là Nonce (gần ga Gangnam, 624-17 Yeoksam-dong).

Thông tin liên hệ: https://instruct.kr

Tài trợ địa điểm: Nonce Community (https://nonce.community/)

Giới thiệu diễn giả Nhiều diễn giả khác sẽ sớm được cập nhật.

Go Seok-hyeon (Sionic AI) Will chia sẻ: sẽ kể về câu chuyện xử lý ngôn ngữ tự nhiên với Scala JVM. Đặc biệt, sẽ nói về kinh nghiệm port code deep learning dựa trên Python sang ngôn ngữ JVM để serve ở môi trường production.

Kim Ji-soo (kuotient, Allganize): Qwen2.5 Korean Model Development "Qwen2.5 Korean Model Development" sẽ chia sẻ quy trình phát triển mô hình ngôn ngữ đột phá. Đặc biệt, quá trình tạo ra mức cải thiện ấn tượng lên 37.60 trên m-ArenaHard là điểm nổi bật. Sẽ trình bày toàn bộ pipeline huấn luyện gồm SFT, Merging, Alignment, và giới thiệu các đổi mới kỹ thuật được thử nghiệm lần đầu tại Hàn Quốc như thay thế tầng (layer) và áp dụng chiến lược On-policy. Sẽ kể chi tiết bí quyết đạt hiệu năng tốt nhất trong các mô hình dưới 8B.

Lee Seung-yu (dopeornope, Marker AI): LLM Guidance và Quantization Dưới chủ đề "LLM Guidance và Quantization", cuộc thảo luận sẽ làm nổi bật xu hướng mới nhất của công nghệ LLM đang phát triển nhanh. Bài nói chuyện cung cấp phân tích sâu sắc về khái niệm và hướng đi của công nghệ LLM guidance và quantization đang được nghiên cứu sôi nổi gần đây.

Yoo Yong-sang: Kinh nghiệm tham gia cuộc thi Mô hình ngôn ngữ Tài chính KRX "Báo cáo sau cuộc thi KRX về mô hình ngôn ngữ tài chính" sẽ chia sẻ kinh nghiệm thực tiễn phát triển mô hình chuyên biệt theo miền. Nội dung gồm chiến lược domain adaptation và continual pretraining nhằm nâng cao hiệu năng benchmark MCQA, cùng phân tích sâu về safety auditing.

Choi Seon-ung: Câu chuyện dự án phát triển RAG Sẽ chia sẻ trải nghiệm thực tế từ dự án phát triển RAG. Đặc biệt sẽ chỉ ra thẳng các vấn đề phát sinh trong quá trình thực hiện dự án và đề xuất bài học rút ra cùng hướng cải tiến.

Jang Young-jun (yjoonjang): Mô hình embedding tiếng Hàn "Mô hình embedding tiếng Hàn" với chủ đề huggingface.co/nlpai-lab sẽ chia sẻ các đặc trưng của nhiều mô hình embedding và các điểm mấu chốt trong quá trình huấn luyện thực tế. Từ lựa chọn mô hình embedding đến huấn luyện, sẽ cung cấp những insight có thể áp dụng ngay trong công việc.

Jeong Se-min (Sionic AI): Xây dựng Recsys với Graph RAG - Storm fooding Dưới chủ đề "Xây dựng Recsys với Graph RAG - Storm fooding", sẽ chia sẻ kinh nghiệm phát triển hệ thống đề xuất dựa trên Graph RAG. Sẽ trình bày toàn bộ quy trình từ thiết kế hệ thống đến triển khai.

Kim Dong-gyu (Jeffrey Kim, AutoRAG): Nhận 3.000 sao GitHub "Nhận 3.000 sao GitHub" sẽ kể câu chuyện tăng trưởng của dự án mã nguồn mở AutoRAG. Chia sẻ hành trình từ lúc bắt đầu dự án đến khi thành công trở thành mã nguồn mở, cùng định hướng phát triển tiếp theo.

maywell (instruct.kr, Wanot AI) TBD

Tin tức Meetup tháng 1 năm 2025 của Instruct-Korea: "Những ý tưởng và thử thách của tôi khi nghiên cứu mô hình ngôn ngữ"

Bài viết liên quan

Chưa có bình luận nào.