2 điểm bởi GN⁺ 5 giờ trước | 2 bình luận | Chia sẻ qua WhatsApp
  • Nhân dịp ra mắt Claude Fable, bài viết châm biếm việc Anthropic đang tiến hóa từ thơ (poem) sang các đối tượng tự sự quy mô doanh nghiệp rồi mở rộng mang tính trào phúng cách đặt tên model trong tương lai
  • Dự đoán có thể sẽ xuất hiện thêm nhiều phần mở rộng ngắn hơn, dài hơn hoặc đa dạng hơn trước và giữa các model hiện có
  • Aphorism, nhỏ hơn Haiku, chỉ có một câu nhưng luôn tạo cảm giác là đúng; còn Marginalia, nhỏ hơn Sonnet, thì cung cấp những lời bình chú thích không được yêu cầu trong code
  • "Fable (xhigh)" được mô tả là 'speedrun phá sản', còn Saga là 'Fable dài dòng hơn nữa'
  • Các model cấp cao giả tưởng càng lên cao thì mức độ dài dòng của câu trả lời, chi phí và tác dụng phụ càng lớn, qua đó châm biếm một cách hài hước quy ước đặt tên model và chi phí/sự quá đà của các model cỡ lớn

Mở đầu — tiền đề của việc mở rộng cách đặt tên

  • Việc Claude Fable ra mắt gần như xác nhận rằng Anthropic đang chuyển từ thơ (poem) sang các đối tượng tự sự quy mô doanh nghiệp (enterprise-scale narrative objects)
  • Để bắt kịp các đối thủ, hãng đang xây dựng một danh mục model rộng khắp được tối ưu cho toàn bộ ngăn xếp văn học (literary stack)

Tên model và mô tả

Tên model Mô tả
Aphorism Chỉ một câu nhưng luôn tạo cảm giác là đúng
Haiku Bài thơ nhỏ, hóa đơn nhỏ
Marginalia Cung cấp những lời bình không được yêu cầu trong code
Abstract Tóm tắt phần suy luận chưa từng được thực hiện
Sonnet Bài thơ độ dài trung bình, hóa đơn cỡ trung bình
Diatribe Một Sonnet đang tức giận
Opus Bài thơ dài, chiếm trọn cả hóa đơn
Treatise Giống Opus nhưng để phần nguồn trích dẫn làm bài tập cho người đọc
Mythos Một Opus đáng sợ
Fable Hoạt động như Mythos cho đến khi câu hỏi trở nên quan trọng
Fable (xhigh) Một màn speedrun phá sản
Saga Một Fable còn dài dòng hơn nữa
Saga (Unabridged) Bao gồm cả câu trả lời cho những câu hỏi không liên quan
Lore Cần Wiki để diễn giải
Cinematic Universe Gộp nhiều Saga bằng một lớp điều phối Lore
Cinematic Universe (Director's Cut) Cùng một câu trả lời nhưng thêm 42% token
Terms of Service Không chịu trách nhiệm đối với câu trả lời hay hậu quả của nó
Overwhelmingly Large Narrative Unit Phải xem phần “tóm tắt tập trước” trước khi dùng
Omnibus Tiếp tục fine-tuning cho đến khi tinh thần được cải thiện

2 bình luận

 

Chuyện đùa nghịch với cách đặt tên là thứ ở đâu cũng giống nhau

 
Ý kiến trên Hacker News
  • Những ứng viên khác có vẻ cũng ổn là Serial, Prequel, Yarn, Head Canon, Overstory, Oeuvre
    Serial thì đưa ra câu trả lời cực kỳ gay cấn rồi kết thúc bằng cliffhanger, giấu luôn đáp án thật, còn Prequel thì thay vì trả lời sẽ cung cấp toàn bộ bối cảnh lịch sử dẫn tới câu hỏi
    Yarn thì cố tình chọn con đường dài và ngoằn ngoèo tới đáp án để tối đa hóa output token, Head Canon thì trả lời đầu vào bằng một lý thuyết kỳ quặc nhưng thú vị của riêng nó
    Overstory biến câu trả lời của tôi thành một siêu câu trả lời lớn hơn, sâu hơn, đan xen với câu trả lời của tám người dùng khác, còn Oeuvre thì tạo ra cả một nhóm tác phẩm đa dạng nhưng gắn kết, trải dài qua nhiều loại hình truyền thông cho mọi câu hỏi, và mỗi tác phẩm đều là một kiệt tác đau lòng

  • Overwhelmingly Large Narrative Unit làm tôi nhớ Iain M. Banks. Thích kiểu tri ân nho nhỏ này dành cho The Culture

  • Tuyệt vời. sagacanon chắc chắn là ứng viên tên mô hình trong tương lai, còn nếu đùa thì tôi cũng muốn thấy “Cinematic Universe”

    • Zack Snyder's Saga cũng là một cái tên ổn
  • Dario Legendarium có lẽ sẽ là tư liệu khá thú vị để các sử gia nghiên cứu nguồn gốc của thời đại này đào bới. Tính chất tương đối của các tổ chức liên quan cũng lộ ra phần nào qua cách đặt tên: {o1,4o,3.5,5.5} vs. {Haiku,Sonnet,Opus} vs. {3.1, 3.5-pro, 3.5-flash, 3.5-flash-lite} vs. {3.7, 3.7-plus, 3.7-max}
    Tiếc là Samsung không góp mặt ở đây. Tôi từng muốn dùng một mẫu có tên Samsung Galaxy S10+ 5G Lite

    • Nếu là IBM thì chắc họ sẽ đặt tên kiểu CICS/370 Neural Transaction Facility: một phân hệ cơ sở xử lý giao dịch ngôn ngữ tự nhiên doanh nghiệp thường trú trên z/OS để tạo spool cho suy luận hướng lô tương tác và quản lý prompt
    • Sony cũng vậy, chắc sẽ ra cái tên kiểu AI-LLM1000XM5 Mark II
    • Galaxy AI 3.8-Flash-Plus Max (xhigh)
    • Samsung Galaxy Brain S26
    • Thật lạ khi không thấy các mô hình Trung Quốc có tên như “Good Fortune 27b” hay “Much Success MoE”
  • Việc Anthropic cố ý làm suy giảm chất lượng câu trả lời cho thấy họ cũng đang tập trung vào thứ ngớ ngẩn. Thay vì làm mô hình tốt nhất có thể, họ lại đang nerf hiệu năng mô hình

    • Kiểu như người dùng là kẻ thù còn khách hàng là trộm cắp
    • Nếu tin thần thoại và ngụ ngôn là sự thật thì cũng nên chuẩn bị tinh thần để thất vọng phần nào
  • Tôi thấy Anthropic đặt tên tốt hơn OpenAI rất nhiều

    • Nhớ cái thời menu xổ xuống của một sản phẩm tiêu dùng dùng bởi 1 tỷ người hỏi nên chọn o3, 4o, 4o-mini, o4-mini, gpt-4.1, gpt-4.1-mini hay gpt-4.5 (Research Preview)
    • Khó mà đặt tên còn tệ hơn OpenAI được
  • Tôi thích việc chữ cái đầu của ba mô hình ban đầu khá khớp với hành vi của chúng: Opus là OP, tức OverPowered, còn Sonnet là SO, kiểu như người yêu vậy. Điều này còn có ý nghĩa hơn ở thời Sonnet 3.7. Haiku thì là HA, giống phản ứng khi nghe một câu đùa nhạt
    Mô hình mới thì tự nhiên cần ba chữ cái, nên thành FAB. Giờ đang chờ ABS và LO

    • Hãy nhìn đây! Ta sẽ cho các ngươi thấy Overclaude!
  • Tractatus: biết rất rõ giới hạn của bản thân nên từ chối nói về quá nhiều chủ đề. Rất thích đánh số câu. Không dùng được vì lỗi context window, và chỉ được vá sau một khoảng trễ đáng kể

  • Prayer: nhấn Enter rồi cầu cho mọi chuyện ổn. Parable: trả lời những câu hỏi mà tôi còn không biết là mình cần hỏi. Bible: hàng chục phiên bản Parable từ nhiều thời đại khác nhau cùng báo cáo về, và các token sẽ được cứu rỗi khi hết hạn