1 điểm bởi GN⁺ 3 giờ trước | 1 bình luận | Chia sẻ qua WhatsApp
  • GLM-5.2 là mô hình mã nguồn mở hỗ trợ ngữ cảnh 1M có thể dùng thực tế và khả năng tự thực hiện các tác vụ dài hạn, cung cấp nền tảng để xây dựng các ứng dụng agent phức tạp
  • Trong bối cảnh quyền truy cập vào các mô hình frontier đột ngột bị chặn vì lý do phi kỹ thuật, khoa học cần mang tính toàn cầu và con đường tiến tới AGI không nên bị giam sau những rào cản cao
  • AGI không nên là một đặc quyền bị độc quyền bởi số ít quy tắc và có thể bị thu hồi bất cứ lúc nào, mà phải là nền tảng chung để nhân loại cùng khám phá giới hạn của trí tuệ và giải quyết các tác vụ phức tạp
  • GLM-5.2 là mô hình mã nguồn mở mạnh nhất của Zhipu cho đến nay, đồng thời tiếp tục đóng vai trò động cơ chủ lực để tạo ra mô hình coding mạnh nhất trong nước
  • Trước tiên sẽ được cung cấp cho người dùng Lite / Pro / Max của GLM Coding Plan, và API dự kiến sẽ được công bố vào tuần tới, đưa khả năng tiếp cận trí tuệ frontier tiến thêm một bước

Thông điệp cốt lõi

  • Việc một mô hình frontier cụ thể bị hạn chế đột ngột được xem là điều hết sức đáng tiếc, và chính trong thời điểm quyền truy cập bị cắt vì lý do phi kỹ thuật thì lập trường rằng khoa học phải mang tính toàn cầu càng được củng cố
  • Con đường tiến tới AGI không nên bị bao quanh bởi những rào cản cao, và AGI phải là nền móng để nhân loại cùng khám phá giới hạn của trí tuệ và giải quyết các thách thức phức tạp
  • AGI không nên là một đặc quyền bị độc quyền bởi số ít quy tắc và có thể bị thu hồi bất cứ lúc nào; trước sự phong tỏa và hạn chế từ bên ngoài, cần có sự cởi mở triệt để hơn
  • Trí tuệ frontier cần duy trì tính mã nguồn mở, khả năng tiếp cận và khả năng xây dựng, đồng thời phải được cung cấp cho mọi nhà phát triển tận tâm

Công bố GLM-5.2 và lịch sử dụng

  • GLM-5.2 là mô hình mã nguồn mở mạnh nhất mà Zhipu từng công bố cho đến nay
  • Mô hình này hỗ trợ cửa sổ ngữ cảnh 1M có thể dùng trong thực tế và duy trì ưu thế liên tục trong việc hoàn thành độc lập các tác vụ dài hạn
  • Cung cấp nền tảng vững chắc để tạo ra các ứng dụng agent phức tạp, đồng thời tiếp tục đóng vai trò động cơ chủ lực để xây dựng mô hình coding mạnh nhất trong nước
  • GLM-5.2 sẽ được cung cấp chính thức cho người dùng GLM Coding Plan vào lúc 5:21, bao gồm toàn bộ người dùng Lite / Pro / Max
  • API dự kiến sẽ được công bố vào tuần tới, và ModelKey là GLM-5.2

1 bình luận

 
Ý kiến trên Hacker News
  • Theo công bố của nhà sáng lập Z.ai, GLM-5.2 là một mô hình “mở hoàn toàn”, và trong bối cảnh quyền truy cập vào một số mô hình tuyến đầu đột ngột bị hạn chế vì các lý do phi kỹ thuật, trí tuệ tuyến đầu nên được mở cho tất cả mọi người
    GLM-5.2 là mô hình mã nguồn mở mạnh nhất của Zhipu cho đến nay, nhấn mạnh cửa sổ ngữ cảnh 1M có thể dùng thực tế cùng khả năng tự chủ thực hiện các tác vụ dài hạn
    Họ cho biết mô hình sẽ được cung cấp trước cho người dùng Lite / Pro / Max của GLM Coding Plan, còn API dự kiến công bố vào tuần tới
    https://x.com/jietang/status/2065784751345287314

    • Điểm hay của GLM là khi dùng trên OpenRouter, có thể lọc theo điều kiện nhà cung cấp đặt tại Mỹkhông lưu giữ dữ liệu
      Có vẻ khác với các mô hình trọng số mở khác của Trung Quốc như Qwen
    • Không rõ “GLM-5.2 is Fully Open” chỉ có nghĩa là mở trọng số hay là còn công khai cả mã nguồn và dữ liệu
  • Có vẻ vẫn chưa có bài blog chính thức kèm kết quả benchmark, nhưng vẫn một lần nữa thấy biết ơn việc các viện nghiên cứu AI của Trung Quốc công khai thành quả như vậy và đóng góp cho thế giới với giấy phép cấp quyền thoáng
    Vụ Fable 5 một lần nữa cho thấy những mô hình mở như vậy có giá trị đến mức nào

    • Ấn tượng ban đầu là nó có vẻ chậm hơn khoảng 6 tháng so với các viện tuyến đầu, cảm giác tương tự Opus hồi tháng 1
      Dù vậy vẫn khá ấn tượng và đủ hữu dụng
      Ở kiến trúc hay các bài toán phức tạp thì yếu đi rõ rệt, nhưng chắc cũng không nhiều người kỳ vọng khác
      Đặc biệt ở mảng thiết kế và giao diện người dùng thì có vẻ làm tốt hơn hẳn tầm vóc của nó, dù cũng có thể là sở thích cá nhân
    • Phát hành mô hình mà không có benchmark khiến người ta cảm thấy đó là dấu hiệu mô hình có lẽ không tốt lắm
  • Trong vài ngày gần đây, các viện nghiên cứu Trung Quốc đã tung ra MiniMaxM3, KimiK2.7 và GLM5.2, trong khi phía Mỹ thì đang kiểm duyệt mô hình
    Đọc gần như giống tiểu thuyết

    • Tò mò không biết kimi2.7 so với GLM5.2 thì thế nào
    • Các mô hình Trung Quốc cũng bị kiểm duyệt
      Trong vụ Anthropic hiện tại, có thể nói Mỹ đang kiểm duyệt mô hình, nhưng có lẽ mô tả đó vẫn kém chính xác hơn việc nói tới sự tham nhũng, trả đũa, vòi vĩnh và vô năng nói chung của chính quyền Trump
  • Có vẻ không phải thư viện C++ OpenGL Mathematics như tôi đã kỳ vọng

  • Nếu nhìn vào hành động mới nhất của chính phủ Mỹ với Fable, xu hướng này ngày càng giống tương lai hơn
    Không thể phụ thuộc vào các sản phẩm chiến lược mà một tác nhân thất thường có thể khóa cửa bất cứ lúc nào
    Mô hình mở trọng số về cơ bản gần như miễn nhiễm với tình huống đó

    • Chỉ đúng ở một mức độ nào đó
      Chính phủ Mỹ có thể biến việc giao dịch, tải xuống hoặc sử dụng các mô hình mở trọng số nước ngoài thành bất hợp pháp
      Với cá nhân thì khó thực thi, nhưng doanh nghiệp về cơ bản sẽ tuân theo, và nếu đi theo hướng chế tài thì rất có thể chúng cũng sẽ bị gỡ khỏi các nền tảng lưu trữ đặt tại Mỹ như GitHub
      Hơn nữa, chúng ta đã và đang đi rất nhanh tới mức giám sát đại trà đáng sợ, điều này cũng có thể hỗ trợ thực thi
      Tình huống Fable đang tạo ra một tiền lệ rất nguy hiểm, và tôi lo cho tương lai vì có vẻ chúng ta đang thua trong cuộc chiến vì tự do thông tin và tự do điện toán
    • Khi Trung Quốc bắt kịp hoặc vượt lên, khả năng rất cao họ cũng sẽ chuyển sang đóng
    • Chỉ trích chính phủ có lẽ là chính đáng, nhưng không thể để Anthropic thoát trách nhiệm
      Chính Anthropic là bên đang tiếp tay cho thứ nhảm nhí này
      Họ âm thầm làm giảm chất lượng đầu ra và từ chối yêu cầu dưới danh nghĩa “an toàn”
      Ngay cả khi chính phủ không yêu cầu gỡ mô hình với người nước ngoài, bản thân Anthropic vẫn quá tệ nên tình hình vẫn sẽ rất tồi
  • Việc công bố diễn ra đúng vào 5 giờ 21 chiều theo giờ Trung Quốc, trùng khớp chính xác với thời điểm Anthropic nhận được thư cấm Fable từ chính phủ, và còn nhắc rõ tới việc các mô hình khác trở nên không thể dùng được

    • Thật vậy sao? Tôi không chắc về múi giờ
      Trông khá kỳ lạ
      Cũng có thể bài đăng đã được chỉnh sửa sau đó chăng
  • Lần công bố này có vẻ được đẩy lên gấp để ăn theo kịch tính của Mythos
    Kiểu như “tiếc là bạn không dùng được Fable nữa, nhưng hãy thử của chúng tôi trong cuối tuần”, và có thể ban đầu định công bố vào tuần sau nên benchmark vẫn chưa chuẩn bị xong

  • Tôi đang mong chờ bản 5.2 flash được công bố
    Đã qua một thời gian nhưng tôi vẫn thấy 4.7 flash là một trong những mô hình coding local mạnh nhất

    • Hình như tôi có thấy ai đó nói là sẽ không có flash
    • Thật sao? 4.7-flash với tôi khá là tệ
      Với mô hình local thì Qwen-3.5 vẫn là tốt nhất
      3.6 dùng VRAM nhỉnh hơn 24GB một chút, nên từ mốc đó trở đi không còn là GPU tiêu dùng nữa
  • Tôi muốn có một bài blog nói về năng lực của mô hình mới, có thể kỳ vọng gì, liệu có rẻ hơn, nhanh hơn, hay chất lượng đầu ra tốt hơn không
    Dù sao thì vẫn cảm ơn vì đã công bố

    • Có lẽ nên chờ tới thứ Hai xem sao
  • Tôi tò mò thực tế cần bao nhiêu tài nguyên tính toán, và yêu cầu cho các biến thể khác nhau là gì
    Cũng muốn biết liệu họ có đưa được chất lượng tuyến đầu tới người dùng local một cách thực tế hay không, bao gồm các tối ưu hóa của Google như TurboQuant, MTP hoặc những đổi mới nội bộ của họ

    • Dòng GLM-5 là 744B-A40B
      Không phải mô hình local theo nghĩa hợp lý, nhưng vì là mô hình mở nên khi trọng số được đăng lên sau khoảng một tuần, sẽ có nhiều bên thứ ba cung cấp suy luận cạnh tranh theo giá trên mỗi token
    • Chỉ cần chi 80.000 USD cho phần cứng là có thể chạy
      Không hề có thứ gọi là mô hình local chạy hiệu quả trên phần cứng tiêu dùng, và ai nói vậy thì либо đang nói dối hoặc hoang tưởng