4 điểm bởi xguru 2025-02-28 | 4 bình luận | Chia sẻ qua WhatsApp
  • GPT-4.5 là mô hình mới nhất của OpenAI, là phiên bản cải thiện khả năng mở rộng trong cả giai đoạn tiền huấn luyện (pre-training) và hậu huấn luyện (post-training)
  • Mở rộng quy mô học không giám sát (unsupervised learning) để tăng cường nhận diện mẫu và khả năng tạo ra những hiểu biết sáng tạo
  • Có thể hội thoại tự nhiên hơn, hiểu ý định người dùng tốt hơn và được cải thiện về trí tuệ cảm xúc (EQ)
  • Có thể được sử dụng hữu ích trong nhiều tác vụ như viết lách, lập trình và giải quyết vấn đề
  • Tỷ lệ xuất hiện ảo giác (hallucination) được kỳ vọng sẽ giảm
  • Được cung cấp dưới dạng bản xem trước nghiên cứu, với mục tiêu khám phá điểm mạnh và giới hạn của mô hình cũng như thu thập nhiều trường hợp sử dụng khác nhau

Mở rộng học không giám sát

  • Để phát triển AI, OpenAI mở rộng hai trục là học không giám sátsuy luận (reasoning)
    • Tăng cường suy luận: mô hình được huấn luyện để có thể tư duy có hệ thống nhằm giải các vấn đề STEM phức tạp
      • Các mô hình như OpenAI o1 và OpenAI o3-mini đã phát triển cách tiếp cận này
    • Mở rộng học không giám sát: nâng cao trực giác của mô hình và độ chính xác của tri thức về thế giới thông qua nhiều dữ liệu hơn
  • GPT-4.5 được huấn luyện trên siêu máy tính Microsoft Azure AI và sở hữu nền tri thức rộng hơn cùng khả năng hiểu sâu hơn
    • Nhờ đó, hiện tượng ảo giác giảm đi và mô hình cung cấp kết quả đáng tin cậy hơn trên nhiều chủ đề

Mở rộng mô hình GPT

  • GPT-4.5 sở hữu tri thức vượt trội hơn các mô hình trước đây
    • Cung cấp góc nhìn sâu sắc hơn cho các câu hỏi lịch sử như nguồn gốc của ngôn ngữ
    • Với những câu hỏi như “Ngôn ngữ đầu tiên là gì?”:
      • Rất có thể không tồn tại một ngôn ngữ đầu tiên duy nhất
      • Ngôn ngữ được ước tính đã xuất hiện ở châu Phi hơn 100.000 năm trước
      • Các ngôn ngữ tiền thân (proto-languages) nhiều khả năng đã phát triển từ cử chỉ, âm thanh và tín hiệu
      • Không thể biết chính xác nguồn gốc của ngôn ngữ vì không có ghi chép
  • Theo cách đó, GPT-4.5 có thể cung cấp câu trả lời có chiều sâu cả trong lĩnh vực ngôn ngữ học và lịch sử

Tri thức thế giới sâu hơn

  • Trong bài đánh giá SimpleQA, GPT-4.5 ghi nhận độ chính xác cao hơn các mô hình khác
    • So sánh độ chính xác (Accuracy):
      • GPT-4.5: 62.5%
      • GPT-4o: 38.2%
      • OpenAI o1: 47%
      • OpenAI o3-mini: 15%
    • So sánh tỷ lệ ảo giác (Hallucination Rate) (càng thấp càng tốt):
      • GPT-4.5: 37.1%
      • GPT-4o: 61.8%
      • OpenAI o1: 44%
      • OpenAI o3-mini: 80.3%
  • GPT-4.5 duy trì độ chính xác cao hơn và giảm tỷ lệ ảo giác trong những câu hỏi cần kiểm chứng sự thật

Huấn luyện để cộng tác với con người

  • GPT-4.5 được huấn luyện để hiểu tốt hơn nhu cầu và ý định của con người
    • Có thể diễn giải ý định người dùng tinh tế hơn và hội thoại tự nhiên hơn
    • Trí tuệ cảm xúc (EQ) được cải thiện so với các mô hình trước, nên hiểu tốt hơn những sắc thái tinh vi
    • Nổi bật về trực giác sáng tạo và cảm quan thẩm mỹ trong viết lách và công việc thiết kế
  • Đánh giá so sánh (Win-rate vs GPT-4o)
    • Tác vụ sáng tạo: 56.8%
    • Câu hỏi chuyên môn: 63.2%
    • Câu hỏi thường ngày: 57.0%
  • GPT-4.5 cộng tác với con người một cách tự nhiên và nắm bắt ý định người dùng chính xác hơn trong đối thoại

Triển vọng tương lai: năng lực suy luận mạnh hơn

  • GPT-4.5 không phải là mô hình suy nghĩ logic trước khi phản hồi
  • Đây là cách tiếp cận khác với các mô hình tập trung vào suy luận như OpenAI o1 và OpenAI o3-mini
  • Trong các mô hình tương lai, sự kết hợp giữa tiền huấn luyện (pre-training) và suy luận (reasoning) được dự báo sẽ là yếu tố cốt lõi

Tăng cường an toàn

  • GPT-4.5 được huấn luyện bằng các kỹ thuật giám sát mới, bao gồm SFT (tinh chỉnh có giám sát) và RLHF (học tăng cường từ phản hồi của con người) hiện có
  • Kiểm thử an toàn được thực hiện trước khi triển khai mô hình để đánh giá các rủi ro tiềm ẩn
  • OpenAI công bố system card chứa kết quả đánh giá để thúc đẩy nghiên cứu và phản hồi

Cách dùng GPT-4.5 trong ChatGPT

  • Từ hôm nay, người dùng ChatGPT Pro có thể chọn GPT-4.5 trên web, mobile và desktop
  • Tuần tới, sẽ cung cấp cho người dùng Plus và Team
  • Tuần tiếp theo, sẽ cung cấp cho người dùng Enterprise và Edu
  • Các tính năng chính:
    • Có thể tìm kiếm thông tin mới nhất
    • Hỗ trợ tải lên tệp và hình ảnh
    • Có thể viết và lập trình bằng canvas
    • Tuy nhiên, không hỗ trợ chế độ giọng nói, video và chia sẻ màn hình

Cách dùng GPT-4.5 trong API

  • Được cung cấp cho nhà phát triển thông qua Chat Completions API, Assistants API, Batch API
  • Các tính năng chính:
    • Function Calling
    • Structured Outputs
    • Streaming
    • System Messages
    • Hỗ trợ năng lực thị giác thông qua đầu vào hình ảnh
  • Các trường hợp sử dụng cho nhà phát triển:
    • Ứng dụng mà trí tuệ cảm xúc và sáng tạo là quan trọng (ví dụ: trợ lý viết, cố vấn học tập, brainstorming)
    • Tác vụ mã nguồn phức tạp (ví dụ: quy trình lập trình nhiều bước, tự động hóa)
  • Các điểm cần cân nhắc liên quan đến việc cung cấp qua API:
    • GPT-4.5 là mô hình có khối lượng tính toán lớn và chi phí cao, vì vậy không thay thế GPT-4o
    • OpenAI đang xem xét liệu có tiếp tục cung cấp lâu dài trong API hay không, và phản hồi của người dùng là rất quan trọng

Kết luận

  • GPT-4.5 là mô hình mở rộng giới hạn của học không giám sát, có thể khám phá các khả năng mới và sáng tạo
  • OpenAI đang khám phá những khả năng mới của công nghệ AI và kỳ vọng vào các trường hợp sử dụng đổi mới từ người dùng.

4 bình luận

 
GN⁺ 2025-02-28

Bình luận trên Hacker News

  • Giá của GPT 4.5 rất cao

    • Đầu vào: $75.00 cho mỗi 1 triệu token
    • Đầu vào được lưu cache: $37.50 cho mỗi 1 triệu token
    • Đầu ra: $150.00 cho mỗi 1 triệu token
    • Chênh lệch giá rất lớn khi so với GPT 4o
    • GPT-4.5 là một mô hình rất lớn và đòi hỏi tính toán cao, hiện đang được đánh giá xem có nên tiếp tục cung cấp qua API về lâu dài hay không
    • Phản hồi từ người dùng rất quan trọng
  • Cảm nhận khi sử dụng GPT-4.5

    • Rất chậm, không phù hợp cho tương tác thời gian thực
    • Văn phong viết được cải thiện, tự nhiên và dễ tiếp cận hơn
    • Khi so sánh bản thảo sách, sự khác biệt giữa GPT4o và GPT4.5 khá dễ nhận ra
  • Tập trung vào trí tuệ cảm xúc (EQ)

    • Có xu hướng biến thành một “người bạn AI thân thiện”
    • Anthropic và Grok cũng đang đi theo hướng này
    • Mong rằng kiểu hành vi này sẽ không thấm vào các phản hồi API
  • Thất vọng với bài đăng blog và bản demo livestream

    • Mô hình mới không gây ấn tượng
    • Có vẻ OpenAI khó duy trì vị thế dẫn trước các đối thủ
    • Mức giá quá cao khiến nhiều người ngạc nhiên
  • Cách tiếp cận khác nhau của OpenAI và Anthropic

    • Anthropic tin rằng một mô thức duy nhất (suy luận) có thể phù hợp với mọi trường hợp sử dụng
    • OpenAI tin rằng cần một tổ hợp các mô hình với những khả năng khác nhau
    • GPT 4.5 có kích thước lớn nên có thể lưu trữ được nhiều dữ liệu thực tế hơn
  • Hiệu năng của GPT-4.5 trong benchmark LLM của Kagi

    • Dù giá cao và tốc độ chậm, hiệu năng vẫn rất tốt
    • Tuy vậy, ở một số tác vụ vẫn còn thiếu sót
  • Cách sử dụng GPT-4.5 qua API

    • Có thể chạy bằng công cụ uvx
    • Cần thiết lập API key
  • So sánh hiệu năng lập trình

    • ChatGPT 4.5 nhỉnh hơn ChatGPT 4o một chút trong tác vụ lập trình
    • Anthropic Claude 3.7 cho hiệu năng tốt hơn
  • Sự thấu hiểu đối với nỗ lực của OpenAI

    • GPT 4.5 là một nỗ lực quan trọng nhằm khám phá các quy luật mở rộng của tiền huấn luyện
    • Đây là một món quà đóng góp cho khoa học
 
xguru 2025-02-28

Giá của GPT-4.5 (trên mỗi 1M token)

  • Đầu vào $75
  • Đầu vào được cache $37.50
  • Đầu ra $150
    So với giá của 4o thì đầu vào đắt gấp 30 lần, đầu ra đắt gấp 15 lần.

Tuy nhiên hiệu năng không tăng tương xứng đến mức đó nên có vẻ có khá nhiều lời phàn nàn.

Theo Cursor, khi dùng GPT-4.5 thì nó hoạt động hiệu quả ngay cả trong những trường hợp mà các mô hình khác thất bại.
Tất nhiên vì quá đắt nên phải trả tiền theo mức sử dụng. Phản ứng kiểu như: "Bắt nó code phức tạp chắc phá sản mất."
https://x.com/cursor_ai/status/1895210110714290302

 
bearmett 2025-02-28

Nhìn vào giá của Claude Code thì tôi cũng đã từng có suy nghĩ tương tự. Nếu là người làm công ăn lương, chẳng phải vượt quá mức lương theo giờ thì sẽ phá sản sao 😵‍💫

 
botplaysdice 2025-02-28

Có lẽ cũng là điều may mắn. Tùy theo giá của mô hình mà giá trị của chúng ta cũng...;;;