6 điểm bởi GN⁺ 2025-10-22 | 1 bình luận | Chia sẻ qua WhatsApp
  • ChatGPT Atlas là một trình duyệt web dựa trên AI mới tích hợp ChatGPT làm trung tâm, với mục tiêu tổng hợp ngữ cảnh, công cụ và nhiệm vụ của người dùng để phát triển thành một “siêu trợ lý”.
  • Dù người dùng đang duyệt bất cứ đâu trên web, ChatGPT đều đồng hành để hỗ trợ thực hiện tác vụ và hiểu ngữ cảnh mà không cần rời khỏi trang.
  • Thông qua bộ nhớ trình duyệt, Atlas ghi nhớ ngữ cảnh các trang đã ghé thăm và hỗ trợ trả lời câu hỏi, tóm tắt, lập kế hoạch lịch trình, v.v.
  • Với Agent Mode, ChatGPT có thể thực hiện các hành động thực tế trong môi trường duyệt web của người dùng, như mở tab, tìm kiếm thông tin, đặt lịch hoặc đặt hàng.
  • Được phát hành toàn cầu trên macOS; các phiên bản Windows, iOS và Android sẽ được hỗ trợ trong tương lai, và nó được xem là một giai đoạn mới của việc duyệt web dựa trên AI.

  • ChatGPT Atlas là công cụ AI browser kết hợp ChatGPT và trình duyệt web.
    • Mục tiêu vượt xa tìm kiếm thông thường, là hướng tới môi trường trình duyệt thông minh có thể hiểu ngữ cảnh người dùng và thực thi hành động.
  • Sau khi tính năng tìm kiếm web của ChatGPT trước đó lan tỏa nhanh, OpenAI đã tái cấu trúc toàn bộ trình duyệt theo trung tâm AI để hỗ trợ cả tự động hóa công việc, nghiên cứu và lập kế hoạch lịch trình.
  • Người dùng có thể nhận trợ giúp trực tiếp từ ChatGPT ngay trong cửa sổ Atlas, không cần copy/paste riêng.

Tính năng bộ nhớ trình duyệt

  • Atlas lưu trữ bộ nhớ trình duyệt dựa trên thông tin các website đã truy cập để cung cấp hội thoại theo ngữ cảnh và hỗ trợ cá nhân hóa.
    • Ví dụ: tự động xử lý yêu cầu như "Tóm tắt tin tuyển dụng đã xem tuần trước cho tôi".
  • Bộ nhớ được quản lý dưới sự kiểm soát hoàn toàn của người dùng và có thể xem, lưu trữ, xóa bất kỳ lúc nào.
  • Khi lịch sử duyệt web bị xóa, bộ nhớ liên quan cũng bị xóa và phạm vi ghi nhớ có thể điều chỉnh theo từng website.
  • Mặc định, nội dung duyệt web không được dùng cho việc huấn luyện mô hình; chỉ khi người dùng opt-in rõ ràng thì mới được đưa vào dữ liệu đào tạo.

Chế độ Agent (Agent Mode)

  • Agent Mode tích hợp trong Atlas là khả năng để ChatGPT thực hiện tác vụ thực tế ngay trong trình duyệt của người dùng.
    • Ví dụ: thêm nguyên liệu vào giỏ hàng và đặt hàng dựa trên công thức, hoặc đọc tài liệu và phân tích đối thủ cạnh tranh.
  • Agent sẽ mở tab, nhấp chuột và tiến hành công việc sau khi nhận được sự cho phép của người dùng.
  • Được cung cấp ở dạng bản xem trước cho người dùng Plus, Pro và Business, đang được cải tiến liên tục để tăng tốc độ và nâng cao độ tin cậy.

Bảo mật và quyền riêng tư

  • Atlas dựa trên thiết kế ưu tiên an toàn, với các hạn chế sau:
    • Không cho phép chạy mã trong trình duyệt, tải tệp về hoặc cài đặt tiện ích mở rộng.
    • Không truy cập tệp cục bộ hay ứng dụng khác.
    • Tự động tạm dừng trên các trang nhạy cảm như tổ chức tài chính.
    • Có thể dùng agent ở chế độ đăng xuất, giúp giảm thiểu nguy cơ lộ thông tin cá nhân.
  • Để ngăn chặn tấn công lệnh ẩn từ trang độc hại hoặc email, OpenAI đã thực hiện hàng nghìn giờ kiểm thử red-team và vận hành quy trình vá nhanh để đáp ứng được kiểu tấn công mới.
  • Người dùng được khuyến nghị cân nhắc nguy cơ lộ thông tin khi dùng Atlas, và nên thực hiện giám sát tác vụ cùng với việc sử dụng chế độ đăng xuất.

Dữ liệu và cài đặt kiểm soát

  • Người dùng có thể kiểm soát khả năng hiển thị website mà ChatGPT có thể truy cập qua công tắc trong thanh địa chỉ.
    • Khi tắt, truy cập nội dung trang sẽ bị chặn và việc tạo bộ nhớ sẽ dừng.
  • Nếu muốn đưa dữ liệu vào đào tạo, có thể bật tuỳ chọn “include web browsing” trong cài đặt để đưa nội dung web vào quá trình huấn luyện.
  • Tính năng kiểm soát của phụ huynh cũng được tăng cường, cho phép phụ huynh tắt bộ nhớ trình duyệt hoặc chế độ agent.

Hỗ trợ nền tảng và triển khai

  • ChatGPT Atlas ra mắt ngay cho macOS, có sẵn cho người dùng Free, Plus, Pro và Go.
  • Người dùng gói Business, Enterprise, Edu cũng có thể dùng được khi quản trị viên kích hoạt.
  • Các phiên bản cho Windows, iOS, Android sẽ sớm ra mắt.
  • Người dùng có thể chuyển đổi dễ dàng bằng cách nhập lại dấu trang, mật khẩu, lịch sử từ trình duyệt hiện tại.

Kế hoạch tiếp theo

  • OpenAI dự định các bước tiếp theo của Atlas gồm hỗ trợ đa hồ sơ, cải tiến công cụ nhà phát triển, và tính mở rộng tích hợp Apps SDK.
  • Chủ sở hữu website có thể cải thiện độ chính xác hoạt động của agent ChatGPT trên website của mình bằng cách thêm thẻ ARIA.
  • Lần ra mắt này được đánh giá là bước đầu khi AI tiến vào trình duyệt và biến thành một trải nghiệm web tương tác thực sự.

1 bình luận

 
GN⁺ 2025-10-22
Ý kiến trên Hacker News
  • Cá nhân tôi cho rằng tập trung riêng vào quyền riêng tư là góc nhìn hẹp. Điều quan trọng hơn là công nghệ này có tiềm năng làm thay đổi căn bản cách duyệt web hiện tại không, và nó ảnh hưởng gì đến mô hình kiếm tiền từ lượng truy cập web; đặc biệt, khác biệt giữa V0.1 và V1.0 của một trải nghiệm mới là rất lớn. Nếu đó là V1.0, sự chuyển dịch khỏi web truyền thống sẽ diễn ra nhanh và tác động kinh tế có thể rất đáng kể, khi đó đầu tư AI cho trung tâm dữ liệu của họ cũng được biện minh.
  • Tôi tóm tắt vài màn hình chính của trình cài đặt DMG ChatGPT Atlas (ảnh cài đặt):
    1. Kích hoạt bộ nhớ trình duyệt: ghi nhớ thông tin hữu ích khi lướt web để nhận được câu trả lời và đề xuất thông minh hơn, với người dùng tự quản lý quyền riêng tư của bộ nhớ.
    2. Hỏi mọi thứ trên trang nào cũng được: mở thanh bên ChatGPT để tóm tắt, giải thích và xử lý nhiều công việc khác.
    3. Con trỏ thành công cụ cộng tác: chỉ cần nhấp logo ChatGPT là nhận trợ giúp viết email, review, nhập form, v.v.
    4. Khi đặt Atlas làm trình duyệt mặc định: mở khóa tin nhắn, tải file, phân tích dữ liệu, tạo ảnh... trong 7 ngày.
    5. Mọi thứ đã sẵn sàng, kèm thông điệp chào mừng và huy hiệu mời dùng web an toàn, quản lý dữ liệu và quyền riêng tư cùng Atlas. Có vẻ nhiều người dùng ChatGPT Free sẽ đặt làm mặc định dù chỉ vì lý do (4), ý tưởng này khá thú vị.
    • Tôi đã tắt hẳn bộ nhớ của ChatGPT vì cách phân loại không ổn; ví dụ hỏi về lốp mùa đông lại nhận được câu trả lời kiểu “vì bạn làm trong firmware nên chắc hẳn nhạy cảm hơn về độ bền”, khiến tôi sững lại.
    • Tính năng tìm kiếm lịch sử trình duyệt bằng ngôn ngữ tự nhiên là thứ tôi háo hức nhất. Có quá nhiều lần, dù sau 5 tháng không nhớ tên liên kết, nhưng tôi có thể mô tả nội dung, và vẫn mất hơn 10 phút mới tìm ra.
    • Vì (4) tôi đã đổi nó thành trình duyệt mặc định, nhưng thứ đáng ngờ nhất là yêu cầu truy cập Keychain, nên tôi đã từ chối.
    • Tôi chưa từng thấy việc có bonus khi đặt làm mặc định như này trước đây, nên có lẽ nhờ những ưu đãi này nhiều người sẽ giữ nguyên sau khi bật.
    • Tôi hoài nghi khi nghe một công ty nói “Bạn kiểm soát quyền riêng tư”, nhất là khi đó là công ty đã từng quét toàn bộ internet và xâm phạm quyền riêng tư.
  • Tôi cảm thấy phản hồi của OpenAI giống Perplexity Comet và lo rằng nó sẽ thành tương lai. AI browser kiểu này đúng là có giá trị, nhưng cuối cùng có vẻ sẽ có một Big Tech duy nhất kiểm soát tất cả. Hy vọng các trình duyệt mã nguồn mở (như Firefox) sớm tung tính năng thay thế của riêng họ với LLM; xử lý on-device thay vì LLM đám mây là lý tưởng, nhưng thực tế nhiều kỹ sư ML giỏi đã đi hết về Big Tech rồi.
    • Tôi muốn hỏi có ích gì vì chưa dùng trực tiếp; xem review trên YouTube thì thấy khá bấp bênh và không hề có vẻ hữu ích. Nó làm tôi nhớ thời Siri mới ra mắt, cuối cùng chỉ dùng để đặt hẹn giờ, điều khiển nhạc và vài thứ không đáng kể.
    • Rõ ràng AI agent là xu hướng, nhưng tôi cũng thấy Gemini có cảm giác sẽ rất nhanh tích hợp vào Chrome; nếu có chế độ agent riêng, có thể chiếm hết thị trường trình duyệt.
    • Mọi người lo lắng liệu sẽ có bản AI agent của Chrome hay trình duyệt tương tự, đó không phải nỗi sợ vô lý, nhưng tôi vẫn nghi ngờ khả năng thành công đại trà. Thế giới trình duyệt cần đổi mới nhưng nói chung mọi người vẫn giữ thứ đang dùng, trừ khi rất bất tiện hoặc bị buộc phải đổi; có thể thay đổi sắp tới đây.
    • Cá nhân tôi rõ ràng thích cách làm plugin trình duyệt theo sandbox hơn là quản lý cả trình duyệt; dù vậy, Comet vẫn làm tôi thích.
    • Với câu “một Big Tech biết mọi thứ và quản lý mọi thứ”, tôi thấy không chịu nổi; tôi không muốn đổ thêm quyền vào tay những tập đoàn đã nắm quyền lực quá lớn trong cuộc sống của mình. Tôi chưa thấy trường hợp AI nào làm cuộc sống tôi tốt hơn, nên sẽ dùng Lynx. AI làm rối cả kết quả tìm kiếm và trang web, với tôi đó là phiền toái.
  • Tôi đã test chế độ agent của Atlas; nó dựa trên kinh nghiệm và mối quan tâm của tôi để gợi các bình luận trên HN có thể thêm insight. Kết quả là 7 bình luận về startup/cloud tôi hiểu rõ, 3 bình luận về fine-tuning LLM tôi không am hiểu lắm. Nội dung gợi ý đúng như tôi sẽ nói, nhưng cách diễn đạt khá xa cách; dùng thử xong, tôi lo rằng các hoạt động từng thú vị của mình sẽ biến thành công việc vô hồn. Công cụ đáng để quan tâm, nhưng chưa rõ mình sẽ dùng vào đâu.
  • Tôi thắc mắc vì sao Atlas chỉ hỗ trợ macOS; có Linux hoặc Windows thì sẽ thấy giống ra mắt đầy đủ hơn.
    • Ứng dụng desktop ChatGPT cũng gần 4 tháng trước mới phát hành đúng kiểu macOS-only, có vẻ vì Electron nên họ cũng không quá chú trọng Windows. OpenAI chưa từng ra bản Linux chính thức; lần này Atlas sau khi phát hành toàn cầu trên macOS cũng chỉ nói “sắp có Windows, iOS, Android”, nên đừng kỳ vọng Linux.
  • Tôi thấy có công dụng nhưng cảm giác đang giao trọn đời sống cho AI company. Nếu cần gì, mở app ChatGPT và hỏi trực tiếp có vẻ hợp lý hơn. Theo tôi thì nó ở cùng nhóm với extension Honey của trình duyệt, chỉ là rủi ro mất dữ liệu nặng hơn; tôi tin dữ liệu có thật sự riêng tư trong 1 giây không thì chưa chắc.
    • Trước đây đã từng có tranh cãi telemetry của trình duyệt, giờ là streaming toàn bộ lịch sử duyệt web cho công ty AI. Kết cục có vẻ là mọi dữ liệu đời sống được đẩy lên cloud của họ: email, danh bạ, tin nhắn, lịch sử duyệt web, GPS, camera AR của Meta, quét 3D nhà, lịch sử ngân hàng,... cùng đủ thứ khác. Không biết liệu sẽ đến lúc ta chấp nhận tiện lợi này mà không thấy hệ quả.
  • Atlas dường như dựa trên Chromium, nhưng ở đâu cũng không thấy nhắc đến Chromium, giấy phép hay credit; chrome:// pages cũng bị khóa. Nếu là dự án mã nguồn mở, tối thiểu phải minh bạch về nguồn và nền tảng. Ban đầu có thể chưa hoàn chỉnh, nhưng đây là điều cơ bản; không biết đây có phải tiêu chuẩn mới hay tôi chỉ thấy “lệch chuẩn”.
    • Vào Help > ChatGPT Atlas Help sẽ thấy tài liệu liên quan và câu: "Atlas là trình duyệt macOS dựa trên Chromium của OpenAI". Có vẻ đây là hướng dẫn chính thức.
    • Nếu nhìn theo yêu cầu pháp lý thì license BSD của Chromium yêu cầu sản phẩm phái sinh phải ghi rõ nguồn; nội dung tệp NOTICE phải được hiển thị ở đâu đó trong tác phẩm phái sinh. Việc Atlas bỏ sót điều này thật bất ngờ, Chromium BSD License
    • Hỏi thẳng Atlas, nó gợi ý gián tiếp rằng có atlas://credits, nhưng không có đường dẫn truy cập hay vị trí hiển thị chính thức.
    • Công ty vốn nổi tiếng “lặp lời” từ trước giờ giờ lại dường như không thừa nhận cả open source, nên có lý.
    • Nói thẳng ra, không cần nghĩ nhiều, cảm giác như họ cố ý xóa mọi dấu vết Chromium hay Google: không hề nhắc đến ở đâu, khóa toàn bộ trang chrome://, giao diện cũng bị làm sạch cảm giác nguồn mở. Việc thiếu minh bạch này càng khó chịu hơn vì có nghĩa vụ pháp lý về ghi nguồn.
  • OpenAI có vẻ đang chốt các mảng mà Apple Intelligence chưa giải quyết được. Lẽ ra những chức năng này nên được tích hợp sẵn vào macOS nền tảng; dùng FoundationLLM để tối ưu tính toán tại máy và quyền riêng tư, rồi chỉ gọi LLM frontier ở server riêng khi thật sự cần. Tôi nghĩ macOS cần thay đổi sâu hơn để AI assistant thấm sâu ở cấp hệ điều hành; Apple Intelligence là khởi đầu ổn nhưng sức mạnh local model chưa đủ, nên những chức năng thực sự quan trọng vẫn bị chôn sâu trong stack.
    • Tất cả nỗ lực tích hợp này đều kỳ quặc: Siri yếu, ChatGPT chỉ có thể gọi theo yêu cầu, và Apple Intelligence cũng chưa dùng tốt. Apple có vẻ đang băn khoăn liệu có nên hạ Siri hay tích hợp ChatGPT sâu hơn, hoặc có thể từ bỏ luôn Google làm mặc định tìm kiếm dù Google đã trả 20 nghìn tỷ won. Tôi cũng tò mò xem Atlas có thành sản phẩm cạnh tranh trực tiếp Safari không; đồng thời việc OpenAI tăng số sản phẩm kiểu sora2 hay Atlas ưu tiên cho Apple cũng đáng để theo dõi.
  • Tôi không dùng plugin LLM cho Chrome vì lo dữ liệu trên trình duyệt sẽ bị thu thập quá mức và thiếu tin tưởng; lần này cũng tương tự, chỉ khác là đó là công ty có hình ảnh đáng tin.
    • Nếu các công ty hướng riêng tư như Private Internet Access hay NordVPN tung extension AI hoặc cả một trình duyệt riêng thì sẽ tạo ra giá trị lớn: ẩn danh hóa traffic và chạy nhiều mô hình LLM. Với hình ảnh riêng tư của họ, họ có thể lôi kéo được nhiều người khỏi OpenAI, Perplexity.
    • OpenAI từng có trường hợp trên app chatgpt macOS dùng certificate pinning để việc theo dõi dữ liệu khó hơn.
    • Tôi nghĩ ý nghĩ LLM plugin truy cập nhiều dữ liệu hơn plugin thường là hiểu nhầm; dường như họ đã hiểu sai cấu trúc manifest của Chrome extension.
    • Tôi tin LLM rất mạnh khi ở ngữ cảnh phù hợp, nhưng tôi vẫn thấy thoải mái hơn khi giữ khoảng cách: khi cần tôi sẽ tự chủ động mở ra dùng, không muốn AI luôn bám theo và quan sát mình.
  • Nếu công nghệ này thật sự hữu dụng, hãy tưởng tượng các chế độ toàn trị sẽ hái đoạt nó đến đâu. Nếu đã có quảng cáo khiến người ta rùng mình, Atlas là dịch vụ keylogger ở cấp root; tôi không biết tại sao lại cho AI company thu thập/ghi lại mọi tương tác duyệt web của tôi. Google bằng Chrome cũng đã làm mức này; tối ưu quảng cáo khác hẳn với việc ghi lại cả quá trình nhận thức của con người để lấy dữ liệu huấn luyện AI tổng quát.
    • Xem qua trang sản phẩm mà nói, tôi không thấy cơ sở chắc chắn để khẳng định Atlas lưu/trích xuất nhiều thông tin hơn Chrome+Gemini. Hầu hết tính năng đã có sẵn trong Chrome; nếu tất cả đều ghi toàn bộ phím bấm thì Google cũng làm được. Thực ra cả hai đều có chung mục tiêu xây mô hình dự đoán người dùng, nên tôi không thấy khoảng cách quá lớn.
    • Có phần giống Recall của Microsoft, khác ở chỗ Atlas cho phép người dùng tự cho phép; tôi tin OpenAI có thêm cơ hội quảng cáo nhắm mục tiêu.
    • Dữ liệu cho quảng cáo theo nhân khẩu, thanh toán, vị trí, thu nhập... và dữ liệu đo lường cách tư duy của người dùng cho huấn luyện AI đại trà là hai chuyện hoàn toàn khác nhau. Nếu Atlas thành công, Google chắc chắn sẽ làm theo. Chrome/Gemini đã có sẵn rồi, tích hợp Gemini vào Chrome sẽ rất nhanh; gắn thêm TPU riêng thì gần như thành Atlas.
    • Trình duyệt web của tôi chạy root? Atlas chạy root? Atlas có phải keylogger ghi toàn bộ gõ phím? Có thật những thứ này hay không?