Kiến trúc bộ nhớ của Claude hoàn toàn trái ngược với ChatGPT

(shloked.com)

6 điểm bởi GN⁺ 2025-09-12 | 2 bình luận | Chia sẻ qua WhatsApp

Hệ thống bộ nhớ của Claude chỉ được kích hoạt khi người dùng trực tiếp gọi đến, và sẽ tìm kiếm lịch sử hội thoại thực tế theo thời gian thực để trả về thông tin
Ngược lại, ChatGPT tự động tải hồ sơ người dùng và lịch sử ở mỗi cuộc trò chuyện, mang lại trải nghiệm được cá nhân hóa ngay lập tức
Hai cách tiếp cận này phản ánh sự khác biệt về nhóm người dùng mục tiêu và triết lý phát triển sản phẩm
Người dùng Claude chủ yếu là nhà phát triển và chuyên gia, coi trọng tính minh bạch, khả năng kiểm soát trực tiếp và quyền riêng tư
Gần đây, Claude cũng đã đưa vào tính năng bộ nhớ tự động tương tự ChatGPT cho tài khoản nhóm và doanh nghiệp, cho thấy phạm vi thiết kế bộ nhớ AI đang mở rộng rất nhanh

Cách hệ thống bộ nhớ của Claude hoạt động

Hệ thống bộ nhớ của Claude có hai đặc điểm cốt lõi

Bắt đầu từ trạng thái trống ở mỗi cuộc trò chuyện, không tải trước hồ sơ người dùng hay lịch sử trò chuyện trước đó
Tính năng bộ nhớ chỉ được kích hoạt khi người dùng dùng cụm từ gọi rõ ràng như "hãy cho tôi biết những gì chúng ta đã nói trước đây" hoặc "hãy tiếp tục từ lần trước"

Claude không dùng bản tóm tắt do AI tạo ra hay hồ sơ nén, mà chỉ tìm kiếm trực tiếp lịch sử hội thoại trước đây thực tế theo thời gian thực để sử dụng thông tin đó
Sau khi tìm kiếm xong, Claude sẽ tích hợp kết quả để trả lời yêu cầu của người dùng hoặc tiếp tục cuộc thảo luận

Công cụ Conversation Search

Công cụ conversation_search tìm kiếm toàn bộ lịch sử hội thoại theo từ khóa hoặc chủ đề
Ví dụ, nếu yêu cầu "bạn có nhớ những gì chúng ta đã nói về Chandni Chowk không?", Claude sẽ tìm nhiều cuộc trò chuyện liên quan đến chủ đề đó rồi tổng hợp và cung cấp bản tóm tắt
Nếu hỏi đồng thời nhiều chủ đề (ví dụ: Michelangelo, Chainflip, Solana), hệ thống sẽ lần lượt tìm riêng từng chủ đề và trả về nội dung kèm liên kết
Các tham số của conversation_search bao gồm số lượng kết quả tối đa, truy vấn tìm kiếm, v.v.
- Ví dụ: max_results(1~10), query(từ khóa tìm kiếm)

Công cụ Temporal Chat Retrieval

Công cụ recent_chats truy cập lịch sử hội thoại theo mốc thời gian
Nếu yêu cầu như "hãy cho tôi biết nội dung 10 cuộc trò chuyện gần đây", công cụ sẽ tìm các cuộc trò chuyện mới nhất theo thứ tự và cung cấp bản tóm tắt
Cũng có thể tìm theo thời điểm bằng cách chỉ định khoảng thời gian cụ thể, chẳng hạn "những gì chúng ta đã nói vào tuần cuối cùng của tháng 11 năm 2024?"
Các tham số của recent_chats gồm after/before (thời điểm bắt đầu/kết thúc), n (số lượng cuộc trò chuyện, 1~20), sort_order (thứ tự xuôi/ngược)

So sánh giữa ChatGPT và Claude

Cho đến tận năm ngoái, các tính năng chính mà ChatGPT và Claude cung cấp còn khá giống nhau, nhưng giờ đây định hướng sản phẩm đã khác biệt đáng kể

ChatGPT đã phát triển thành sản phẩm tiêu dùng cho thị trường đại chúng, với người dùng đến từ nhiều nền tảng khác nhau như học sinh, phụ huynh, người có sở thích cá nhân
- Ở mọi cuộc trò chuyện, thành phần bộ nhớ được tự động tải, mang lại trải nghiệm cá nhân hóa tức thì và dễ dàng
- Dựa trên hồ sơ người dùng chi tiết, có thể tận dụng cho gợi ý tính năng trong tương lai, tính năng tùy biến và kiếm tiền
Claude được phát triển nhắm đến nhóm người dùng là nhà phát triển, kỹ sư và chuyên gia
- Người dùng hiểu cách thuật toán vận hành và tự lựa chọn rõ ràng khi nào sẽ gọi bộ nhớ
- Thay vì hồ sơ hóa hay tự động hóa, họ coi trọng hơn tính công cụ, khả năng dự đoán và quyền riêng tư

Như vậy, hệ thống bộ nhớ của hai dịch vụ phản ánh trực tiếp sự khác biệt về nhóm người dùng và triết lý phát triển

Sự đa dạng trong thiết kế bộ nhớ AI

Hai hệ thống bộ nhớ hoàn toàn trái ngược của ChatGPT và Claude cho thấy lĩnh vực thiết kế bộ nhớ AI rất đa dạng

Không có đáp án đúng hay lời giải phổ quát cho cách tiếp cận bộ nhớ, và việc thiết kế ngược từ nhu cầu và mục đích thực tế của người dùng là điều bắt buộc
Vì lịch sử sử dụng công cụ AI còn chưa đầy 3 năm, hiện vẫn thiếu các thông lệ tốt đã được xác lập về xử lý dữ liệu tích lũy hoặc quản lý quyền riêng tư khi dùng cùng một trợ lý AI trong thời gian dài
Hiện nhiều ứng dụng AI đang thử nghiệm những cách tiếp cận bộ nhớ độc đáo của riêng mình, trong khi các mô hình nền tảng cũng đang mạnh lên theo từng tuần
Trong quá trình này không có một đáp án tối ưu duy nhất, và nhiều thử nghiệm cùng cách tiếp cận đa dạng vẫn đang tiếp diễn

Cập nhật gần đây: Claude giới thiệu tính năng bộ nhớ tự động

Vào đúng ngày bài viết này được đăng, Anthropic đã công bố tính năng bộ nhớ tự động của Claude cho tài khoản Team/Enterprise

Tính năng này, tương tự cách của ChatGPT, tự động xây dựng bản tóm tắt bộ nhớ dựa trên ngữ cảnh công việc, mẫu hình làm việc và thông tin theo từng dự án
Mỗi dự án Claude sẽ có một bộ nhớ độc lập, và người dùng có thể trực tiếp xem và chỉnh sửa những gì Claude ghi nhớ
Gói đăng ký Pro Max cá nhân của tác giả vẫn chưa có tính năng này nên chưa thể đánh giá
Trong tương lai sẽ có thêm bài đánh giá về so sánh với bộ nhớ dựa trên tìm kiếm hiện có cũng như khác biệt với ChatGPT

2 bình luận

GN⁺ 2025-09-12

Ý kiến trên Hacker News

Khác biệt trong cách triển khai rốt cuộc bắt nguồn từ mục tiêu kinh doanh
ChatGPT rõ ràng nhắm đến việc kiếm tiền qua quảng cáo và liên kết tiếp thị, và cách triển khai bộ nhớ cũng tập trung vào việc xây dựng hồ sơ người dùng
Trong khi đó, cách triển khai bộ nhớ của Claude gần hơn với mục tiêu dài hạn là truy cập các tương tác trong quá khứ và các lớp trừu tượng hóa
Nó được thiết kế để có thể tìm kiếm hội thoại theo cách tương tự như con người truy xuất ký ức, và về sau thông qua học tăng cường, có thể ghi nhớ những lỗi mà người dùng đã chỉ ra, hoặc rút ra các trừu tượng từ các cuộc trò chuyện trước để chủ động xử lý công việc
Cuối cùng, ChatGPT cố ghi nhớ chính người dùng, còn Claude tập trung vào lịch sử của từng tương tác riêng lẻ
- Nếu là AGI thì có thể tạo doanh thu mà không cần quảng cáo, nhưng một công ty kiểu Google mới thì lại cần quảng cáo
  Tôi cảm thấy có điểm lời nói và hành động thực tế không khớp nhau
- Tôi cũng không tin Anthropic sẽ không cung cấp quảng cáo cá nhân hóa
- Nếu giả sử người dùng thường xuyên dùng LLM cho các chủ đề a, b, c và ít dùng hơn cho d, e, f
  thì với một số chủ đề như b, c, f, OpenAI có thể kiếm tiền bằng quảng cáo xen ngang (toàn màn hình, hơn 30 giây)
  Điều này có thể làm được chỉ bằng cách phân tích chủ đề
  Nếu OpenAI có thể phân tích khoảng 1000 phiên chat và coding để tối đa hóa doanh thu bằng cách dẫn dắt người dùng vào làm ở một công ty cụ thể hoặc mua xe từ công ty khác, thì trong quá trình đó họ không chỉ có thể chèn quảng cáo xen ngang mà còn có thể điều chỉnh chất lượng hoặc nội dung câu trả lời
  Đây là một viễn cảnh vừa đủ thực tế vừa mang tính phản địa đàng
  Ngược lại, nếu DeepSeek vận hành không có quảng cáo, thì tiêu chuẩn để các LLM mã nguồn đóng giành thị phần sẽ cao hơn rất nhiều
  Cuối cùng, LLM rồi cũng sẽ như mọi sản phẩm khác: người dùng trả tiền theo chất lượng, và sẽ mong muốn những mức chất lượng khác nhau
  Tôi nghĩ vì quảng cáo có thể làm tổn hại độ tin cậy của câu trả lời AI, nên quảng cáo toàn màn hình là kết cục thực tế nhất
- Tôi muốn biết vì sao lại nghĩ có một xu hướng rõ ràng hướng tới quảng cáo
  ChatGPT không phải mạng xã hội, nên không cần kiếm tiền theo cùng cách
  Họ đã kiếm đủ tiền từ thuê bao, enterprise, business, API, v.v.
Chỉ ra rằng liên kết đến bài phân tích về cách triển khai bộ nhớ của ChatGPT bị sai, và chia sẻ liên kết chính xác
Tôi từng tò mò về cách ChatGPT triển khai bộ nhớ, và thật thú vị khi thấy nó có cách tiếp cận hoàn toàn khác Claude
Cách của Claude có vẻ phù hợp hơn để giải quyết các bài toán kỹ thuật, còn ChatGPT có vẻ thuận lợi hơn cho hội thoại đời thường và tích hợp quảng cáo
Một lúc nào đó, kiểu bộ nhớ dựa trên ngôn ngữ này sẽ trở nên lỗi thời, và sẽ có ai đó tìm ra một cách lưu trữ/truy xuất ký ức được mã hóa vượt ra ngoài biểu đạt ngôn ngữ
Đây có thể là bước đột phá cuối cùng cho AGI
- Tôi không đồng ý với nhận định đó là bước đột phá cuối cùng cho AGI
  Các LLM hiện tại không hiểu khái niệm; thực ra chúng không có chức năng gọi là “hiểu”, và về bản chất chỉ là chuỗi Markov được tinh vi hóa
  Tôi nghĩ trí thông minh thực sự mới là điều kiện tiên quyết của AGI
- Tôi nghĩ danh sách các cuộc trò chuyện gần đây cũng tương tự Claude ở chỗ nó không phải bộ nhớ thật mà là dạng nén của hội thoại, chỉ được truy cập khi cần
  Có vẻ như bộ nhớ của ChatGPT chỉ cho phép đưa vào ngữ cảnh phần Memory thực sự là tóm tắt theo từng thực thể
- ChatGPT đang cố bao quát mọi thứ từ hội thoại đời thường đến các tác vụ kỹ thuật, nên chiến lược này đang hoạt động hiệu quả
  Và cũng có ý kiến rằng cách tóm tắt hội thoại trước đây hay phương pháp Embedding cũng có thể được xem là lưu trữ bộ nhớ theo kiểu mã hóa
- Tôi không muốn AGI
  Điều đó khiến tôi phải nghĩ xem làm sao để AGI chịu nghe lệnh
Nói rằng hài lòng với cách Claude triển khai bộ nhớ, nhưng đã tắt bộ nhớ của ChatGPT
Vì họ dùng ChatGPT cho quá nhiều việc khác nhau, nên việc nó cố gắng nối các nội dung không liên quan với nhau một cách vô nghĩa khiến cảm giác khá gượng gạo
- Bộ nhớ của ChatGPT là tính năng tiện nhất, và chính điều đó khiến tôi tiếp tục dùng nó
  Tôi muốn có cá nhân hóa và tham chiếu đến thông tin cần thiết
  Ví dụ, nếu để nó ghi nhớ thông tin của một dự án thì từ đó về sau không cần phải giải thích lại ngữ cảnh mỗi lần, nên chất lượng cuộc sống cải thiện đáng kể
  Tuy nhiên, tôi không thích cách nó tự tạo bộ nhớ hội thoại nền mà tôi không thể trực tiếp kiểm soát
- Ngược lại, tôi thấy việc ChatGPT tự động gọi lại thông tin từ bộ nhớ còn tiện hơn nhiều
- Lý do tôi tắt tính năng bộ nhớ là vì trước đây nó từng ghi nhớ thông tin sai, rồi cứ lặp đi lặp lại việc gọi lại điều đó
- Tôi nghĩ việc có thể kiểm soát khi nào nội dung từ cuộc trò chuyện cũ được gọi lên là rất có giá trị
  ChatGPT thì trộn cả những nội dung cũ không mong muốn vào một cách không cần thiết nên khá vô ích
- Thật lạ là ChatGPT còn không nhớ nổi cả những điều cơ bản
  Tôi đã dùng nhiều AI tutor khác nhau cho mục đích học ngôn ngữ và ChatGPT là tốt nhất
  Nhưng tôi cứ phải lặp đi lặp lại yêu cầu “hãy nói chậm hơn”, và ngay cả khi bảo áp dụng quy tắc này cho toàn bộ cuộc trò chuyện thì nó cũng không làm được
  Ngoài ra còn có những phần khác mà bộ nhớ không hoạt động đúng
Chẳng bao lâu nữa, cách hoạt động của bộ nhớ trong ChatGPT sẽ thay đổi
Liên kết tham khảo: X.com - tin thay đổi bộ nhớ, thông báo chính thức của Anthropic
- Nếu hệ thống bộ nhớ thay đổi thì có lẽ sẽ hơi tiếc
Chia sẻ kinh nghiệm từng tự viết bài về bộ nhớ và lịch sử chat của ChatGPT
Trong đó cũng có kèm prompt để dump thông tin trực tiếp
Liên kết liên quan
Tôi luôn muốn kiểm soát chính xác đầu vào nên thường tắt hoàn toàn bộ nhớ
Tôi muốn loại bỏ mọi system prompt, training, v.v. và chỉ dùng đúng prompt do tôi tự viết
Tôi nghi ngờ liệu những thông tin được moi ra bằng cách hỏi trực tiếp ChatGPT có đáng tin hay chỉ là hallucination tạo sinh
Tôi không thấy có lý do gì để LLM biết chính xác nó hoạt động như thế nào, và cũng khó tin là nó được cung cấp tài liệu huấn luyện về chuyện đó
- Hỏi LLM nó hoạt động thế nào thì không giúp ích nhiều, nhưng hỏi về chữ ký của các hàm/công cụ mà nó có thể dùng thì lại khá chính xác
  Vì những thông tin công cụ này thường được ghi rất chi tiết trong system prompt
Claude được cho là chỉ tham chiếu đúng lịch sử hội thoại gốc để gọi lại ký ức
Nó không có tóm tắt do AI tạo ra hay hồ sơ nén, mà chỉ tìm kiếm trực tiếp trong các cuộc trò chuyện thực tế trước đây theo thời gian thực
Việc không có tóm tắt, hồ sơ hay knowledge graph không phải là tính năng chuyên gia, mà có nghĩa là nó hoạt động không tốt
Ví dụ, nó có thể nhớ những thứ cụ thể như "Chandni Chowk", nhưng những cách diễn đạt mơ hồ như "đồng nghiệp của tôi từng có vấn đề" thì có thể sẽ không tìm ra đúng
Hỏi trở ngại là gì khi dùng kho lưu trữ bộ nhớ bên ngoài thông qua tool calling hoặc MCP
Họ cũng tò mò liệu có đang dùng RL để tăng cường các mẫu sử dụng bộ nhớ hay không
Từ góc độ quyền riêng tư dữ liệu, khi suy luận thì LLM đằng nào cũng biết thông tin, nhưng tôi vẫn không muốn nhập trực tiếp vào
Ví dụ: "Sở thích: MacOS, bondage, discipline, Baseball"
- Có người kể rằng hồi mùa xuân đã làm thử một công cụ MCP lưu bộ nhớ bằng SQLite db cho vui
  Khi đó, dù có liên tục gợi ý qua prompt, Claude vẫn không muốn chủ động tận dụng bộ nhớ
  Lần nào cũng phải chỉ định rõ ràng là kiểm tra hay lưu ký ức, nên hiệu quả sử dụng khá thấp
  Repository liên quan
Tôi thấy bối rối sau khi đọc bài này
Không rõ tác giả có đang nghĩ rằng prompt vẫn bị chèn vào ngay cả khi đã tắt bộ nhớ hay không
Với trường hợp của tôi, khi bộ nhớ tắt thì hoàn toàn không có metadata nào như các cuộc trò chuyện gần đây hay thông tin sở thích được chèn vào, và nó vẫn là một cuộc trò chuyện hoàn toàn độc lập
Tôi không biết có phải việc bật rồi tắt bộ nhớ trong lúc thử nghiệm đã gây ra nhầm lẫn hay không, hay là do tôi đọc bài chưa kỹ

roxie 2025-09-13

Đột nhiên tất cả dấu chấm đều biến mất.