- Hệ thống bộ nhớ của Claude chỉ được kích hoạt khi người dùng trực tiếp gọi đến, và sẽ tìm kiếm lịch sử hội thoại thực tế theo thời gian thực để trả về thông tin
- Ngược lại, ChatGPT tự động tải hồ sơ người dùng và lịch sử ở mỗi cuộc trò chuyện, mang lại trải nghiệm được cá nhân hóa ngay lập tức
- Hai cách tiếp cận này phản ánh sự khác biệt về nhóm người dùng mục tiêu và triết lý phát triển sản phẩm
- Người dùng Claude chủ yếu là nhà phát triển và chuyên gia, coi trọng tính minh bạch, khả năng kiểm soát trực tiếp và quyền riêng tư
- Gần đây, Claude cũng đã đưa vào tính năng bộ nhớ tự động tương tự ChatGPT cho tài khoản nhóm và doanh nghiệp, cho thấy phạm vi thiết kế bộ nhớ AI đang mở rộng rất nhanh
Cách hệ thống bộ nhớ của Claude hoạt động
Hệ thống bộ nhớ của Claude có hai đặc điểm cốt lõi
- Bắt đầu từ trạng thái trống ở mỗi cuộc trò chuyện, không tải trước hồ sơ người dùng hay lịch sử trò chuyện trước đó
- Tính năng bộ nhớ chỉ được kích hoạt khi người dùng dùng cụm từ gọi rõ ràng như "hãy cho tôi biết những gì chúng ta đã nói trước đây" hoặc "hãy tiếp tục từ lần trước"
Claude không dùng bản tóm tắt do AI tạo ra hay hồ sơ nén, mà chỉ tìm kiếm trực tiếp lịch sử hội thoại trước đây thực tế theo thời gian thực để sử dụng thông tin đó
Sau khi tìm kiếm xong, Claude sẽ tích hợp kết quả để trả lời yêu cầu của người dùng hoặc tiếp tục cuộc thảo luận
Công cụ Conversation Search
- Công cụ conversation_search tìm kiếm toàn bộ lịch sử hội thoại theo từ khóa hoặc chủ đề
- Ví dụ, nếu yêu cầu "bạn có nhớ những gì chúng ta đã nói về Chandni Chowk không?", Claude sẽ tìm nhiều cuộc trò chuyện liên quan đến chủ đề đó rồi tổng hợp và cung cấp bản tóm tắt
- Nếu hỏi đồng thời nhiều chủ đề (ví dụ: Michelangelo, Chainflip, Solana), hệ thống sẽ lần lượt tìm riêng từng chủ đề và trả về nội dung kèm liên kết
- Các tham số của
conversation_searchbao gồm số lượng kết quả tối đa, truy vấn tìm kiếm, v.v.- Ví dụ:
max_results(1~10),query(từ khóa tìm kiếm)
- Ví dụ:
Công cụ Temporal Chat Retrieval
- Công cụ recent_chats truy cập lịch sử hội thoại theo mốc thời gian
- Nếu yêu cầu như "hãy cho tôi biết nội dung 10 cuộc trò chuyện gần đây", công cụ sẽ tìm các cuộc trò chuyện mới nhất theo thứ tự và cung cấp bản tóm tắt
- Cũng có thể tìm theo thời điểm bằng cách chỉ định khoảng thời gian cụ thể, chẳng hạn "những gì chúng ta đã nói vào tuần cuối cùng của tháng 11 năm 2024?"
- Các tham số của
recent_chatsgồmafter/before(thời điểm bắt đầu/kết thúc),n(số lượng cuộc trò chuyện, 1~20),sort_order(thứ tự xuôi/ngược)
So sánh giữa ChatGPT và Claude
Cho đến tận năm ngoái, các tính năng chính mà ChatGPT và Claude cung cấp còn khá giống nhau, nhưng giờ đây định hướng sản phẩm đã khác biệt đáng kể
- ChatGPT đã phát triển thành sản phẩm tiêu dùng cho thị trường đại chúng, với người dùng đến từ nhiều nền tảng khác nhau như học sinh, phụ huynh, người có sở thích cá nhân
- Ở mọi cuộc trò chuyện, thành phần bộ nhớ được tự động tải, mang lại trải nghiệm cá nhân hóa tức thì và dễ dàng
- Dựa trên hồ sơ người dùng chi tiết, có thể tận dụng cho gợi ý tính năng trong tương lai, tính năng tùy biến và kiếm tiền
- Claude được phát triển nhắm đến nhóm người dùng là nhà phát triển, kỹ sư và chuyên gia
- Người dùng hiểu cách thuật toán vận hành và tự lựa chọn rõ ràng khi nào sẽ gọi bộ nhớ
- Thay vì hồ sơ hóa hay tự động hóa, họ coi trọng hơn tính công cụ, khả năng dự đoán và quyền riêng tư
Như vậy, hệ thống bộ nhớ của hai dịch vụ phản ánh trực tiếp sự khác biệt về nhóm người dùng và triết lý phát triển
Sự đa dạng trong thiết kế bộ nhớ AI
Hai hệ thống bộ nhớ hoàn toàn trái ngược của ChatGPT và Claude cho thấy lĩnh vực thiết kế bộ nhớ AI rất đa dạng
- Không có đáp án đúng hay lời giải phổ quát cho cách tiếp cận bộ nhớ, và việc thiết kế ngược từ nhu cầu và mục đích thực tế của người dùng là điều bắt buộc
- Vì lịch sử sử dụng công cụ AI còn chưa đầy 3 năm, hiện vẫn thiếu các thông lệ tốt đã được xác lập về xử lý dữ liệu tích lũy hoặc quản lý quyền riêng tư khi dùng cùng một trợ lý AI trong thời gian dài
- Hiện nhiều ứng dụng AI đang thử nghiệm những cách tiếp cận bộ nhớ độc đáo của riêng mình, trong khi các mô hình nền tảng cũng đang mạnh lên theo từng tuần
- Trong quá trình này không có một đáp án tối ưu duy nhất, và nhiều thử nghiệm cùng cách tiếp cận đa dạng vẫn đang tiếp diễn
Cập nhật gần đây: Claude giới thiệu tính năng bộ nhớ tự động
Vào đúng ngày bài viết này được đăng, Anthropic đã công bố tính năng bộ nhớ tự động của Claude cho tài khoản Team/Enterprise
- Tính năng này, tương tự cách của ChatGPT, tự động xây dựng bản tóm tắt bộ nhớ dựa trên ngữ cảnh công việc, mẫu hình làm việc và thông tin theo từng dự án
- Mỗi dự án Claude sẽ có một bộ nhớ độc lập, và người dùng có thể trực tiếp xem và chỉnh sửa những gì Claude ghi nhớ
- Gói đăng ký Pro Max cá nhân của tác giả vẫn chưa có tính năng này nên chưa thể đánh giá
- Trong tương lai sẽ có thêm bài đánh giá về so sánh với bộ nhớ dựa trên tìm kiếm hiện có cũng như khác biệt với ChatGPT
2 bình luận
Ý kiến trên Hacker News
Khác biệt trong cách triển khai rốt cuộc bắt nguồn từ mục tiêu kinh doanh
ChatGPT rõ ràng nhắm đến việc kiếm tiền qua quảng cáo và liên kết tiếp thị, và cách triển khai bộ nhớ cũng tập trung vào việc xây dựng hồ sơ người dùng
Trong khi đó, cách triển khai bộ nhớ của Claude gần hơn với mục tiêu dài hạn là truy cập các tương tác trong quá khứ và các lớp trừu tượng hóa
Nó được thiết kế để có thể tìm kiếm hội thoại theo cách tương tự như con người truy xuất ký ức, và về sau thông qua học tăng cường, có thể ghi nhớ những lỗi mà người dùng đã chỉ ra, hoặc rút ra các trừu tượng từ các cuộc trò chuyện trước để chủ động xử lý công việc
Cuối cùng, ChatGPT cố ghi nhớ chính người dùng, còn Claude tập trung vào lịch sử của từng tương tác riêng lẻ
Tôi cảm thấy có điểm lời nói và hành động thực tế không khớp nhau
thì với một số chủ đề như b, c, f, OpenAI có thể kiếm tiền bằng quảng cáo xen ngang (toàn màn hình, hơn 30 giây)
Điều này có thể làm được chỉ bằng cách phân tích chủ đề
Nếu OpenAI có thể phân tích khoảng 1000 phiên chat và coding để tối đa hóa doanh thu bằng cách dẫn dắt người dùng vào làm ở một công ty cụ thể hoặc mua xe từ công ty khác, thì trong quá trình đó họ không chỉ có thể chèn quảng cáo xen ngang mà còn có thể điều chỉnh chất lượng hoặc nội dung câu trả lời
Đây là một viễn cảnh vừa đủ thực tế vừa mang tính phản địa đàng
Ngược lại, nếu DeepSeek vận hành không có quảng cáo, thì tiêu chuẩn để các LLM mã nguồn đóng giành thị phần sẽ cao hơn rất nhiều
Cuối cùng, LLM rồi cũng sẽ như mọi sản phẩm khác: người dùng trả tiền theo chất lượng, và sẽ mong muốn những mức chất lượng khác nhau
Tôi nghĩ vì quảng cáo có thể làm tổn hại độ tin cậy của câu trả lời AI, nên quảng cáo toàn màn hình là kết cục thực tế nhất
ChatGPT không phải mạng xã hội, nên không cần kiếm tiền theo cùng cách
Họ đã kiếm đủ tiền từ thuê bao, enterprise, business, API, v.v.
Chỉ ra rằng liên kết đến bài phân tích về cách triển khai bộ nhớ của ChatGPT bị sai, và chia sẻ liên kết chính xác
Tôi từng tò mò về cách ChatGPT triển khai bộ nhớ, và thật thú vị khi thấy nó có cách tiếp cận hoàn toàn khác Claude
Cách của Claude có vẻ phù hợp hơn để giải quyết các bài toán kỹ thuật, còn ChatGPT có vẻ thuận lợi hơn cho hội thoại đời thường và tích hợp quảng cáo
Một lúc nào đó, kiểu bộ nhớ dựa trên ngôn ngữ này sẽ trở nên lỗi thời, và sẽ có ai đó tìm ra một cách lưu trữ/truy xuất ký ức được mã hóa vượt ra ngoài biểu đạt ngôn ngữ
Đây có thể là bước đột phá cuối cùng cho AGI
Các LLM hiện tại không hiểu khái niệm; thực ra chúng không có chức năng gọi là “hiểu”, và về bản chất chỉ là chuỗi Markov được tinh vi hóa
Tôi nghĩ trí thông minh thực sự mới là điều kiện tiên quyết của AGI
Có vẻ như bộ nhớ của ChatGPT chỉ cho phép đưa vào ngữ cảnh phần Memory thực sự là tóm tắt theo từng thực thể
Và cũng có ý kiến rằng cách tóm tắt hội thoại trước đây hay phương pháp Embedding cũng có thể được xem là lưu trữ bộ nhớ theo kiểu mã hóa
Điều đó khiến tôi phải nghĩ xem làm sao để AGI chịu nghe lệnh
Nói rằng hài lòng với cách Claude triển khai bộ nhớ, nhưng đã tắt bộ nhớ của ChatGPT
Vì họ dùng ChatGPT cho quá nhiều việc khác nhau, nên việc nó cố gắng nối các nội dung không liên quan với nhau một cách vô nghĩa khiến cảm giác khá gượng gạo
Tôi muốn có cá nhân hóa và tham chiếu đến thông tin cần thiết
Ví dụ, nếu để nó ghi nhớ thông tin của một dự án thì từ đó về sau không cần phải giải thích lại ngữ cảnh mỗi lần, nên chất lượng cuộc sống cải thiện đáng kể
Tuy nhiên, tôi không thích cách nó tự tạo bộ nhớ hội thoại nền mà tôi không thể trực tiếp kiểm soát
ChatGPT thì trộn cả những nội dung cũ không mong muốn vào một cách không cần thiết nên khá vô ích
Tôi đã dùng nhiều AI tutor khác nhau cho mục đích học ngôn ngữ và ChatGPT là tốt nhất
Nhưng tôi cứ phải lặp đi lặp lại yêu cầu “hãy nói chậm hơn”, và ngay cả khi bảo áp dụng quy tắc này cho toàn bộ cuộc trò chuyện thì nó cũng không làm được
Ngoài ra còn có những phần khác mà bộ nhớ không hoạt động đúng
Chẳng bao lâu nữa, cách hoạt động của bộ nhớ trong ChatGPT sẽ thay đổi
Liên kết tham khảo: X.com - tin thay đổi bộ nhớ, thông báo chính thức của Anthropic
Chia sẻ kinh nghiệm từng tự viết bài về bộ nhớ và lịch sử chat của ChatGPT
Trong đó cũng có kèm prompt để dump thông tin trực tiếp
Liên kết liên quan
Tôi luôn muốn kiểm soát chính xác đầu vào nên thường tắt hoàn toàn bộ nhớ
Tôi muốn loại bỏ mọi system prompt, training, v.v. và chỉ dùng đúng prompt do tôi tự viết
Tôi nghi ngờ liệu những thông tin được moi ra bằng cách hỏi trực tiếp ChatGPT có đáng tin hay chỉ là hallucination tạo sinh
Tôi không thấy có lý do gì để LLM biết chính xác nó hoạt động như thế nào, và cũng khó tin là nó được cung cấp tài liệu huấn luyện về chuyện đó
Vì những thông tin công cụ này thường được ghi rất chi tiết trong system prompt
Claude được cho là chỉ tham chiếu đúng lịch sử hội thoại gốc để gọi lại ký ức
Nó không có tóm tắt do AI tạo ra hay hồ sơ nén, mà chỉ tìm kiếm trực tiếp trong các cuộc trò chuyện thực tế trước đây theo thời gian thực
Việc không có tóm tắt, hồ sơ hay knowledge graph không phải là tính năng chuyên gia, mà có nghĩa là nó hoạt động không tốt
Ví dụ, nó có thể nhớ những thứ cụ thể như "Chandni Chowk", nhưng những cách diễn đạt mơ hồ như "đồng nghiệp của tôi từng có vấn đề" thì có thể sẽ không tìm ra đúng
Hỏi trở ngại là gì khi dùng kho lưu trữ bộ nhớ bên ngoài thông qua tool calling hoặc MCP
Họ cũng tò mò liệu có đang dùng RL để tăng cường các mẫu sử dụng bộ nhớ hay không
Từ góc độ quyền riêng tư dữ liệu, khi suy luận thì LLM đằng nào cũng biết thông tin, nhưng tôi vẫn không muốn nhập trực tiếp vào
Ví dụ: "Sở thích: MacOS, bondage, discipline, Baseball"
Khi đó, dù có liên tục gợi ý qua prompt, Claude vẫn không muốn chủ động tận dụng bộ nhớ
Lần nào cũng phải chỉ định rõ ràng là kiểm tra hay lưu ký ức, nên hiệu quả sử dụng khá thấp
Repository liên quan
Tôi thấy bối rối sau khi đọc bài này
Không rõ tác giả có đang nghĩ rằng prompt vẫn bị chèn vào ngay cả khi đã tắt bộ nhớ hay không
Với trường hợp của tôi, khi bộ nhớ tắt thì hoàn toàn không có metadata nào như các cuộc trò chuyện gần đây hay thông tin sở thích được chèn vào, và nó vẫn là một cuộc trò chuyện hoàn toàn độc lập
Tôi không biết có phải việc bật rồi tắt bộ nhớ trong lúc thử nghiệm đã gây ra nhầm lẫn hay không, hay là do tôi đọc bài chưa kỹ
Đột nhiên tất cả dấu chấm đều biến mất.