- ChatGPT dựa trên GPT-5 (còn gọi là Research Goblin) cho thấy mức độ chính xác và hữu ích rất cao trong tìm kiếm web
- Từ các câu hỏi trivial thông thường đến điều tra thông tin phức tạp, nó thể hiện năng lực khám phá và suy luận mạnh mẽ trên nhiều chủ đề rộng lớn
- Trong các ví dụ thực tế, nó cung cấp câu trả lời và tài liệu đáng tin cậy thông qua quy trình tìm kiếm đồ sộ và suy luận theo chuỗi
- Ngay cả trong môi trường di động, người dùng vẫn có thể trải nghiệm tính tiện dụng vượt trội và luồng công việc liên tục
- Nhờ tích hợp tool calling và chain-of-thought, từ góc nhìn nhà phát triển, nó đặt ra một tiêu chuẩn mới cho tìm kiếm dựa trên LLM
Suy luận GPT-5 (Research Goblin) và cuộc cách mạng tìm kiếm
Mô hình tìm kiếm đang thay đổi
- Trước đây, lời khuyên chủ đạo là “đừng dùng chatbot như công cụ tìm kiếm”, nhưng với ChatGPT dựa trên GPT-5 mới nhất, quy tắc đó đang bị phá vỡ
- Mô hình dựa trên GPT-5 không chỉ dừng ở việc tích hợp với các công cụ tìm kiếm như Bing mà thực tế đã đạt tới mức có thể thay thế hoặc vượt qua việc nghiên cứu trên Internet
- Biệt danh “Research Goblin” xuất hiện vì khi được giao bất kỳ thắc mắc hay nhiệm vụ phức tạp nào, nó sẽ điều tra một cách dai dẳng gần như bất thường để rút ra câu trả lời tối ưu
Các ví dụ tìm kiếm thực tế và kết quả
Travelators thú vị
- Khi được hỏi thời điểm băng chuyền di chuyển bằng cao su ở sân bay Heathrow được thay bằng kim loại, nó ước tính là trong giai đoạn 2014–2018 và còn tìm ra một bài viết thú vị liên quan từ năm 2024
Nhận diện tòa nhà
- Khi được hỏi về một tòa nhà lạ mắt nhìn thấy ngoài cửa sổ tàu, chỉ trong 1 phút 4 giây nó đã xác định chính xác đó là 'The Blade (Reading)', đồng thời cung cấp cả liên kết nguồn
Điều tra cake pop của Starbucks UK
- Nó điều tra chuyên sâu lý do các cửa hàng Starbucks tại Anh không có cake pop, và phát hiện rằng sản phẩm này được đưa vào từ năm 2023 nhưng một số cửa hàng nhất định (đặc biệt là cửa hàng tại điểm du lịch) không kinh doanh
- Nó cũng tổng hợp các tài liệu chứng minh như PDF hướng dẫn dinh dưỡng và dị ứng, thảo luận trên Reddit, v.v.
Mối quan hệ giữa Wikipedia và Britannica
- Nó phân tích sâu tính xác thực và ngữ cảnh của phát biểu trên mạng rằng Wikipedia thời kỳ đầu đã sử dụng một phần dữ liệu nguồn từ Britannica bản năm 1911, rồi lần theo và cung cấp cả tài liệu dự án lẫn phần giải thích liên quan
Tên chính thức của University of Cambridge
- Nó đưa ra tên pháp lý chính thức của Đại học Cambridge là
The Chancellor, Masters, and Scholars of the University of Cambridge, kèm theo tài liệu căn cứ
- Nó cũng trình bày minh bạch quá trình suy luận để có thể kiểm chứng độ tin cậy của đáp án
Lịch sử hang động và nhà hàng ở Exeter quay
- Về cấu trúc bên trong nhà hàng được khoét vào vách đá ở khu Quay của Exeter và lịch sử của nó, sau nhiều bước tìm kiếm và phân tích PDF, nó xác định được bối cảnh hình thành trong các vách sa thạch đỏ vào thập niên 1820–1830
- Nó cho thấy một kiểu tìm kiếm rất chủ động, như tìm báo cáo/bản vẽ tiếng Anh và thậm chí soạn sẵn bản nháp email yêu cầu thông tin khi không thể tiếp cận trực tiếp
So sánh Aldi và Lidl
- Nó phân tích dài về vị trí tại Anh, hình ảnh thương hiệu, thứ hạng thị trường của Aldi và Lidl, bao gồm cả số liệu về thị phần và đánh giá người tiêu dùng
- Theo yêu cầu của người dùng, nó còn sắp xếp lại bảng xếp hạng dựa trên tiêu chí “fanciness” (mức độ cao cấp)
Việc quét sách của các phòng thí nghiệm AI
- Ngoài trường hợp Anthropic quét số lượng lớn sách để tạo dữ liệu huấn luyện, nó cho biết không thể xác nhận liệu các viện nghiên cứu AI khác có hành vi tương tự hay không, nhưng vẫn ghi lại chi tiết quá trình dò tìm khả năng này
Ưu thế thực chất của tìm kiếm GPT-5
- Trong tìm kiếm bằng ChatGPT dựa trên GPT-5, có thể thu thập và đánh giá thông tin nhanh hơn, có hệ thống hơn và rộng hơn so với làm thủ công
- Đặc biệt, khả năng sử dụng trong môi trường di động đã được cải thiện mạnh, giúp thỏa mãn tò mò thường ngày hoặc xử lý các tác vụ điều tra hàng ngày ở bất cứ đâu
- Nó sở hữu khả năng cung cấp kết quả nhanh nhưng vẫn phong phú đến mức có thể thay thế tính năng Deep Research của OpenAI
Ý nghĩa từ góc nhìn phát triển LLM
- Nhờ sự kết hợp giữa tool calling và chain-of-thought, việc tìm kiếm, suy luận theo chuỗi và khám phá bổ sung có thể được nối liền một cách tự nhiên chỉ trong một bước “suy nghĩ”
- Công nghệ RAG (kết hợp tìm kiếm và sinh nội dung) cũng có thể được vận hành mạnh mẽ hơn nhiều nhờ gọi tool linh hoạt qua nhiều bước và liên kết tìm kiếm nâng cao
- Theo cách gọi của Anthropic, đây là interleaved thinking, và OpenAI Responses API cũng hỗ trợ luồng tương tự
Mẹo để tận dụng tìm kiếm hiệu quả
- Có thể nâng cao chất lượng tìm kiếm thông qua trực giác kinh nghiệm (ví dụ dùng các gợi ý như “go deep” để thúc đẩy điều tra kỹ hơn)
- Ngay cả với những câu hỏi mang tính diễn giải không có đáp án rõ ràng, nó vẫn có thể tạo ra kết quả hữu ích và thú vị
- Giống như phép ẩn dụ “goblin”, Research Goblin là một AI tìm kiếm chăm chỉ nhưng không thể tin cậy hoàn toàn, khác với con người, và vì thế có giá trị ứng dụng cao
Chưa có bình luận nào.