1 điểm bởi GN⁺ 2023-11-16 | 1 bình luận | Chia sẻ qua WhatsApp

Cách cấu hình GPT

  • GPT là các cấu hình được đặt tên của ChatGPT, bao gồm tên, logo và mô tả ngắn.
  • Có thể bao gồm các chỉ dẫn tùy chỉnh để định hướng hành vi của GPT, tương đương với "system prompt".
  • Có thể tùy chọn cung cấp tối đa 4 prompt mẫu để bắt đầu cuộc trò chuyện.
  • Có thể tải lên nhiều tệp để cung cấp thêm ngữ cảnh và hỗ trợ tạo câu trả lời.
  • Có thể bật hoặc tắt Code Interpreter, chế độ Browse và DALL-E 3.
  • Có thể thiết lập "Actions" tùy chọn, là các endpoint API mà GPT có thể gọi.

Cách hoạt động của GPT Builder

  • GPT Builder là một chatbot tự động tạo GPT thông qua cuộc trò chuyện với người dùng.
  • Tab "Create" cho phép người dùng tạo GPT qua hội thoại, nhưng trên thực tế nó tự động điền vào biểu mẫu "Configure".
  • Nhiều người khuyên nên tránh tab "Create" sau khi tạo GPT đầu tiên.

Một số ví dụ thú vị về GPT

  • Dejargonizer: GPT giải thích thuật ngữ chuyên môn, phân tích văn bản và định nghĩa các thuật ngữ đó.
  • JavaScript Code Interpreter: GPT có thể thực thi mã JavaScript bằng cách đính kèm runtime Deno.
  • Dependency Chat: Phân tích tài liệu phụ thuộc của một dự án GitHub và trả lời các câu hỏi liên quan.
  • Add a walrus: GPT thêm một con moóc vào ảnh bằng GPT-Vision và DALL-E.
  • Animal Chefs: GPT trong đó các đầu bếp động vật cung cấp công thức nấu ăn kèm những câu chuyện cá nhân.
  • Talk to the datasette.io database: GPT trả lời câu hỏi bằng cách chạy truy vấn SQL.
  • Just GPT-4: GPT vô hiệu hóa mọi tính năng bổ sung để mang lại trải nghiệm GPT-4 thuần túy.

Tính năng tri thức của GPT

  • Khi đính kèm tệp vào GPT, nó sẽ cố gắng dùng các tệp đó để trả lời câu hỏi.
  • Có vẻ đây là một cách triển khai Retrieval Augmented Generation (RAG).
  • OpenAI không chia sẻ nhiều thông tin chi tiết về tính năng này, khiến người dùng khó sử dụng hiệu quả.

Mô hình thanh toán của GPT

  • GPT chỉ khả dụng cho người đăng ký ChatGPT Plus với giá $20/tháng, nên việc phân phối bị hạn chế.
  • Người dùng có thể triển khai các dự án dựa trên nền tảng OpenAI mà không cần tự cung cấp API key.

Tầm quan trọng của bảo mật prompt và tính công khai

  • Nếu người dùng đủ kiên trì, các tài liệu và prompt được thêm vào GPT có thể bị rò rỉ.
  • Nên giả định rằng prompt sẽ bị lộ, và tốt hơn là chủ động công khai chúng.

Kỳ vọng cho GPT trong tương lai

  • Có thể kỳ vọng các cải tiến như tài liệu tốt hơn cho tính năng tri thức, khả năng truy cập API, cách cung cấp GPT cho người không đăng ký và thiết lập giới hạn ngân sách.

Ý kiến của GN⁺

Điểm quan trọng nhất của bài viết này là việc khám phá các tính năng và khả năng mới của GPTs, một chủ đề hấp dẫn với những người làm trong lĩnh vực kỹ thuật phần mềm và trí tuệ nhân tạo. Khả năng cho phép người dùng tự tạo GPT và tương tác với người dùng khác mở ra một cách mới để xây dựng các giao diện hội thoại tùy biến. Ngoài ra, việc tích hợp nhiều chức năng như thực thi mã, tìm kiếm tài liệu và tạo hình ảnh cho thấy tiềm năng nâng cao trải nghiệm người dùng.

1 bình luận

 
GN⁺ 2023-11-16
Ý kiến trên Hacker News
  • Là người dùng GPT, tôi nhận ra rằng nếu không thể xem prompt thì tôi không muốn dùng GPT. Tôi không muốn dùng ChatGPT mà trong đó một người lạ có thể chèn vào những hành vi kỳ quặc mà tôi không hề biết.
    • Tôi muốn OpenAI thêm tùy chọn "xem mã nguồn" cho GPT. Tôi nghĩ mặc định nên là "bật", dù tôi cũng hình dung đây có thể là một quyết định không được ưa chuộng.
  • Tôi có xu hướng tránh các chatbot dựa trên GPT. Tôi không muốn bị thao túng một cách tinh vi theo những chỉ thị tùy chỉnh mà tôi không biết.
    • Việc thêm tùy chọn "xem mã nguồn" sẽ biến tính năng này từ mức "không hấp dẫn lắm" thành "đáng để trả tiền".
    • Tôi đang dành phần lớn thời gian để dùng Kagi và đang cân nhắc hủy GPT Plus, nhưng thay đổi này sẽ khiến tôi tiếp tục đăng ký.
  • Cách tôi biết đến các tính năng mới của OpenAI:
    1. Lướt qua các tiêu đề trên Twitter đang ầm ĩ công bố thứ gì đó mới
    2. Nhận một lượng tweet áp đảo từ các influencer trên Twitter về chuyện đó
    3. Bỏ qua và chờ đến khi simonw giải thích
    4. Đọc bài blog mà simonw đã thử tính năng đó theo nhiều cách khác nhau và viết một phần giải thích cùng phê bình rõ ràng. Mọi thứ lập tức trở nên dễ hiểu.
  • Nói rằng đây "chỉ là ChatGPT có sẵn pre-prompt" là đúng.
    • Nói rằng đây "chỉ là Custom Instructions với UI tốt" cũng đúng.
    • Nhưng đừng bao giờ đánh giá thấp tác động thay đổi cuộc chơi của một "UI tốt". GPT-3 đã có thể dùng trong nhiều năm, nhưng trước khi có UI tốt thì hầu như chẳng ai biết hoặc quan tâm.
    • Trông thì như một "điều chỉnh nhỏ" về khả năng sử dụng, nhưng lại có tác động ở mức gần như một "bước nhảy lượng tử".
  • Có những người thường hỏi tôi ý kiến về GPT/AI. Tôi hỏi họ đã dùng thử chưa. "Chưa". "Bạn biết là nó miễn phí chứ?" "Biết". Thái độ này thật khó hiểu. Là sợ điều chưa biết? Là lười? Hay là cần bằng chứng xã hội trước khi thử một thứ gì đó?
  • Không thể xem prompt của OpenAI, và có lẽ ngay cả tác giả cũng không xem được, nhưng tôi vẫn muốn dùng GPT của OpenAI.
    • Ở đây có một bước nhảy niềm tin khá lớn. Tôi tự hỏi liệu OpenAI có lộ trình cụ thể nào hướng tới độ tin cậy hoặc tính nhất quán hay không.
  • Tôi có toàn bộ prompt của Custom GPT Builder: [có cung cấp liên kết GitHub]
  • Gửi lời cảm ơn tới simonw vì đã ghi chép tất cả điều này theo thời gian thực và tạo ra những công cụ dễ hiểu, dễ tiếp cận (như dòng lệnh llm).
    • Tôi cứ nghĩ API tìm kiếm đang làm sai vì không cung cấp trích dẫn phù hợp, nên thật tốt khi biết rằng không chỉ mình tôi gặp vậy.
  • Tôi muốn biết thêm về cách openAI triển khai tính năng RAG "knowledge base", nhưng hiện có quá ít chi tiết.
    • Tôi đã tải toàn bộ văn bản từ grugbrain.dev lên và có thể trò chuyện với một grug brain rất hợp lý: [có cung cấp liên kết chat OpenAI]
  • Gần đây tôi đang làm "synbiogpt" và từ đó nhận ra các giới hạn của custom GPT.
    • Dữ liệu chuỗi sinh học thường rất dài. Dữ liệu nằm trong file thì không sao, nhưng nếu cần tương tác với API cho các tính năng nâng cao (ví dụ: tối ưu hóa codon), thì dữ liệu này phải được gửi qua mạng. Khi đó cửa sổ ngữ cảnh của lệnh gọi API bị lấp đầy bởi dữ liệu chuỗi và thất bại.
    • Không thể inject dependency. Đôi khi GPT cố tự triển khai, nhưng thường là sai.
    • Khi GPT-4 nghĩ rằng nó biết mình đang nói về cái gì, API tìm kiếm thường không mở file. Khi nói về các đoạn gene, tôi muốn nói rất cụ thể về một phần nhất định trong thư viện của tôi, chứ không phải phần mà GPT-4 tự cho là đúng.
    • Tôi đã giải quyết phần lớn vấn đề bằng cách tự tạo một môi trường scripting lua (các chức năng sinh học nằm trong golang, và tôi dùng gopher-lua để chạy môi trường lua). Tôi inject ví dụ lua về cách dùng các chức năng scripting, cùng thư viện nhỏ hiện tại về các đoạn gene, rồi yêu cầu nó tạo lua để thực hiện tác vụ cụ thể trên file được cung cấp. GPT-4 hoàn toàn không nhìn file, còn ứng dụng golang nội bộ của tôi sẽ chạy đoạn lua đã được viết. Cách này hoạt động cực kỳ tốt và nhanh hơn custom GPT rất nhiều.
    • Vấn đề lớn nhất hiện tại là phần frontend. Tôi muốn có một bản clone ChatGPT mã nguồn mở, có thể lấy file đính kèm ra và cho phép chỉnh sửa input ban đầu của người dùng. Đến giờ tôi vẫn chưa tìm được lựa chọn nào tốt.
  • Về cách dùng RAG để có kết quả tốt hơn.
    • Tôi đã có một số thành công với việc này.
    • Tôi dùng Assistant API, và tôi tin rằng nó không giống GPT. Tôi đã thử dùng nó qua giao diện web.
    • Tôi có hơn 100 file PDF được OCR bằng Tesseract. Sau đó tôi bảo ChatGPT viết một script để gộp tất cả các file thành một file txt duy nhất mà vẫn giữ nguyên bố cục.
    • Tôi tải file lên và bắt đầu đặt câu hỏi. Các file chứa dữ liệu rất kỹ thuật về quy chuẩn xây dựng bằng một ngôn ngữ không phải tiếng Anh, nên có lẽ model không quen với kiểu ngôn ngữ đó.
    • Dù vậy, kết quả vẫn đáng ngạc nhiên là rất tốt. Nó có thể trả lời câu hỏi và câu trả lời cũng tốt. Đáng lẽ nó phải chú thích nguồn câu trả lời đến từ đâu, nhưng việc đó không hoạt động đúng.
    • Tôi đã thử tải lên PDF, file JSON, CSV, v.v. Cho đến nay, văn bản thô hoạt động tốt nhất.
  • Ghi chú về tính năng RAG "knowledge" này khá thú vị.
    • Qua trao đổi và trải nghiệm, mọi người nhận ra rằng truy xuất RAG rất đặc thù theo từng mô hình kinh doanh và dữ liệu. Không có giải pháp chung áp dụng cho tất cả ở đây. Trong CMS thì bước tiếp theo của khách hàng khác với việc tạo SQL dựa trên schema. Nó cũng khác với việc mua sắm trong một catalog thương mại điện tử.
    • Về cơ bản đây là một bài toán liên quan đến truy xuất. Thực tế còn khó hơn thế. Những vấn đề này nổi tiếng là cực kỳ khó.