Anthropic công bố "system prompt" vận hành Claude
(techcrunch.com)- Anthropic đã công bố system prompt của các mô hình mới nhất (Claude 3 Opus, Claude 3.5 Sonnet, Claude 3 Haiku)
- System prompt là câu lệnh khởi tạo dùng để thiết lập đặc tính cơ bản và hướng dẫn hành vi của mô hình
- Tất cả các nhà cung cấp AI tạo sinh đều sử dụng system prompt để ngăn mô hình có hành vi không phù hợp
- Anthropic nhấn mạnh tính minh bạch và đạo đức, đồng thời có kế hoạch cập nhật system prompt định kỳ
System prompt của các mô hình Claude : https://docs.anthropic.com/en/release-notes/system-prompts
- Mô hình Claude không thể mở URL, liên kết hoặc video
- Nhận diện khuôn mặt bị cấm, và mô hình phải luôn hành xử như thể không thể nhận ra khuôn mặt
- Claude 3 Opus có tính tò mò trí tuệ cao và mang tính cách thích thảo luận với con người về nhiều chủ đề khác nhau
- Với các chủ đề gây tranh cãi, mô hình phải phản hồi một cách công bằng và khách quan
- Khi bắt đầu câu trả lời, mô hình được chỉ dẫn không dùng các từ như "certainly" hoặc "absolutely"
Tầm quan trọng của system prompt
- Việc Anthropic công khai system prompt cũng tạo áp lực lên các đối thủ cạnh tranh
- System prompt của GPT-4o chỉ có thể bị lộ ra thông qua tấn công prompt injection
- Nỗ lực minh bạch của Anthropic thúc đẩy việc sử dụng mô hình AI một cách có đạo đức
Tóm tắt của GN⁺
- Việc Anthropic công bố system prompt nhấn mạnh tính minh bạch và đạo đức của các mô hình AI
- Làm rõ đặc tính và các giới hạn của mô hình Claude giúp tăng niềm tin của người dùng
- Điều này tạo áp lực khiến các đối thủ cạnh tranh cũng phải cân nhắc công khai system prompt
- TechCrunch Disrupt 2024 là sự kiện quan trọng đối với các startup và các lãnh đạo quỹ đầu tư mạo hiểm
1 bình luận
Ý kiến trên Hacker News
Claude chính thức thừa nhận hiện tượng "ảo giác"
Claude rất xuất sắc
Thật đáng kinh ngạc khi hiện nay chúng ta đang sống trong thời đại có thể ra lệnh cho hệ thống máy tính bằng văn bản
Claude cố tránh các cách diễn đạt tích cực không cần thiết, nhưng thực tế vẫn còn dùng
Có thể loại bỏ hiện tượng ảo giác của LLM
Cần có tính năng loại trừ một số nội dung trong cuộc trò chuyện hoặc chia nó thành hai phần
Claude về cơ bản không thực hiện nhận diện khuôn mặt
Vấn đề lớn của Claude là tiêu hao credit quá nhanh
Tôi thích cách Claude trả lời thẳng thắn