Nghiên cứu thú vị: Đây là một nghiên cứu thú vị vì xuất hiện rất nhanh sau công bố "Mapping the Mind of a Large Language Model" của Anthropic. Nhiều người vẫn nói rằng "chúng ta không biết LLM/deep learning hoạt động như thế nào", nhưng những nghiên cứu như thế này bác bỏ sự khái quát đó.
Thắc mắc về việc chọn ví dụ: Trong các ví dụ của GPT-4, có những câu liên quan đến việc tăng giá nhưng thực tế lại thể hiện việc giảm giá, nên khá khó hiểu. Tôi thắc mắc vì sao những ví dụ như vậy lại được chọn.
Tìm kiếm ngữ nghĩa nâng cao: Tôi thích ví dụ lọc các khái niệm như tăng giá trong tài liệu. Cách này có thể nhanh hơn và chính xác hơn so với việc huấn luyện mô hình.
Lỗi phân loại: Có lỗi phân loại một phần giải thích khoa học thành nội dung khiêu dâm. Có thể kiểm tra qua liên kết.
Nghiên cứu tương tự: Điều này gợi nhớ đến nghiên cứu về Claude 3 Sonnet của Anthropic.
Diễn giải mô hình: Tôi tò mò nghiên cứu này đã cải thiện như thế nào nếu so với việc áp dụng các công cụ như SHAP. Khẳng định rằng "chúng ta hiện chưa hiểu hoạt động thần kinh của các mô hình ngôn ngữ" là sai.
Yêu cầu giải thích cơ bản: Có người đề nghị giải thích tầm quan trọng của nghiên cứu này theo cách dễ hiểu.
Công cụ đi kèm cho mô hình mở: Việc công bố một autoencoder để giải thích đầu ra của mạng nơ-ron có thể trở thành một thực tiễn tốt. Nó có thể là công cụ đi kèm hữu ích cho mọi mô hình mở trên Hugging Face.
fMRI của mạng nơ-ron: Điều này giống với fMRI, nơi có thể nhìn thấy các vùng được kích hoạt theo từng chủ đề cụ thể trong mạng nơ-ron. Tôi tự hỏi liệu có thể gắn thêm một mạng nơ-ron đánh giá để tự động đánh giá các vùng kích hoạt hay không.
Mức độ liên quan đến sparse embedding: Có thể điều này liên quan đến sparse embedding (như Splade), và tôi tự hỏi liệu nó có thể được dùng cho tìm kiếm lai hay không.
1 bình luận
Ý kiến Hacker News
Nghiên cứu thú vị: Đây là một nghiên cứu thú vị vì xuất hiện rất nhanh sau công bố "Mapping the Mind of a Large Language Model" của Anthropic. Nhiều người vẫn nói rằng "chúng ta không biết LLM/deep learning hoạt động như thế nào", nhưng những nghiên cứu như thế này bác bỏ sự khái quát đó.
Thắc mắc về việc chọn ví dụ: Trong các ví dụ của GPT-4, có những câu liên quan đến việc tăng giá nhưng thực tế lại thể hiện việc giảm giá, nên khá khó hiểu. Tôi thắc mắc vì sao những ví dụ như vậy lại được chọn.
Tìm kiếm ngữ nghĩa nâng cao: Tôi thích ví dụ lọc các khái niệm như tăng giá trong tài liệu. Cách này có thể nhanh hơn và chính xác hơn so với việc huấn luyện mô hình.
Lỗi phân loại: Có lỗi phân loại một phần giải thích khoa học thành nội dung khiêu dâm. Có thể kiểm tra qua liên kết.
Nghiên cứu tương tự: Điều này gợi nhớ đến nghiên cứu về Claude 3 Sonnet của Anthropic.
Diễn giải mô hình: Tôi tò mò nghiên cứu này đã cải thiện như thế nào nếu so với việc áp dụng các công cụ như SHAP. Khẳng định rằng "chúng ta hiện chưa hiểu hoạt động thần kinh của các mô hình ngôn ngữ" là sai.
Yêu cầu giải thích cơ bản: Có người đề nghị giải thích tầm quan trọng của nghiên cứu này theo cách dễ hiểu.
Công cụ đi kèm cho mô hình mở: Việc công bố một autoencoder để giải thích đầu ra của mạng nơ-ron có thể trở thành một thực tiễn tốt. Nó có thể là công cụ đi kèm hữu ích cho mọi mô hình mở trên Hugging Face.
fMRI của mạng nơ-ron: Điều này giống với fMRI, nơi có thể nhìn thấy các vùng được kích hoạt theo từng chủ đề cụ thể trong mạng nơ-ron. Tôi tự hỏi liệu có thể gắn thêm một mạng nơ-ron đánh giá để tự động đánh giá các vùng kích hoạt hay không.
Mức độ liên quan đến sparse embedding: Có thể điều này liên quan đến sparse embedding (như Splade), và tôi tự hỏi liệu nó có thể được dùng cho tìm kiếm lai hay không.