À, tôi cứ tưởng đây là tin tức hay thông tin gì đó nên đã đọc, nhưng thấy nội dung hơi kỳ nên đã bình luận hỏi có phải quảng cáo không. Cảm ơn vì phản hồi nghiêm túc của bạn.

 

Hay đấy. Những người làm frontend và thiết kế thường chuẩn bị sẵn mấy thứ như thế này rồi mới bắt đầu.

 

"Tỷ lệ thắng" mới là cốt lõi.
Chỉ với việc dự đoán từ tiếp theo thì đừng nói là tạo ra câu văn dùng được, ngay cả lập trình hay toán học cũng không thể làm cho ra hồn.
Những kỹ thuật kiểu này đã xuất hiện từ thập niên 60~70 rồi.

(Nói chính xác thì cũng không hẳn là từ)

 

Có vẻ cũng là như vậy.
Tuy nhiên, bản thân mô hình rốt cuộc cũng chỉ là một hàm đầu vào/đầu ra mà thôi.
Với giả định có một harness phù hợp và một agent loop được cung cấp, thì có vẻ có thể nói rằng mô hình đạt được mục tiêu.

 

Trong nguyên tác không hề khẳng định rằng AI có thể thay thế toàn bộ tính chuyên môn. Bản thân tôi cũng không nghĩ như vậy...

 

Tôi là quản trị viên.
GeekNews hướng tới việc chia sẻ tin tức và thông tin dưới nhiều hình thức khác nhau, đồng thời cũng cho phép các bài viết do người dùng tự tổng hợp trong một phạm vi nhất định.
Tuy nhiên, nếu cùng một người dùng liên tục đăng bài từ một tên miền cụ thể thì sẽ bị áp dụng hạn chế theo tiêu chí.
Trường hợp này cũng đang được xem xét và điều chỉnh theo tiêu chí đó.
Một số biện pháp có thể sẽ không hiển thị từ bên ngoài.

 

gpt 3: dự đoán từ tiếp theo -> đúng
gpt 3 trở về sau, các mô hình dựa trên Transformer: dự đoán từ tiếp theo -> đúng.
AlphaGo, AlphaZero, MuZero, ...: dự đoán nước đi tiếp theo -> đúng.
Mô hình đạt được mục tiêu (cụ thể) -> đúng.

Trong nội dung đang nói thì không có gì sai cả

 

Chẳng phải toàn bộ tính chuyên môn đều không thể bị thay thế sao? Ngay từ quá trình tạo từ đã thấy kỳ lạ rồi.

 

Thật rối quá. Đây là một câu đùa thôi, hay là đã có một kỹ thuật hoặc công nghệ mới nào đó mà tôi chưa biết vậy??

 

Chẳng phải cả AlphaGo cũng dự đoán nước đi tiếp theo được tính là có tỷ lệ thắng cao nhất sao?????

 

"Dự đoán token tiếp theo" là cách mô tả chính xác ở cấp độ triển khai, nhưng có thể tóm lại rằng nó không đầy đủ nếu dùng để giải thích năng lực hay mục đích của mô hình, đúng không?

 

Vậy thì có lẽ cứ gặp nhau ở một mô hình dự đoán tốt hơn ở giữa là được 😄

 

Ừm.. tôi đang nghĩ có lẽ bài viết đã được truyền đạt khác với ý định của tôi. Nếu từ bài viết này bạn cảm thấy như tôi đang hạ thấp giá trị kỹ thuật của LLM thì tôi xin lỗi.

Tuy vậy, ý định của bài viết này là gỡ bỏ lớp bao bọc cường điệu và sự thần bí hóa để nhìn nhận một cách lạnh lùng. Vì vậy, cá nhân tôi cảm thấy cách diễn đạt là "mô hình đạt được mục tiêu" mang tính thần bí hóa. Suy cho cùng, dù là phần mềm thông thường hay mô hình thì cũng đều nhằm đạt được một "mục tiêu" nào đó.

Vì vậy, tôi muốn hỏi lại, cùng với sự tò mò cá nhân, liệu cách diễn đạt mà bạn nói có chính xác hơn về mặt kỹ thuật hay không.

 

Có vẻ như cuối cùng vẫn chỉ là quảng cáo cho Analytics. Nghe cũng có lý đấy, nhưng rốt cuộc vẫn là quảng cáo, và cũng cảm giác như quản trị viên hada.io đang để mặc quá mức.

 

Suy cho cùng đây là sự đánh đổi với chất lượng, và tôi cũng lo rằng liệu rồi nó có trở thành một cấu trúc phải dùng thêm token để khôi phục phần chất lượng đã mất hay không

 

Vì bm25 yếu trong việc tìm kiếm tiếng Hàn nên tôi cũng đã áp dụng thêm guardrail có thể tìm kiếm tiếng Hàn tốt.

 

Ở góc độ bức tranh lớn thì đây là việc tìm kiếm các cuộc trò chuyện trong quá khứ, nên nếu chỉ sắp xếp tốt vấn đề tổ chức là sẽ là một ý tưởng hay. Thực tế tôi cũng thấy nó đã giúp ích rất nhiều cho việc tổng hợp dự án.

 

Tôi cũng đã thử triển khai. Khi dùng nhiều phần cứng khác nhau, tôi có bổ sung một chút để có thể liên kết Obsidian vault với bản sao lưu GitHub. Tôi cũng đã tạo và thêm parser cho Codex và Gemini. https://github.com/hang-in/seCall

 

Nếu bạn muốn xem các LLM hiện đại chỉ là "dự đoán từ tiếp theo" thì AlphaGo cũng chẳng qua chỉ là "dự đoán nước đi tiếp theo" mà thôi.

Từ ChatGPT trở đi, việc dự đoán từ tiếp theo cũng chỉ là pre-trained đơn thuần.

Bản thân nó là một mô hình đạt được mục tiêu.

 

Nghe nói các nhà phát triển kernel đã nói với các nhà phát triển PostgreSQL suốt gần 10–20 năm rằng "spinlock ở userspace không được khuyến khích, nên mong họ cân nhắc lại"..

https://x.com/kosaki55tea/status/2040458791536497035