Bình luận mới nhất

ku9cu 17 ngày trước | bình luận cha | trong: Một khác biệt duy nhất của những người thật sự làm được điều mình muốn là khả năng đánh giá mức độ liên quan đến bản thân (blog.archcalendar.com)

À, tôi cứ tưởng đây là tin tức hay thông tin gì đó nên đã đọc, nhưng thấy nội dung hơi kỳ nên đã bình luận hỏi có phải quảng cáo không. Cảm ơn vì phản hồi nghiêm túc của bạn.

kaydash 17 ngày trước | bình luận cha | trong: Awesome Design.MD - Áp dụng design system của các website nổi tiếng cho site của bạn (github.com/VoltAgent)

Hay đấy. Những người làm frontend và thiết kế thường chuẩn bị sẵn mấy thứ như thế này rồi mới bắt đầu.

brainer 17 ngày trước | bình luận cha | trong: Nếu bạn đang khổ sở vì Claude Blue (kciter.so)

"Tỷ lệ thắng" mới là cốt lõi.
Chỉ với việc dự đoán từ tiếp theo thì đừng nói là tạo ra câu văn dùng được, ngay cả lập trình hay toán học cũng không thể làm cho ra hồn.
Những kỹ thuật kiểu này đã xuất hiện từ thập niên 60~70 rồi.

(Nói chính xác thì cũng không hẳn là từ)

rlaaudgjs5638 17 ngày trước | bình luận cha | trong: Nếu bạn đang khổ sở vì Claude Blue (kciter.so)

Có vẻ cũng là như vậy.
Tuy nhiên, bản thân mô hình rốt cuộc cũng chỉ là một hàm đầu vào/đầu ra mà thôi.
Với giả định có một harness phù hợp và một agent loop được cung cấp, thì có vẻ có thể nói rằng mô hình đạt được mục tiêu.

kciter1 17 ngày trước | bình luận cha | trong: Nếu bạn đang khổ sở vì Claude Blue (kciter.so)

Trong nguyên tác không hề khẳng định rằng AI có thể thay thế toàn bộ tính chuyên môn. Bản thân tôi cũng không nghĩ như vậy...

xguru 17 ngày trước | bình luận cha | trong: Một khác biệt duy nhất của những người thật sự làm được điều mình muốn là khả năng đánh giá mức độ liên quan đến bản thân (blog.archcalendar.com)

Tôi là quản trị viên.
GeekNews hướng tới việc chia sẻ tin tức và thông tin dưới nhiều hình thức khác nhau, đồng thời cũng cho phép các bài viết do người dùng tự tổng hợp trong một phạm vi nhất định.
Tuy nhiên, nếu cùng một người dùng liên tục đăng bài từ một tên miền cụ thể thì sẽ bị áp dụng hạn chế theo tiêu chí.
Trường hợp này cũng đang được xem xét và điều chỉnh theo tiêu chí đó.
Một số biện pháp có thể sẽ không hiển thị từ bên ngoài.

h0422ys 17 ngày trước | bình luận cha | trong: Nếu bạn đang khổ sở vì Claude Blue (kciter.so)

gpt 3: dự đoán từ tiếp theo -> đúng
gpt 3 trở về sau, các mô hình dựa trên Transformer: dự đoán từ tiếp theo -> đúng.
AlphaGo, AlphaZero, MuZero, ...: dự đoán nước đi tiếp theo -> đúng.
Mô hình đạt được mục tiêu (cụ thể) -> đúng.

Trong nội dung đang nói thì không có gì sai cả

savvykang 17 ngày trước | bình luận cha | trong: Nếu bạn đang khổ sở vì Claude Blue (kciter.so)

Chẳng phải toàn bộ tính chuyên môn đều không thể bị thay thế sao? Ngay từ quá trình tạo từ đã thấy kỳ lạ rồi.

cafedead 17 ngày trước | bình luận cha | trong: Nếu bạn đang khổ sở vì Claude Blue (kciter.so)

Thật rối quá. Đây là một câu đùa thôi, hay là đã có một kỹ thuật hoặc công nghệ mới nào đó mà tôi chưa biết vậy??

cafedead 17 ngày trước | bình luận cha | trong: Nếu bạn đang khổ sở vì Claude Blue (kciter.so)

Chẳng phải cả AlphaGo cũng dự đoán nước đi tiếp theo được tính là có tỷ lệ thắng cao nhất sao?????

blacksocks 17 ngày trước | bình luận cha | trong: Nếu bạn đang khổ sở vì Claude Blue (kciter.so)

"Dự đoán token tiếp theo" là cách mô tả chính xác ở cấp độ triển khai, nhưng có thể tóm lại rằng nó không đầy đủ nếu dùng để giải thích năng lực hay mục đích của mô hình, đúng không?

ng0301 17 ngày trước | bình luận cha | trong: Nếu bạn đang khổ sở vì Claude Blue (kciter.so)

Vậy thì có lẽ cứ gặp nhau ở một mô hình dự đoán tốt hơn ở giữa là được 😄

kciter1 17 ngày trước | bình luận cha | trong: Nếu bạn đang khổ sở vì Claude Blue (kciter.so)

Ừm.. tôi đang nghĩ có lẽ bài viết đã được truyền đạt khác với ý định của tôi. Nếu từ bài viết này bạn cảm thấy như tôi đang hạ thấp giá trị kỹ thuật của LLM thì tôi xin lỗi.

Tuy vậy, ý định của bài viết này là gỡ bỏ lớp bao bọc cường điệu và sự thần bí hóa để nhìn nhận một cách lạnh lùng. Vì vậy, cá nhân tôi cảm thấy cách diễn đạt là "mô hình đạt được mục tiêu" mang tính thần bí hóa. Suy cho cùng, dù là phần mềm thông thường hay mô hình thì cũng đều nhằm đạt được một "mục tiêu" nào đó.

Vì vậy, tôi muốn hỏi lại, cùng với sự tò mò cá nhân, liệu cách diễn đạt mà bạn nói có chính xác hơn về mặt kỹ thuật hay không.

kurthong 17 ngày trước | bình luận cha | trong: Một khác biệt duy nhất của những người thật sự làm được điều mình muốn là khả năng đánh giá mức độ liên quan đến bản thân (blog.archcalendar.com)

Có vẻ như cuối cùng vẫn chỉ là quảng cáo cho Analytics. Nghe cũng có lý đấy, nhưng rốt cuộc vẫn là quảng cáo, và cũng cảm giác như quản trị viên hada.io đang để mặc quá mức.

kurthong 17 ngày trước | bình luận cha | trong: rtk - proxy CLI giúp giảm 60~90% lượng token tiêu thụ của LLM (github.com/rtk-ai)

Suy cho cùng đây là sự đánh đổi với chất lượng, và tôi cũng lo rằng liệu rồi nó có trở thành một cấu trúc phải dùng thêm token để khôi phục phần chất lượng đã mất hay không

kurthong 17 ngày trước | bình luận cha | trong: LLM-Wiki - Xây dựng kho lưu trữ tri thức cá nhân bằng LLM (gist.github.com/karpathy)

Vì bm25 yếu trong việc tìm kiếm tiếng Hàn nên tôi cũng đã áp dụng thêm guardrail có thể tìm kiếm tiếng Hàn tốt.

kurthong 17 ngày trước | bình luận cha | trong: LLM-Wiki - Xây dựng kho lưu trữ tri thức cá nhân bằng LLM (gist.github.com/karpathy)

Ở góc độ bức tranh lớn thì đây là việc tìm kiếm các cuộc trò chuyện trong quá khứ, nên nếu chỉ sắp xếp tốt vấn đề tổ chức là sẽ là một ý tưởng hay. Thực tế tôi cũng thấy nó đã giúp ích rất nhiều cho việc tổng hợp dự án.

kurthong 17 ngày trước | bình luận cha | trong: LLM-Wiki - Xây dựng kho lưu trữ tri thức cá nhân bằng LLM (gist.github.com/karpathy)

Tôi cũng đã thử triển khai. Khi dùng nhiều phần cứng khác nhau, tôi có bổ sung một chút để có thể liên kết Obsidian vault với bản sao lưu GitHub. Tôi cũng đã tạo và thêm parser cho Codex và Gemini. https://github.com/hang-in/seCall

brainer 17 ngày trước | bình luận cha | trong: Nếu bạn đang khổ sở vì Claude Blue (kciter.so)

Nếu bạn muốn xem các LLM hiện đại chỉ là "dự đoán từ tiếp theo" thì AlphaGo cũng chẳng qua chỉ là "dự đoán nước đi tiếp theo" mà thôi.

Từ ChatGPT trở đi, việc dự đoán từ tiếp theo cũng chỉ là pre-trained đơn thuần.

Bản thân nó là một mô hình đạt được mục tiêu.

unstabler 17 ngày trước | bình luận cha | trong: Kỹ sư AWS báo cáo hiệu năng PostgreSQL trên Linux 7.0 giảm còn một nửa – có thể không dễ khắc phục (phoronix.com/news)

Nghe nói các nhà phát triển kernel đã nói với các nhà phát triển PostgreSQL suốt gần 10–20 năm rằng "spinlock ở userspace không được khuyến khích, nên mong họ cân nhắc lại"..

https://x.com/kosaki55tea/status/2040458791536497035

Tải thêm bình luận