Tôi bắt đầu làm việc với vai trò lập trình viên ở trung tâm điện toán của quân đội vào năm 2007, và khi đó tôi được dạy rằng "lập trình viên phải hiểu đầy đủ domain, sau đó tinh chỉnh yêu cầu của người dùng và đề xuất phương án tối ưu".
Dạo này có vẻ xu hướng chủ đạo là "cứ làm đúng theo những gì người dùng yêu cầu". Thật ra biết đâu chính người dùng cũng thích như vậy hơn..?
Thực ra thứ cần cho RAG là chức năng tìm kiếm, còn việc tạo embedding bằng dense vector, đẩy vào vectorDB rồi tìm kiếm theo độ tương đồng cosine chỉ là một trong nhiều cách để triển khai công cụ tìm kiếm mà thôi... Không phải là không có lý do để dùng vectorDB, nhưng nếu hỏi có thực sự bắt buộc không thì tôi cũng hơi nghiêng đầu thắc mắc, vì đã có rất nhiều thuật toán công cụ tìm kiếm được dùng rất tốt từ lâu rồi.
LLM thì chỉ nên dừng lại ở lời nói thôi. Ngay khoảnh khắc trao cho nó phương tiện và cách thức tác động vật lý, tác dụng phụ sẽ vượt xa sức tưởng tượng. Làm ơn cứ chỉ nói trong máy tính thôi. Đừng đụng vào gì cả.
Tôi đồng ý với ý kiến bên dưới rằng 'thực tế là không có quyền lựa chọn'.
Nó đã là một chuyến tàu đang lao rất nhanh và cũng là một chiếc máy bay đang bay rồi
Thì ra việc ngay cả khi biên dịch kernel bằng toàn bộ lõi mà desktop vẫn nhanh nhạy là nhờ tối ưu hóa scheduler. Mac cũng như vậy, không biết có được tối ưu theo cách tương tự không nhỉ? Dù sao thì tôi vẫn đang dùng rất ổn.
Vì rẻ và hầu hết các LLM production đều dùng mà.
Thật ra web server cũng vậy thôi, nếu thêm các chức năng hạ tầng thì mọi thứ đều có thể làm hết từ đĩa, nên cũng chẳng cần DBMS đâu nhỉ haha
(Đang làm SI trong lĩnh vực tài chính) Tôi hỏi nhiều lập trình viên rằng, nếu bạn là chuyên gia thì thay vì chỉ làm đúng theo những gì khách hàng yêu cầu, việc nói với khách hàng rằng họ nên làm việc theo cách này thì sao.
> Kết quả thì đúng như mọi người có thể tưởng tượng.
Đúng là cần một cơ sở dữ liệu cho kiểu tìm kiếm tương đồng/ngữ nghĩa, trong đó khóa là giá trị embedding (vector) của truy vấn người dùng. Vì khóa có dạng vector nên gọi là vector DB cũng đúng.
Thật ra dạo này ngay cả khi không có bản phân phối chuyên biệt thì game vẫn chạy tốt một cách đơn giản.
Mình đang chơi ARC Raiders trong môi trường Arch + Wayland. Chỉ cần cài driver GPU và gói steam là chạy ổn, hầu như không cần cấu hình gì thêm.
Tất nhiên là những game có anti-cheat ở cấp độ kernel thì không chạy được, nhưng đó cũng là vấn đề không thể làm gì khác được.
Thì ra là câu chuyện về một server buồn! Đây thực sự là một nền tảng rất tuyệt.
Phát hành Ghostty 1.0 - trình giả lập terminal tốc độ cao, đa nền tảng
libghostty sắp ra mắt
Tình hình trình giả lập terminal năm 2025: những nhà vô địch lang bạt
https://algorithmsbook.com/optimization/#download
Có vẻ bây giờ liên kết đã thay đổi một chút, và bạn có thể xem hoặc tải xuống file PDF từ đây.
Tương lai có lẽ cũng sẽ xuất hiện những trường hợp robot AI ngớ ngẩn vô tình giết người vì sai sót...
Có vẻ như chính bạn là tác giả, nên bài viết mang tính PR thì bạn nên đăng ở Show GN.
Bạn có thể đăng tại đây: https://news.hada.io/show
Tôi bắt đầu làm việc với vai trò lập trình viên ở trung tâm điện toán của quân đội vào năm 2007, và khi đó tôi được dạy rằng "lập trình viên phải hiểu đầy đủ domain, sau đó tinh chỉnh yêu cầu của người dùng và đề xuất phương án tối ưu".
Dạo này có vẻ xu hướng chủ đạo là "cứ làm đúng theo những gì người dùng yêu cầu". Thật ra biết đâu chính người dùng cũng thích như vậy hơn..?
2022-09-04 Show GN: J40: Bộ giải mã JPEG XL
2022-11-02 Google Chrome dự kiến sẽ ngừng hỗ trợ JPEG-XL từ phiên bản 110
2023-07-22 JPEG XL: Khởi đầu và tình hình hiện tại
2024-04-05 Jpegli - Thư viện mã hóa JPEG mới do Google tạo ra
2024-09-21 Vì sao Apple dùng JPEG XL trên iPhone 16 và tác động của nó đến ảnh chụp
Thực ra thứ cần cho RAG là chức năng tìm kiếm, còn việc tạo embedding bằng dense vector, đẩy vào vectorDB rồi tìm kiếm theo độ tương đồng cosine chỉ là một trong nhiều cách để triển khai công cụ tìm kiếm mà thôi... Không phải là không có lý do để dùng vectorDB, nhưng nếu hỏi có thực sự bắt buộc không thì tôi cũng hơi nghiêng đầu thắc mắc, vì đã có rất nhiều thuật toán công cụ tìm kiếm được dùng rất tốt từ lâu rồi.
LLM thì chỉ nên dừng lại ở lời nói thôi. Ngay khoảnh khắc trao cho nó phương tiện và cách thức tác động vật lý, tác dụng phụ sẽ vượt xa sức tưởng tượng. Làm ơn cứ chỉ nói trong máy tính thôi. Đừng đụng vào gì cả.
Thú vị đấy.
Tôi đồng ý với ý kiến bên dưới rằng 'thực tế là không có quyền lựa chọn'.
Nó đã là một chuyến tàu đang lao rất nhanh và cũng là một chiếc máy bay đang bay rồi
Cảm ơn bạn đã chia sẻ bài viết giá trị.
Wow, có cả dev Ssuk ở đây nữa
Thì ra việc ngay cả khi biên dịch kernel bằng toàn bộ lõi mà desktop vẫn nhanh nhạy là nhờ tối ưu hóa scheduler. Mac cũng như vậy, không biết có được tối ưu theo cách tương tự không nhỉ? Dù sao thì tôi vẫn đang dùng rất ổn.
Vì rẻ và hầu hết các LLM production đều dùng mà.
Thật ra web server cũng vậy thôi, nếu thêm các chức năng hạ tầng thì mọi thứ đều có thể làm hết từ đĩa, nên cũng chẳng cần DBMS đâu nhỉ haha
(Đang làm SI trong lĩnh vực tài chính) Tôi hỏi nhiều lập trình viên rằng, nếu bạn là chuyên gia thì thay vì chỉ làm đúng theo những gì khách hàng yêu cầu, việc nói với khách hàng rằng họ nên làm việc theo cách này thì sao.
> Kết quả thì đúng như mọi người có thể tưởng tượng.
Có vẻ như người ta dùng thứ này trong các bài đăng chia sẻ mẹo lập trình.
Đúng là cần một cơ sở dữ liệu cho kiểu tìm kiếm tương đồng/ngữ nghĩa, trong đó khóa là giá trị embedding (vector) của truy vấn người dùng. Vì khóa có dạng vector nên gọi là vector DB cũng đúng.
Thật ra dạo này ngay cả khi không có bản phân phối chuyên biệt thì game vẫn chạy tốt một cách đơn giản.
Mình đang chơi ARC Raiders trong môi trường Arch + Wayland. Chỉ cần cài driver GPU và gói
steamlà chạy ổn, hầu như không cần cấu hình gì thêm.Tất nhiên là những game có anti-cheat ở cấp độ kernel thì không chạy được, nhưng đó cũng là vấn đề không thể làm gì khác được.
Một file GIF 36MB bị nhét thẳng vào README.md luôn nhỉ... á trời.