Bình luận mới nhất

tsboard 2025-07-15 | bình luận cha | trong: Có thể xây dựng máy chủ LLM tự lưu trữ cho 300 người dùng không? (reddit.com)

Bản thân tôi cũng vì nhu cầu mà đang làm một giải pháp RAG, dùng tới 4 GPU H100 vốn hiếm có, nhưng nếu tính không chỉ chi phí đầu tư phần cứng trực tiếp mà cả tiền điện, chi phí cho các giải pháp làm mát khác các kiểu thì tôi cứ thấy gọi API vẫn tốt hơn rất nhiều.

Lúc đầu tôi cũng bắt đầu thử với Ollama, rồi xác nhận là ngay cả 3 người dùng đồng thời cũng không gánh nổi nên chuyển ngay sang vLLM và xoay xở đủ kiểu để dựng cấu hình RAG. Nhưng riêng chỗ này thôi (giả định 10 người dùng đồng thời) đã gần như phải dùng gần hết 2 GPU H100. Các tác vụ embedding hay tìm kiếm tôi cũng mở bằng vLLM để dùng, nên 4 chiếc H100 thật sự vẫn rất chật vật. Dù VRAM mỗi card khoảng 90GB cũng vẫn là như vậy.

Tất nhiên là tôi cũng không rành AI lắm, chỉ là vừa làm theo nhu cầu của bộ phận vừa cố gắng đáp ứng qua lại các quy định bảo mật nội bộ nên cứ thế làm liều thôi... nhưng tôi cũng băn khoăn không biết như vậy có đúng không. Hình như là ChatGPT Enterprise ấy nhỉ? Tôi thật sự thấy mức giá của nó quá hời.

eususu 2025-07-15 | bình luận cha | trong: AI đang làm chậm các nhà phát triển mã nguồn mở. Peter Naur có thể giải thích vì sao (johnwhiles.com)

Tôi cũng từng có suy nghĩ tương tự nhưng khó diễn đạt cho rõ.
"Mô hình tinh thần" đúng là một cách đặt tên phù hợp. Tôi sẽ cố gắng dùng nó thường xuyên hơn.

odlwlkiime 2025-07-15 | bình luận cha | trong: Đo lường “tác động của AI” đến năng suất của các lập trình viên mã nguồn mở giàu kinh nghiệm (metr.org)

150 đô một giờ à? Ngay từ đó thì việc kiểm soát biến đã buồn cười rồi ha ha ha ha

shalome7 2025-07-15 | bình luận cha | trong: Chúc mừng sinh nhật lần thứ 20 của Django (djangoproject.com)

Tôi thực sự rất thích Django! Bản thân tôi cũng mang ơn nó ở nhiều khía cạnh và luôn cảm thấy biết ơn. Dù Django có phần kém phổ biến hơn trước, nhưng thật ra tôi cũng không nghĩ đã từng có thời điểm nào Django đặc biệt “hot”; tôi tin đây sẽ tiếp tục là một framework ổn định, được yêu mến bền bỉ và tồn tại thật lâu dài!

cnaa97 2025-07-15 | bình luận cha | trong: Vì sao Lua tốt hơn MicroPython đối với lập trình viên nhúng (embedded.com)

Ngay từ đầu, các nhà sản xuất linh kiện làm ra thiết bị vốn đã không hỗ trợ tốt cả Lua lẫn Python. Cùng lắm là mức C?

sinbumu 2025-07-15 | bình luận cha | trong: Mâu thuẫn của YouTube: kiếm tiền từ AI rồi lại truy quét AI (itworld.co.kr)

Người viết bài đó chắc bấm cái một làm ra shorts hàng loạt rồi bị khóa à lol

ryj0902 2025-07-15 | bình luận cha | trong: Chúc mừng sinh nhật lần thứ 20 của Django (djangoproject.com)

Tôi vẫn dùng khá tốt cho việc phát triển web như một sở thích

bichi 2025-07-15 | bình luận cha | trong: Sự khác biệt giữa hàm thông thường và hàm mũi tên trong JavaScript, khi nào nên dùng cú pháp nào (jrsinclair.com)

const a = (a: () =&gt; null): (() =&gt; () =&gt; null) =&gt;() =&gt; a

xguru 2025-07-15 | bình luận cha | trong: AI đang làm chậm các nhà phát triển mã nguồn mở. Peter Naur có thể giải thích vì sao (johnwhiles.com)

Đo lường "tác động của AI" lên năng suất của các nhà phát triển mã nguồn mở giàu kinh nghiệm

bichi 2025-07-15 | bình luận cha | trong: Sự khác biệt giữa hàm thông thường và hàm mũi tên trong JavaScript, khi nào nên dùng cú pháp nào (jrsinclair.com)

() => ❤️

quintuplets2000 2025-07-15 | bình luận cha | trong: Claude Squad - Công cụ quản lý không gian làm việc terminal đa tác tử AI viết mã (github.com/smtg-ai)

Đúng cái tôi đang cần và cũng đang định tự làm, vậy mà họ đã làm ra nó rồi... Tôi dùng Claude Code Max, và đây là phần mềm tôi thực sự cần khi phát triển nhiều dự án cùng lúc.

kmn1120 2025-07-15 | bình luận cha | trong: Chúc mừng sinh nhật lần thứ 20 của Django (djangoproject.com)

Chúc mừng sinh nhật Django!

baeba 2025-07-15 | bình luận cha | trong: Lược sử ngắn gọn của JavaScript (deno.com)

Bản dịch tiếng Hàn như dưới đây.
https://roy-jung.github.io/250701-history-of-js/

idunno 2025-07-15 | bình luận cha | trong: Upstage ra mắt Solar Pro 2, mô hình suy luận cấp frontier (upstage.ai)

Giá mà bài viết cho thấy bằng các con số mức độ cải thiện lớn, sự vượt trội và độ chính xác thì sẽ tốt hơn.

yangeok 2025-07-15 | bình luận cha | trong: Chiến lược gọi vốn mới của startup: "Seed-Strapping" (tanayj.com)

Không biết Hàn Quốc sẽ khác thế nào nhỉ

rikko 2025-07-15 | bình luận cha | trong: Vì sao nên phân phối công cụ dưới dạng nhị phân tĩnh độc lập (ashishb.net)

Tôi cũng khá đồng cảm với vấn đề lãng phí dung lượng ổ đĩa...
Tôi vận hành AKS nên mỗi lần nhìn thấy app Python với image container vượt quá 1GB là lại đau đầu.
Giờ thì tôi cứ lấy Dockerfile về rồi tự tối ưu lại dung lượng và đẩy lên, nếu không giảm xuống dưới 500MB được thì đành bỏ cuộc luôn haha

tujuc 2025-07-15 | bình luận cha | trong: Chúc mừng sinh nhật lần thứ 20 của Django (djangoproject.com)

Wow...! Lần đầu tôi dùng nó là trong một dự án chọn vì nó là Python...
Đã trôi qua một khoảng thời gian dài rồi nhỉ!
Mong là mình lại có thể làm việc trong một môi trường có dịp sử dụng nó :) hhh
Hay là làm thử một dự án side nhỉ...

sanxiyn 2025-07-15 | bình luận cha | trong: Upstage ra mắt Solar Pro 2, mô hình suy luận cấp frontier (upstage.ai)

So sánh với Claude 3 vào thời điểm Claude 4 đã ra mắt thì chẳng phải gần như là lừa đảo sao...

hi098123 2025-07-15 | bình luận cha | trong: Sự cố 1.1.1.1 khiến DNS không phản hồi (cloudflarestatus.com)

Theo giờ Hàn Quốc, từ khoảng 7:00 đã bị gián đoạn chừng 50 phút, nhưng giờ thì hoạt động bình thường rồi.
CMD> nslookup news.hada.io 1.1.1.1

cocofather 2025-07-15 | bình luận cha | trong: Sự cố 1.1.1.1 khiến DNS không phản hồi (cloudflarestatus.com)

Tôi cũng liên tục nhận được thông báo đẩy trên Android nói rằng không thể truy cập máy chủ DNS.
Tạm thời tôi chuyển sang dùng Google DNS.
https://developers.google.com/speed/public-dns/…

Tải thêm bình luận