- Trong quá trình cài Proxmox lên máy trạm Dell Precision T3610 cũ và thử nâng cấp CPU, đã phát sinh vấn đề nhầm lẫn về tên socket
- CPU hiện tại Xeon E5-1650 v2 được tài liệu chính thức của Intel ghi là dùng socket FCLGA2011
- Đã mua Xeon E7-8890 v4 với cùng ký hiệu socket, nhưng thực tế không thể lắp vì khóa vật lý và bố cục chân tiếp xúc khác nhau
- Kết quả tìm hiểu cho thấy socket LGA2011 có nhiều biến thể như Socket R (LGA2011-0), Socket R2 (LGA2011-1), nhưng tài liệu Intel lại không phân biệt mà ghi cùng một tên
- Trường hợp này cho thấy hệ thống đặt tên thiếu rõ ràng và cách quản lý tài liệu có vấn đề của Intel có thể gây nhầm lẫn cho người dùng và phát sinh chi phí không cần thiết
Thử nâng cấp máy trạm Dell
- Cài Proxmox trên Dell Precision T3610 và nâng cấp lên RAM 96GB cùng 13 ổ SSD 500GB
- Để nâng cấp CPU, tác giả tìm mẫu thay thế cho Xeon E5-1650 v2 (FCLGA2011) hiện có
- Sau khi tham khảo trang sản phẩm của Intel, tác giả chọn Xeon E7-8890 v4 (FCLGA2011) và mua trên eBay với giá khoảng 15 USD
Không thể lắp CPU và nguyên nhân
- Dù CPU mới có cùng kích thước vật lý, nó vẫn không thể lắp do có thêm tiếp điểm và cấu trúc khóa khác
- Dù tài liệu Intel đều ghi là FCLGA2011, trên thực tế hai socket này không tương thích
- Tìm hiểu thêm cho thấy LGA2011 có Socket R (LGA2011-0), Socket R2 (LGA2011-1) và cả biến thể thứ ba
- T3610 dùng Socket R
- E7-8890 v4 dùng Socket R2
- Có thể kiểm chứng thông tin này trong mục LGA2011 trên Wikipedia
Vấn đề trong hệ thống đặt tên của Intel
- Việc Intel ghi tất cả các biến thể là FCLGA2011 đã gây nhầm lẫn cho người dùng
- Do thiếu hệ thống đánh số phiên bản rõ ràng, việc xác định tương thích phần cứng trở nên khó khăn
- Việc giữ nguyên cùng một tên trong khi bố cục tiếp điểm và cấu trúc khóa thay đổi bị xem là vấn đề trong thiết kế và tài liệu hóa kém hiệu quả
Kết quả và bài học rút ra
- CPU đã mua không thể sử dụng và gần như trở thành cục chặn giấy
- Có thể trả hàng, nhưng phí vận chuyển bằng khoảng một nửa giá CPU, nên tác giả tạm hoãn
- Trong tương lai, nếu có được máy chủ dùng bo mạch chủ Socket R2, CPU này vẫn có thể được tái sử dụng
- Trải nghiệm này được xem là một bài học có được với chi phí học hỏi khá rẻ
- Qua đó nhấn mạnh rằng khi nâng cấp phần cứng, cần kiểm tra kỹ các biến thể chi tiết của tên socket
1 bình luận
Ý kiến trên Hacker News
Tôi làm trong lĩnh vực bảo mật CPU. Ở mức vi kiến trúc cũng có sự hỗn loạn y hệt
Ví dụ, nếu muốn biết một lỗ hổng nào đó ảnh hưởng đến CPU nào, các chuyên gia sẽ nói bằng tên mã như “Blizzard Creek” hay “Windy Bluff”.
Nhưng tài liệu của Intel chỉ ghi kiểu “bị ảnh hưởng nếu bit 63 của CPUID leaf 0x3aa được đặt”. Thông tin như vậy thì trước khi thực sự khởi động máy lên gần như không thể biết được.
Trong bảng thông số sản phẩm thì lại ghi “Xeon Osmiridium X36667-IA”, và ba hệ tên này chẳng liên kết gì với nhau.
AMD cũng vậy, mỗi năm số chỉ tăng thêm một, nhưng lại không khớp với phiên bản Zen.
Thành ra cuối cùng tôi đi hỏi LLM, rồi chấp nhận luôn 20% câu trả lời bị sai
Tôi chỉ muốn yêu cầu những tính năng được hỗ trợ chung trên mọi CPU phát hành trong 10 năm qua, nhưng do khác biệt giữa Intel và AMD nên điều đó gần như bất khả thi.
Tôi còn không chắc các tính năng như APIC, IOMMU, ACPI 2 có mặt trên mọi CPU hay không. Quá phiền phức
AMD cũng không ngoại lệ. Dòng Ryzen 7000 là Zen 4, nhưng một số mẫu lại là Zen 2. Có thể phân biệt bằng cách nhìn vào phần giữa của dãy số, nhưng với người tiêu dùng bình thường thì điều đó vô nghĩa
Thậm chí có lần họ còn đổi lẫn tên mã với nhau khiến toàn bộ tài liệu rối tung lên. Vì thế tôi chỉ dùng đúng số model thay vì tên mã.
Kết quả là nảy sinh tình huống buồn cười khi các quản lý chỉ biết tên mã bỗng im lặng trong cuộc trò chuyện
Chỉ là phần CPUID sâu bên trong thì vẫn rất đau đầu. Việc đặt tên thương hiệu sản phẩm của Intel từ lâu đã ở mức thảm họa
Bạn nghĩ tên gọi của Intel đã rối à? NVidia cũng chẳng kém
Quadro 6000, Quadro RTX 6000, RTX A6000, RTX 6000 Ada, RTX 6000 Workstation Edition, RTX 6000 Max-Q, RTX 6000 Server Edition…
Tên thì giống nhau nhưng là những GPU hoàn toàn khác nhau
Intel Core Ultra 7 155U và 155H có tên gần giống nhau nhưng là hai lớp CPU hoàn toàn khác nhau
Bản U là tiết kiệm điện, bản H là hiệu năng cao nên giá laptop cũng chênh đáng kể.
Nếu chỉ đơn giản tìm “155 có tốt không?” thì thông tin về bản H sẽ hiện ra, rất dễ làm người mua nhầm lẫn
U = tiết kiệm điện, H = hiệu năng cao, HX = hiệu năng kiểu desktop (đổi lại tiêu thụ điện cực nặng)
Trong cùng một series thì số lớn hơn thường tốt hơn. Ví dụ: 275HX và 285HX gần như giống hệt nhau
Hồi trước tôi từng gắn thử một con Xeon E5472 cho server vào socket LGA775 tiêu dùng bằng cách chế bằng dao và miếng dán sticker.
Cùng một vi kiến trúc nhưng tên socket lại khác. Ngược lại, cũng có trường hợp socket gần như giống nhau nhưng bị đặt tên khác đi để phân khúc thị trường một cách nhân tạo
Khi xem CPU cũ ở CEX, tôi nhận ra Intel rẻ hơn AMD rất nhiều và hiểu được lý do
AMD có tính tương thích giữa các thế hệ tốt nên giá trị đồ cũ cao hơn, còn với Intel thì nếu mainboard hỏng, nhiều khi phải thay luôn cả CPU
Khi dùng CPU thì luôn phải kiểm tra khả năng tương thích với mainboard. Không thể chỉ nhìn hình dạng socket mà kết luận được
Với bo mạch bán lẻ, có thể xem danh sách hỗ trợ trên trang của nhà sản xuất, và đôi khi cập nhật BIOS còn mở rộng thêm tương thích
LGA là cấu trúc mà chân nằm trên mainboard còn CPU có các điểm tiếp xúc phẳng, nên cái tên khá trực quan
Dạo này forum cũng chết dần và tìm kiếm thì tệ hại, nên thực tế là cứ mua thử, nếu không chạy thì trả hàng hoặc chargeback
Tôi không hiểu vì sao đa số công ty công nghệ lại đặt tên tệ đến vậy
Vì mọi người tin rằng số lớn hơn thì tốt hơn
Mẫu mới thì bán đắt, còn hàng cũ thì đặt tên na ná để xả tồn kho
Đúng là hệ thống đặt tên rất lộn xộn, nhưng khi mua CPU mới thì câu trả lời đúng vẫn là kiểm tra danh sách hỗ trợ của nhà sản xuất mainboard
Điểm tích cực hiếm hoi là nếu tên socket có phần nào giống nhau thì khả năng tương thích của tản nhiệt thường vẫn được giữ
Thời LGA2011 thực sự là một thế hệ bị nguyền rủa
DDR3, DDR3L, ECC, DDR4 bị trộn lẫn với nhau, và có những bo mạch còn gắn đồng thời cả khe DDR3 lẫn DDR4
Lỗi controller SATA, tụ điện kém chất lượng, rớt lane PCI-E và đủ thứ vấn đề khác.
Vì những lý do đó mà Intel đã mạnh tay với các đối tác làm bo mạch ép xung không chính thức
Tôi không theo dõi CPU thường xuyên, nên quá nhiều tên mã, thế hệ và tên model khiến nó trông như sự gây rối có chủ ý
Nhưng về dài hạn thì điều đó cũng chẳng có vẻ mang lại lợi ích cho doanh nghiệp. Có lẽ mỗi thế hệ lại có một đội marketing nói rằng “lần này hãy chỉnh lại hệ thống”, rồi khiến nó còn rối hơn nữa
Chỉ cần kiểu “tên thời đại – thế hệ – model – tốc độ – mã chi tiết” là đủ rồi, nhưng họ cứ thay luôn cả cách phân loại mỗi lần nên việc ánh xạ trở nên bất khả thi
Ví dụ, tôi tìm các bài review CPU trong 2 năm gần đây trên những nơi như Ars Technica rồi mới quyết định
Nhưng nếu là lập trình viên low-level như làm kernel hay firmware thì cuối cùng vẫn phải tự mình theo sát mà thôi