1 điểm bởi GN⁺ 2024-02-25 | 1 bình luận | Chia sẻ qua WhatsApp

Lỗi giải nén Oodle do mất ổn định của bộ xử lý Intel

  • RAD đã nhận biết một vấn đề có thể gây lỗi giải nén Oodle Data hoặc làm game bị crash trong các trò chơi được tạo bằng Unreal Engine.
  • Vấn đề này chủ yếu ảnh hưởng đến các bộ xử lý Intel 13900K và 14900K, ảnh hưởng ít hơn đến 13700, 14700 và các bộ xử lý liên quan.
  • Chỉ một số ít trong các bộ xử lý này có biểu hiện như vậy.
  • Sự cố phát sinh do sự kết hợp giữa cài đặt BIOS với xung nhịp cao và mức tiêu thụ điện năng lớn của các bộ xử lý này, dẫn đến mất ổn định hệ thống và hành vi khó đoán dưới tải cao.

Đây không phải lỗi phần mềm mà là vấn đề phần cứng

  • Có vẻ như không có lỗi phần mềm nào trong Oodle hay Unreal gây ra vấn đề này.
  • Do cài đặt BIOS quá lạc quan, một số bộ xử lý khi chịu tải cao sẽ hoạt động vượt ngoài phạm vi chức năng, khiến xung nhịp và mức tiêu thụ điện năng dẫn đến việc thực thi lệnh sai.
  • Việc giải nén Oodle Data cần thực hiện thêm các bước kiểm tra tính toàn vẹn của dữ liệu, nên khác với các đoạn mã gameplay, mô phỏng, âm thanh hoặc kết xuất khác, nó phát hiện ra điểm không nhất quán rất nhanh.

Các kiểu lỗi thường gặp khi khởi động game dựa trên Unreal Engine

  • Kiểu lỗi phổ biến nhất là thông báo lỗi "DecompressShader(): Could not decompress shader (GetShaderCompressionFormat=Oodle)".
  • Vấn đề này không chỉ ảnh hưởng đến Oodle; các hệ thống gặp tình trạng mất ổn định này cũng cho thấy lỗi trong các chương trình benchmark và stress test tiêu chuẩn.
  • Các chương trình sử dụng bộ xử lý với cường độ cao trên nhiều luồng có thể gây crash hoặc hành vi khó đoán.

Các cách workaround để khắc phục vấn đề

  • Không thể truy cập thông tin bộ xử lý để chẩn đoán chính xác nguyên nhân và giải pháp tốt nhất.
  • Nhiều nhà sản xuất bo mạch chủ/BIOS xuất xưởng với các thiết lập đẩy bộ xử lý ra ngoài phạm vi vận hành an toàn.
  • Vì chỉ ảnh hưởng đến một số ít bộ xử lý, một số người dùng đã thành công trong việc trả lại bộ xử lý cho nhà sản xuất và nhận bộ xử lý mới không gặp vấn đề.
  • Các workaround khác yêu cầu sử dụng tiện ích tuning hoặc thay đổi cài đặt BIOS.
  • Dùng Intel XTU để giảm hệ số nhân của performance core từ x55 xuống x54 hoặc x53 được nhiều người báo cáo là giải pháp hiệu quả.

Khuyến nghị thay đổi cài đặt BIOS

  • Nếu đang bật ép xung, hãy tắt đi và tránh dùng ép xung "AI" hoặc "tự động".
  • Tra cứu giới hạn chính xác cho bộ xử lý của bạn trên ark.intel.com và đặt giới hạn điện năng cùng điện áp theo phạm vi an toàn do Intel khuyến nghị.
  • Tắt các thiết lập BIOS kiểu "turbo tăng cường" hoặc "đa luồng tăng cường" như "ASUS MultiCore Enhancement" hoặc "ASUS Performance Enhancement 3.0".

Các bước khắc phục bổ sung cho bo mạch chủ Intel, ASUS, Gigabyte, MSI

  • Cài Intel XTU và chạy bài kiểm tra AVX2.
  • Nếu bài kiểm tra AVX2 thất bại, hãy thử các thay đổi cài đặt BIOS cụ thể dành cho bo mạch chủ ASUS, Gigabyte và MSI.

Không thể hỗ trợ trực tiếp cho người dùng cuối

  • Không thể trực tiếp hỗ trợ người dùng cuối của các trò chơi bị ảnh hưởng bởi vấn đề này; khuyến nghị sử dụng các kênh hỗ trợ chính thức của nhà phát hành game, nhà sản xuất bộ xử lý và nhà sản xuất bo mạch chủ.

Ý kiến của GN⁺

  • Vấn đề này quan trọng với những người dùng đang sử dụng một số bộ xử lý Intel nhất định, và có thể cần điều chỉnh cài đặt BIOS để đảm bảo độ ổn định của hệ thống.
  • Việc thay đổi cài đặt BIOS có thể tiềm ẩn rủi ro, vì vậy người dùng cần thận trọng và nên nhận hỗ trợ chính thức.
  • Bài viết này đưa ra các biện pháp cụ thể để xử lý lỗi phần mềm bắt nguồn từ vấn đề phần cứng, cung cấp thông tin hữu ích cho những người dùng đang đối mặt với sự cố kỹ thuật.

1 bình luận

 
GN⁺ 2024-02-25
Ý kiến Hacker News
  • Chia sẻ trải nghiệm sử dụng AMD Threadripper 3970X và quá trình khắc phục sự cố liên quan. Đã phối hợp với AMD trong vài tháng để điều tra vấn đề và nhận được bồi thường từ AMD. Cuối cùng, đang vận hành hệ thống bằng một bản BIOS tùy chỉnh do AMD cung cấp. Có vẻ như vấn đề thuộc trách nhiệm của Gigabyte.
  • CPU Intel 13900k có lỗi và sự cố xảy ra khi dùng cấu hình mặc định. Hệ thống thường xuyên bị treo, khiến người dùng phải tốn rất nhiều thời gian để xử lý. Đã thay CPU và yêu cầu Intel RMA (dịch vụ trả hàng/sửa chữa bảo hành), nhưng Intel đã cố né tránh RMA với lý do hỗ trợ Linux. Sau đó, người dùng tiến hành RMA thông qua cơ quan bảo vệ người tiêu dùng ở châu Âu, mua một hệ thống mới và bán lại hệ thống cũ. Về sau không có kế hoạch mua sản phẩm Intel nữa.
  • Mỉa mai rằng để giảm nhẹ các vấn đề bảo mật thì phải tắt hyper-threading, turbo mode, C-state, efficient core, v.v., nhưng làm vậy chẳng khác nào quay lại bộ tính năng của 20 năm trước.
  • Đã lắp một hệ thống mới với CPU i9 149kf và bo mạch chủ Asus Formula, nhưng gặp khó khăn để vận hành ổn định. Với cấu hình mặc định, xuất hiện các vấn đề như game bị crash, lỗi khi biên dịch kernel và emacs. Người dùng đã ổn định hệ thống bằng cách giới hạn turbo ở 5.4GHz và bật các thiết lập giới hạn mức watt tối đa cùng nhiệt độ tối đa. Hiện hệ thống đã ổn định, nhưng vẫn bày tỏ sự tiếc nuối vì không thể tận dụng trọn vẹn hiệu năng được quảng bá.
  • Nhắc đến nội dung gợi nhớ tới bài viết kinh điển của Raymond Chen.
  • Gợi lại vấn đề từng xảy ra với CPU Pentium III 1.13 GHz trong quá khứ.
  • Trình giải nén Zstd thường là thành phần đầu tiên tương tác với dữ liệu được truyền qua mạng, nên rất nhạy với bit flip. Ngay cả khi bật kiểm tra lỗi, nó vẫn phát hiện sự cố phần cứng thường xuyên hơn các tiến trình khác. Zstd chỉ chứa checksum của dữ liệu gốc để bảo đảm tính toàn vẹn dữ liệu, nhưng điều đó khiến việc xác định dữ liệu nén có bị hỏng hay không trở nên khó khăn.
  • Có vẻ đây là một trang được tạo ra để phản hồi những lời phàn nàn ngoài ý muốn từ người dùng đang cố lần theo log lỗi "oodle". Điều này gợi nhớ đến trường hợp của SQLite năm 2006.
  • Chia sẻ trải nghiệm mua bo mạch chủ ASUS TUF. Người dùng chỉ muốn các tính năng cơ bản, nhưng BIOS lại thúc đẩy ép xung quá mức, buộc phải tự điều chỉnh thủ công nhiều thiết lập, bao gồm cả timing của RAM.
  • Bày tỏ sự ngạc nhiên trước việc Epic Games đã mua lại RAD.