Mở rộng lý thuyết p-adic để xây dựng engine tăng tốc GPU cho game AAA với sự tư vấn của AI (giảm 10% mức tải trong Forza 6)
(github.com/CookingMathmatics)GitHub: https://github.com/CookingMathmatics/CarryPyramidLossless
Sách trắng nghiên cứu (Zenodo): DOI 10.5281/zenodo.20002868
Xin chào. Tôi là một nhà phát triển (và nghiên cứu toán học) trước đây từng chia sẻ trên GeekNews một sách trắng nghiên cứu về bảo mật tô-pô đa chiều và lý thuyết thông tin dựa trên động lực học carry p-adic (hệ cơ số p).
Khi đó, cách tiếp cận còn thiên nhiều về mô hình toán học và logic entropy phần cứng mang tính lý thuyết, nhưng trong quá trình nâng cấp sách trắng và tiếp tục nghiên cứu, tôi đã gặp một bước ngoặt thú vị.
Trong quá trình brainstorming kỹ thuật với AI, tôi đã nhận được lời khuyên và ý tưởng rằng:
"Nếu chiếu thuật toán động lực học carry p-adic này vào lưu lượng pixel của pipeline đồ họa thời gian thực, có thể tạo ra một công cụ tối ưu hóa tính toàn vẹn giúp giảm mạnh overhead tính toán."
Dựa trên tư vấn kiến trúc từ AI, tôi đã tập trung hơn một tuần để thiết kế DirectX 11 và HLSL Compute Shader, và cuối cùng đã hoàn tất kiểm chứng trên phần cứng thực tế trong môi trường của tựa game đua xe mới nhất Forza Horizon 6, với kết quả "chênh lệch khung hình 1~2, giảm 10% mức sử dụng GPU", nên tôi xin chia sẻ thành quả và mã nguồn mở này.
💡 Ý tưởng cốt lõi: hiện thực hóa 0-Void toán học (bỏ qua phép toán vùng chân không) - Ngay cả trong một game đua xe lao đi với tốc độ cực cao, toàn bộ màn hình cũng không thay đổi bùng nổ ở mọi frame. Núi ở xa, bầu trời, mây, hoặc các vùng UI tĩnh có mức biến thiên pixel giữa các frame cực kỳ nhỏ.
Bằng cách lọc frame buffer bằng thuật toán carry p-adic, hệ thống nhanh chóng mask các vùng tĩnh có mức thay đổi dưới ngưỡng thành '0-Void (vùng chân không tính toán)'.
Điều này kìm hãm ở cấp độ phần cứng lượng traffic vốn khiến hàng nghìn CUDA core trên GPU (RTX 3070 Ti) lặp lại các phép tính không cần thiết trên các pixel tĩnh hoặc lãng phí buffer.
🛠️ Kiến trúc tối ưu phần cứng và né Anti-cheat Để đạt được độ ổn định ở mức utility thương mại, tôi đã triển khai hạ tầng production-grade như sau.
Đường ống whitelist né Anti-cheat 100%
Tôi đã mạnh dạn loại bỏ phương thức DLL Injection rủi ro là can thiệp bộ nhớ game hoặc cưỡng ép hook các hàm DirectX.
Thay vào đó, tôi áp dụng DXGI Desktop Duplication API — cùng routine chính thức được OBS Studio hay Discord screen share sử dụng — để loại bỏ tận gốc rủi ro bị chặn bởi cơ chế bảo mật.
Đồng bộ bánh răng theo khung hình 1:1 (Frame Sync)
Nếu để vòng lặp engine nền quay không giới hạn, game frame lại có thể sụp do GPU command starvation. Tôi đã cưỡng ép độ chính xác timer của kernel Windows ở mức 1ms, rồi khớp bánh răng để compute shader (Dispatch) của chúng tôi chạy chính xác theo tín hiệu sự kiện phần cứng khi game xuất ra khung hình mới.
GPU hybrid trên laptop (nối thẳng GPU rời) và VRAM diet
Bằng cách theo dõi con trỏ card đồ họa rời thực tế quản lý màn hình đang kích hoạt cửa sổ game, tôi nối trực tiếp thiết bị theo tỷ lệ 1:1 và thiết lập cấu trúc hoán đổi con trỏ địa chỉ nội bộ VRAM không tốn chi phí sao chép dữ liệu (In-place ping-pong).
📊 Kết quả benchmark thực chiến (RTX 3070 Ti, FHD, thiết lập tối đa)
Khi ở trạng thái nguyên bản: fps cố định 60, mức sử dụng gpu 78%~80%
Khi bật tăng tốc: fps 59~60, mức sử dụng gpu 68~72%
Tôi đã build để có thể bật/tắt tính năng tăng tốc theo thời gian thực ngay trong game bằng phím tắt (Ctrl + Alt + S), và xác minh theo thời gian thực qua bảng theo dõi rằng ngay khi bật tính năng, độ mượt trên màn hình vẫn giữ nguyên 60 full frame giống hệt trạng thái nguyên bản, trong khi chỉ riêng mức tải GPU giảm mạnh. Việc một lý thuyết từng chỉ tồn tại trong sách trắng toán học được cụ thể hóa thành mã điều khiển phần cứng thông qua cộng tác với AI là một trải nghiệm vô cùng kỳ diệu.
Vì bộ khung vững chắc (Alpha Core) đã được dựng xong, tôi rất muốn lắng nghe phản hồi tối ưu hóa trên nhiều mức tần số quét màn hình khác nhau (144Hz~360Hz) hoặc trên các kiến trúc card đồ họa khác. Mã nguồn engine và các file shader đều đã được công khai trên GitHub ở trên, rất mong nhận được nhiều góp ý và phản hồi!
1 bình luận
Do không thể sửa bài nên tôi để phần bổ sung trong bình luận.
Lưu ý khi chạy (người dùng vui lòng đọc kỹ)
Engine này sử dụng API Desktop Duplication DXGI chính thức để vượt anti-cheat. Do đặc tính của cơ chế chụp hợp pháp phần dựng hình màn hình của Windows DWM (Desktop Window Manager), để hoạt động bình thường bạn cần tuân thủ các thiết lập hiển thị dưới đây.