Hệ thống tệp dựa trên số pi với tỷ lệ nén gần 100%
(github.com)Phần thập phân của số pi, dù được viết trong hệ cơ số nào, được cho là với xác suất rất cao sẽ là một normal number, nơi mọi chữ số xuất hiện với cùng một tỷ lệ.
Nếu là normal number thì đã được chứng minh rằng nó là một disjunctive sequence, tức chứa mọi tổ hợp chữ số có thể có.
Nói cách khác, mọi chương trình máy tính được biểu diễn ở dạng nhị phân đều tồn tại ở đâu đó trong phần thập phân của số pi. Chỉ cần tìm ra vị trí trong phần thập phân của số pi là có thể lưu trữ và khôi phục mọi thông tin.
Nghe nói để lưu một tệp văn bản 400 dòng thì mất khoảng 5 phút, nhưng tác giả bảo rằng cứ tin vào định luật Moore là được... vậy đó.
12 bình luận
Ví dụ, nếu có dữ liệu như 01010 thì tôi hiểu là trong số pi sẽ có một vị trí khớp với 01010. Vì vậy có vẻ như chỉ cần lưu thông tin vị trí thôi..
Gần đây tôi đang xem bộ phim Silicon Valley, trong đó có nói về một Internet mới sử dụng thuật toán nén. Nếu công nghệ phát triển đến mức hệ thống tệp số pi với tỷ lệ nén gần 100% có thể được ứng dụng thực tế, liệu một Internet mới như vậy có thật sự xuất hiện không?
Có thể xem số pi đóng vai trò như một dictionary chung có thể truy cập từ bất kỳ đâu.
Có ai có thể giải thích đơn giản hơn một chút được không? Tôi chưa hiểu rõ việc số pi là một normal number thì liên quan gì đến chuyện khi lưu tệp có tỷ lệ nén 100%.
Normal number nghĩa là, ví dụ khi biểu diễn số pi ở hệ cơ số 5, nếu viết ra đến 1000 chữ số sau dấu thập phân thì các số 0,1,2,3,4 mỗi số sẽ xuất hiện với số lượng gần 200, đúng không?
Tôi vẫn chưa thể hiểu xa hơn từ chỗ đó huhu.
Theo những gì tôi hiểu thì là như sau.
Nếu là một normal number thì đã được chứng minh rằng mọi tổ hợp chữ số có thể có đều xuất hiện ít nhất một lần. Những số nhị phân như 0110001... cũng sẽ đều nằm ở đâu đó trong phần thập phân của số pi. Nếu chỉ cần nhớ vị trí của phần thập phân đó, thì có thể khôi phục tệp mà không cần lưu trực tiếp tệp đó trên thiết bị lưu trữ. Vì giá trị của số pi là một hằng số toán học, nên không cần lưu nó trên thiết bị lưu trữ; thay vào đó có thể tính giá trị số pi mỗi khi cần và sử dụng.
Tôi hiểu rồi. Thật sự cảm ơn bạn!
Nếu tồn tại một thiết bị lưu trữ có thể lưu số pi mà không có sai số, thì ngay từ đầu đã chẳng cần phải nén...
Có vẻ như họ không lưu giá trị của số pi vào thiết bị lưu trữ rồi dùng, mà tính giá trị của số pi mỗi lần cần đến. Vì vậy nên có lẽ họ gọi đây là mức nén 100%.
Tôi tra định nghĩa về tỷ lệ nén trên Wikipedia[1] thì thấy có vẻ không phải cách tính mà mọi người thường nghĩ.
Tôi từng viết một bài về việc này từ khá lâu rồi[2]. Cũng lâu thật nhỉ. haha
[1] https://en.wikipedia.org/wiki/Data_compression_ratio
[2] https://wp.me/pPGG8-41E
Tôi cũng mới biết lần đầu rằng định nghĩa của tỷ lệ nén là dung lượng trước khi nén / dung lượng sau khi nén. Thấy trên GitHub ghi là 100% compression nên chắc là tôi đã hiểu nhầm..
Khái niệm về số nguyên tố bất hợp pháp (Illegal prime) cũng làm tôi nhớ tới điều này haha
https://wp.me/pPGG8-3sT
Câu chuyện này thú vị thật đấy lolololol, giờ là thời đại của pi bất hợp pháp rồi sao...
Nén nội dung bất hợp pháp bằng cái đó
Báo vị trí của giá trị pi ở đâu đó mà cái đó sẽ cho ra
Bất hợp pháp!
Thuật toán tính toán từ một chữ số thập phân cụ thể thay vì từ chữ số đầu tiên được gọi là thuật toán spigot; trong trường hợp của pifs, người ta cho biết nó sử dụng công thức Bailey-Borwein-Plouffe để tính các chữ số của số pi.
https://ko.wikipedia.org/wiki/algorithm_spigot