18 điểm bởi budlebee 2021-07-17 | 12 bình luận | Chia sẻ qua WhatsApp

Phần thập phân của số pi, dù được viết trong hệ cơ số nào, được cho là với xác suất rất cao sẽ là một normal number, nơi mọi chữ số xuất hiện với cùng một tỷ lệ.

Nếu là normal number thì đã được chứng minh rằng nó là một disjunctive sequence, tức chứa mọi tổ hợp chữ số có thể có.

Nói cách khác, mọi chương trình máy tính được biểu diễn ở dạng nhị phân đều tồn tại ở đâu đó trong phần thập phân của số pi. Chỉ cần tìm ra vị trí trong phần thập phân của số pi là có thể lưu trữ và khôi phục mọi thông tin.

Nghe nói để lưu một tệp văn bản 400 dòng thì mất khoảng 5 phút, nhưng tác giả bảo rằng cứ tin vào định luật Moore là được... vậy đó.

12 bình luận

 
hoochimong 2021-07-26

Ví dụ, nếu có dữ liệu như 01010 thì tôi hiểu là trong số pi sẽ có một vị trí khớp với 01010. Vì vậy có vẻ như chỉ cần lưu thông tin vị trí thôi..

Gần đây tôi đang xem bộ phim Silicon Valley, trong đó có nói về một Internet mới sử dụng thuật toán nén. Nếu công nghệ phát triển đến mức hệ thống tệp số pi với tỷ lệ nén gần 100% có thể được ứng dụng thực tế, liệu một Internet mới như vậy có thật sự xuất hiện không?

 
ehlegeth 2021-07-19

Có thể xem số pi đóng vai trò như một dictionary chung có thể truy cập từ bất kỳ đâu.

 
roxie 2021-07-18

Có ai có thể giải thích đơn giản hơn một chút được không? Tôi chưa hiểu rõ việc số pi là một normal number thì liên quan gì đến chuyện khi lưu tệp có tỷ lệ nén 100%.

Normal number nghĩa là, ví dụ khi biểu diễn số pi ở hệ cơ số 5, nếu viết ra đến 1000 chữ số sau dấu thập phân thì các số 0,1,2,3,4 mỗi số sẽ xuất hiện với số lượng gần 200, đúng không?

Tôi vẫn chưa thể hiểu xa hơn từ chỗ đó huhu.

 
budlebee 2021-07-18

Theo những gì tôi hiểu thì là như sau.

Nếu là một normal number thì đã được chứng minh rằng mọi tổ hợp chữ số có thể có đều xuất hiện ít nhất một lần. Những số nhị phân như 0110001... cũng sẽ đều nằm ở đâu đó trong phần thập phân của số pi. Nếu chỉ cần nhớ vị trí của phần thập phân đó, thì có thể khôi phục tệp mà không cần lưu trực tiếp tệp đó trên thiết bị lưu trữ. Vì giá trị của số pi là một hằng số toán học, nên không cần lưu nó trên thiết bị lưu trữ; thay vào đó có thể tính giá trị số pi mỗi khi cần và sử dụng.

 
roxie 2021-07-19

Đã được chứng minh rằng mọi tổ hợp chữ số có thể có đều xuất hiện ít nhất một lần

Tôi hiểu rồi. Thật sự cảm ơn bạn!

 
dbeat999 2021-07-17

Nếu tồn tại một thiết bị lưu trữ có thể lưu số pi mà không có sai số, thì ngay từ đầu đã chẳng cần phải nén...

 
budlebee 2021-07-18

Có vẻ như họ không lưu giá trị của số pi vào thiết bị lưu trữ rồi dùng, mà tính giá trị của số pi mỗi lần cần đến. Vì vậy nên có lẽ họ gọi đây là mức nén 100%.

 
zariski 2021-07-17

Tôi tra định nghĩa về tỷ lệ nén trên Wikipedia[1] thì thấy có vẻ không phải cách tính mà mọi người thường nghĩ.

Tôi từng viết một bài về việc này từ khá lâu rồi[2]. Cũng lâu thật nhỉ. haha

[1] https://en.wikipedia.org/wiki/Data_compression_ratio

[2] https://wp.me/pPGG8-41E

 
budlebee 2021-07-17

Tôi cũng mới biết lần đầu rằng định nghĩa của tỷ lệ nén là dung lượng trước khi nén / dung lượng sau khi nén. Thấy trên GitHub ghi là 100% compression nên chắc là tôi đã hiểu nhầm..

 
kunggom 2021-07-17

Khái niệm về số nguyên tố bất hợp pháp (Illegal prime) cũng làm tôi nhớ tới điều này haha

https://wp.me/pPGG8-3sT

 
ffdd270 2021-07-18

Câu chuyện này thú vị thật đấy lolololol, giờ là thời đại của pi bất hợp pháp rồi sao...

  1. Nén nội dung bất hợp pháp bằng cái đó

  2. Báo vị trí của giá trị pi ở đâu đó mà cái đó sẽ cho ra

  3. Bất hợp pháp!

 
budlebee 2021-07-17

Thuật toán tính toán từ một chữ số thập phân cụ thể thay vì từ chữ số đầu tiên được gọi là thuật toán spigot; trong trường hợp của pifs, người ta cho biết nó sử dụng công thức Bailey-Borwein-Plouffe để tính các chữ số của số pi.

https://ko.wikipedia.org/wiki/algorithm_spigot