- Một băng UNIX V4 của Bell Labs từ năm 1973 đã được phát hiện trong kho lưu trữ của Đại học Utah, làm dấy lên khả năng khôi phục dữ liệu gốc của Unix thời kỳ đầu
- Phiên bản này là bản Unix mà kernel và các tiện ích cốt lõi lần đầu tiên được viết bằng ngôn ngữ C, một tư liệu hiếm vì cho đến nay chưa có bản sao hoàn chỉnh nào được biết đến
- Trên băng có nhãn viết tay “UNIX Original From Bell Labs V4”, và nét chữ được xác nhận là của cố giáo sư Jay Lepreau
- Băng được phát hiện là bản gốc mà Martin Newell, người phát minh ra ‘Utah Teapot’, nhận từ AT&T, và hiện đang được chuẩn bị chuyển đến Bảo tàng Lịch sử Máy tính (CHM)
- Al Kossow của CHM sẽ phụ trách công việc khôi phục, với kế hoạch đọc dữ liệu bằng thiết bị chuyển đổi tương tự-sang-số, và tư liệu này được đánh giá là nguồn quan trọng cho việc phục dựng nghiên cứu Unix thời kỳ đầu
Phát hiện băng Unix V4
- Trong lúc dọn dẹp kho lưu trữ của khoa khoa học máy tính tại Đại học Utah, người ta đã phát hiện một cuộn băng 9 rãnh mang nhãn UNIX V4 (1973) của Bell Labs
- Trên nhãn có dòng chữ viết tay: “UNIX Original From Bell Labs V4 (See Manual for format)”
- Nét chữ được xác nhận là của giáo sư Jay Lepreau, người qua đời năm 2008, theo xác nhận của học trò ông là giáo sư Robert Ricci
- Ricci đã công bố phát hiện này qua Mastodon và cho biết đây là một phiên bản được cho là không còn tồn tại bản sao hoàn chỉnh
- Cuộn băng này dự kiến sẽ được vận chuyển trực tiếp tới Bảo tàng Lịch sử Máy tính (Computer History Museum, CHM)
Ý nghĩa lịch sử của Unix V4
- UNIX V4 là phiên bản mà kernel và một số tiện ích cốt lõi lần đầu tiên được viết lại bằng ngôn ngữ C, đánh dấu một bước ngoặt quan trọng trong lịch sử phát triển của Unix
- Cho đến nay, những gì còn sót lại chỉ gồm một phần mã nguồn kernel của các phiên bản trước, một vài trang
man, cùng với sổ tay lập trình viên xuất bản tháng 11 năm 1973
- Vì vậy, phát hiện lần này được xem là tư liệu mở ra khả năng phục dựng hoàn chỉnh Unix thời kỳ đầu dựa trên C
Nguồn gốc cuộn băng và các nhân vật liên quan
- Điều tra thêm cho thấy cuộn băng này là bản mà Martin Newell nhận từ AT&T
- Newell nổi tiếng trong lĩnh vực đồ họa máy tính với tư cách người phát minh ra ‘Utah Teapot’, mô hình từng xuất hiện cả trong trình bảo vệ màn hình OpenGL của Windows NT
- Ricci cũng tiết lộ thêm chi tiết này và nhấn mạnh rằng giá trị lịch sử của cuộn băng vì thế càng lớn hơn
Kế hoạch khôi phục và cách tiếp cận kỹ thuật
- Thủ thư phần mềm của CHM, Al Kossow, sẽ phụ trách công việc khôi phục
- Ông dự định gắn bộ khuếch đại đọc đầu từ, sử dụng bộ chuyển đổi tương tự-sang-số đa kênh tốc độ cao để đổ dữ liệu vào khoảng 100GB RAM, sau đó
xử lý bằng chương trình phân tích readtape do Len Shustek viết
- Cuộn băng là băng 9 rãnh 3M dài 1.200 feet từ thập niên 1970, được đánh giá là có khả năng khôi phục cao
- Kossow cho biết ông đang đưa dự án này lên mức ưu tiên cao để thúc đẩy việc khôi phục
Ý nghĩa của phát hiện
- Phát hiện lần này được xem là một cơ hội hiếm có để phục dựng quá trình tiến hóa kỹ thuật của Unix thời kỳ đầu
- CHM và nhóm Bitsavers đang phối hợp thực hiện công việc khôi phục, thu hút sự chú ý của cộng đồng bảo tồn lịch sử máy tính và mã nguồn mở
- The Register bày tỏ kỳ vọng vào thành công của dự án khôi phục, nhận định rằng tư liệu quý giá này “không thể được giao vào tay ai tốt hơn”
2 bình luận
Băng từ đúng là có độ bền bảo quản rất tốt.
Ý kiến trên Hacker News
Nội dung băng có một danh sách việc cần làm đơn giản
Ví dụ như làm cho việc thoát Emacs dễ hơn, đổi tên thư mục tạm; những tên cũ như bin hay dev gây cảm giác hơi buồn cười vì dễ gây nhầm nghĩa
Unix có nhiều lối chơi chữ như cat, man, more/less. Chỉ có etc là hơi thấy kỳ
Thật đáng tiếc khi ngành máy tính gần như lãng quên quá khứ
Người ta phục dựng và nghiên cứu vũ khí cổ hay các thí nghiệm của Galileo, nhưng thành tựu của các hacker thập niên 60~70 lại đang bị quên lãng. Trong môi trường đầy hạn chế của thời đó hẳn có rất nhiều điều để học
Có cả trường hợp một bộ phim câm huyền thoại của Mỹ được tình cờ tìm thấy trong một thư viện ở Tây Ban Nha rồi mới được phục chế. Có vẻ nghệ sĩ và doanh nghiệp chỉ tập trung vào hiện tại, không xem tác phẩm quá khứ như lịch sử
Những dự án như giải mã máy arcade thập niên 90 hay phục dựng game cổ đến từng bit vẫn đang diễn ra rất sôi nổi
Ngay cả kim tự tháp hay cổ vật thời xưa, nếu không có ràng buộc về chi phí hay không gian thì có lẽ cũng đã biến mất hết
Những thứ mà các nhà khảo cổ xử lý là hiện vật từ hàng trăm, hàng nghìn năm trước. Vài thế kỷ nữa, những phát minh như Unix cũng sẽ được công nhận giá trị lịch sử
Tôi có một đầu đọc/ghi CCT 9 rãnh có thể đọc băng từ năm 1982 trở đi
Tôi khá ngạc nhiên khi băng năm 1973 đã là 9 rãnh, nhưng sau khi làm sạch đầu từ bằng một dung dịch tẩy rửa nay đã bị cấm, toàn bộ dữ liệu đều được khôi phục hoàn hảo. Đó là các băng của nhiều hệ thống khác nhau, bao gồm cả minicomputer của DEC
Đây thực sự là một phát hiện đáng kinh ngạc. Nếu có thể mô phỏng Unix v4 từ mã nguồn này để biên dịch và chạy thì sẽ rất tuyệt
Trên mailing list TUHS, người ta cũng từng phục dựng và chạy mã nguồn Unix phiên bản năm 1972
Xem kho GitHub liên quan
Chuỗi thảo luận gốc nằm ở bài đăng trên discuss.systems
Hồi đại học tôi từng lưu dự án compiler của mình trên băng thép UNIVAC UNISERVO II
Nó có cấu trúc 8 rãnh (6 bit dữ liệu, 1 bit parity, 1 bit clock), và giờ có lẽ không còn ổ nào đọc được nữa. Dù vậy, về mặt vật lý thì có lẽ nó vẫn còn nguyên vẹn
Phát hiện thật hay. Chuyện này giống với giai đoạn các băng từ của chương trình thám hiểm Mặt Trăng từng bị thất lạc. Nếu tìm thêm một chút, có lẽ sẽ còn thấy nhiều thứ nữa
Phòng thí nghiệm băng từ IBM Tucson từng khôi phục dữ liệu băng của tàu Challenger
Tôi nghĩ băng 52 năm tuổi cũng hoàn toàn có thể được khôi phục
“Ồ, đây là bài báo của tôi. Cảm ơn Ricardo!”
Nếu là bản SIMH-classic thì chắc chắn chạy được
Hãy quên bản v4 đã thương mại hóa đi, dùng bản mở sẽ tốt hơn