3 điểm bởi GN⁺ 2025-11-10 | 2 bình luận | Chia sẻ qua WhatsApp
  • Một băng UNIX V4 của Bell Labs từ năm 1973 đã được phát hiện trong kho lưu trữ của Đại học Utah, làm dấy lên khả năng khôi phục dữ liệu gốc của Unix thời kỳ đầu
  • Phiên bản này là bản Unix mà kernel và các tiện ích cốt lõi lần đầu tiên được viết bằng ngôn ngữ C, một tư liệu hiếm vì cho đến nay chưa có bản sao hoàn chỉnh nào được biết đến
  • Trên băng có nhãn viết tay “UNIX Original From Bell Labs V4”, và nét chữ được xác nhận là của cố giáo sư Jay Lepreau
  • Băng được phát hiện là bản gốc mà Martin Newell, người phát minh ra ‘Utah Teapot’, nhận từ AT&T, và hiện đang được chuẩn bị chuyển đến Bảo tàng Lịch sử Máy tính (CHM)
  • Al Kossow của CHM sẽ phụ trách công việc khôi phục, với kế hoạch đọc dữ liệu bằng thiết bị chuyển đổi tương tự-sang-số, và tư liệu này được đánh giá là nguồn quan trọng cho việc phục dựng nghiên cứu Unix thời kỳ đầu

Phát hiện băng Unix V4

  • Trong lúc dọn dẹp kho lưu trữ của khoa khoa học máy tính tại Đại học Utah, người ta đã phát hiện một cuộn băng 9 rãnh mang nhãn UNIX V4 (1973) của Bell Labs
    • Trên nhãn có dòng chữ viết tay: “UNIX Original From Bell Labs V4 (See Manual for format)”
    • Nét chữ được xác nhận là của giáo sư Jay Lepreau, người qua đời năm 2008, theo xác nhận của học trò ông là giáo sư Robert Ricci
  • Ricci đã công bố phát hiện này qua Mastodon và cho biết đây là một phiên bản được cho là không còn tồn tại bản sao hoàn chỉnh
  • Cuộn băng này dự kiến sẽ được vận chuyển trực tiếp tới Bảo tàng Lịch sử Máy tính (Computer History Museum, CHM)

Ý nghĩa lịch sử của Unix V4

  • UNIX V4 là phiên bản mà kernel và một số tiện ích cốt lõi lần đầu tiên được viết lại bằng ngôn ngữ C, đánh dấu một bước ngoặt quan trọng trong lịch sử phát triển của Unix
  • Cho đến nay, những gì còn sót lại chỉ gồm một phần mã nguồn kernel của các phiên bản trước, một vài trang man, cùng với sổ tay lập trình viên xuất bản tháng 11 năm 1973
  • Vì vậy, phát hiện lần này được xem là tư liệu mở ra khả năng phục dựng hoàn chỉnh Unix thời kỳ đầu dựa trên C

Nguồn gốc cuộn băng và các nhân vật liên quan

  • Điều tra thêm cho thấy cuộn băng này là bản mà Martin Newell nhận từ AT&T
    • Newell nổi tiếng trong lĩnh vực đồ họa máy tính với tư cách người phát minh ra ‘Utah Teapot’, mô hình từng xuất hiện cả trong trình bảo vệ màn hình OpenGL của Windows NT
  • Ricci cũng tiết lộ thêm chi tiết này và nhấn mạnh rằng giá trị lịch sử của cuộn băng vì thế càng lớn hơn

Kế hoạch khôi phục và cách tiếp cận kỹ thuật

  • Thủ thư phần mềm của CHM, Al Kossow, sẽ phụ trách công việc khôi phục
    • Ông dự định gắn bộ khuếch đại đọc đầu từ, sử dụng bộ chuyển đổi tương tự-sang-số đa kênh tốc độ cao để đổ dữ liệu vào khoảng 100GB RAM, sau đó
      xử lý bằng chương trình phân tích readtape do Len Shustek viết
    • Cuộn băng là băng 9 rãnh 3M dài 1.200 feet từ thập niên 1970, được đánh giá là có khả năng khôi phục cao
  • Kossow cho biết ông đang đưa dự án này lên mức ưu tiên cao để thúc đẩy việc khôi phục

Ý nghĩa của phát hiện

  • Phát hiện lần này được xem là một cơ hội hiếm có để phục dựng quá trình tiến hóa kỹ thuật của Unix thời kỳ đầu
  • CHM và nhóm Bitsavers đang phối hợp thực hiện công việc khôi phục, thu hút sự chú ý của cộng đồng bảo tồn lịch sử máy tính và mã nguồn mở
  • The Register bày tỏ kỳ vọng vào thành công của dự án khôi phục, nhận định rằng tư liệu quý giá này “không thể được giao vào tay ai tốt hơn”

2 bình luận

 
click 2025-11-10

Băng từ đúng là có độ bền bảo quản rất tốt.

 
GN⁺ 2025-11-10
Ý kiến trên Hacker News
  • Nội dung băng có một danh sách việc cần làm đơn giản
    Ví dụ như làm cho việc thoát Emacs dễ hơn, đổi tên thư mục tạm; những tên cũ như bin hay dev gây cảm giác hơi buồn cười vì dễ gây nhầm nghĩa

    • Tôi lại thích chính sự mơ hồ của bin và dev
      Unix có nhiều lối chơi chữ như cat, man, more/less. Chỉ có etc là hơi thấy kỳ
  • Thật đáng tiếc khi ngành máy tính gần như lãng quên quá khứ
    Người ta phục dựng và nghiên cứu vũ khí cổ hay các thí nghiệm của Galileo, nhưng thành tựu của các hacker thập niên 60~70 lại đang bị quên lãng. Trong môi trường đầy hạn chế của thời đó hẳn có rất nhiều điều để học

    • Ngành điện ảnh cũng tương tự. Gần như không có hệ thống bảo tồn nào nên nhiều phim kinh điển đã bị cháy hoặc thất lạc
      Có cả trường hợp một bộ phim câm huyền thoại của Mỹ được tình cờ tìm thấy trong một thư viện ở Tây Ban Nha rồi mới được phục chế. Có vẻ nghệ sĩ và doanh nghiệp chỉ tập trung vào hiện tại, không xem tác phẩm quá khứ như lịch sử
    • Tôi có ý kiến ngược lại. Mối quan tâm với retro computing và demo scene vẫn rất lớn
      Những dự án như giải mã máy arcade thập niên 90 hay phục dựng game cổ đến từng bit vẫn đang diễn ra rất sôi nổi
    • Thực ra lĩnh vực nào cũng vậy. Phần lớn quá khứ chỉ được bảo tồn một cách tình cờ mà thôi
      Ngay cả kim tự tháp hay cổ vật thời xưa, nếu không có ràng buộc về chi phí hay không gian thì có lẽ cũng đã biến mất hết
    • Ngành máy tính vẫn còn quá trẻ
      Những thứ mà các nhà khảo cổ xử lý là hiện vật từ hàng trăm, hàng nghìn năm trước. Vài thế kỷ nữa, những phát minh như Unix cũng sẽ được công nhận giá trị lịch sử
    • Tôi lại có thêm một ý kiến phản đối nữa. Hiện đã có rất nhiều người bỏ ra nỗ lực khổng lồ để bảo tồn lịch sử điện toán
  • Tôi có một đầu đọc/ghi CCT 9 rãnh có thể đọc băng từ năm 1982 trở đi
    Tôi khá ngạc nhiên khi băng năm 1973 đã là 9 rãnh, nhưng sau khi làm sạch đầu từ bằng một dung dịch tẩy rửa nay đã bị cấm, toàn bộ dữ liệu đều được khôi phục hoàn hảo. Đó là các băng của nhiều hệ thống khác nhau, bao gồm cả minicomputer của DEC

    • Việc chuyển sang 9 rãnh diễn ra vào năm 1964, khi IBM 360 đưa vào byte 8 bit
    • Tôi tò mò “dung dịch tẩy rửa bị cấm” đó là gì. Tại sao nó bị cấm, và bạn có định công bố dữ liệu đã khôi phục cho mục đích khảo cổ học số hay không cũng khiến tôi tò mò
  • Đây thực sự là một phát hiện đáng kinh ngạc. Nếu có thể mô phỏng Unix v4 từ mã nguồn này để biên dịch và chạy thì sẽ rất tuyệt

    • SIMH mô phỏng nhiều máy mini/micro đời đầu, bao gồm cả PDP-11
      Trên mailing list TUHS, người ta cũng từng phục dựng và chạy mã nguồn Unix phiên bản năm 1972
      Xem kho GitHub liên quan
    • Nếu trong các phiên bản đầu tiên này có giấu spyware hoặc mã quảng cáo thì chắc sẽ gây sốc thật sự
    • Cũng có người hỏi rằng: “Bạn định làm gì với nó?”
  • Chuỗi thảo luận gốc nằm ở bài đăng trên discuss.systems

    • Bài đăng đó, các bình luận tiếp theo, và cả phần thảo luận trên TUHS cũng đã được liên kết trong bài báo
  • Hồi đại học tôi từng lưu dự án compiler của mình trên băng thép UNIVAC UNISERVO II
    Nó có cấu trúc 8 rãnh (6 bit dữ liệu, 1 bit parity, 1 bit clock), và giờ có lẽ không còn ổ nào đọc được nữa. Dù vậy, về mặt vật lý thì có lẽ nó vẫn còn nguyên vẹn

    • Nhưng ngay khi cố đọc nó thì sẽ có nguy cơ bị hỏng
  • Phát hiện thật hay. Chuyện này giống với giai đoạn các băng từ của chương trình thám hiểm Mặt Trăng từng bị thất lạc. Nếu tìm thêm một chút, có lẽ sẽ còn thấy nhiều thứ nữa

  • Phòng thí nghiệm băng từ IBM Tucson từng khôi phục dữ liệu băng của tàu Challenger
    Tôi nghĩ băng 52 năm tuổi cũng hoàn toàn có thể được khôi phục

  • “Ồ, đây là bài báo của tôi. Cảm ơn Ricardo!”

  • Nếu là bản SIMH-classic thì chắc chắn chạy được
    Hãy quên bản v4 đã thương mại hóa đi, dùng bản mở sẽ tốt hơn