1 điểm bởi GN⁺ 2024-02-06 | 1 bình luận | Chia sẻ qua WhatsApp

Giải thưởng lớn Vesuvius Challenge 2023: Đọc thành công cuộn giấy đầu tiên

  • Các cuộn giấy cói Herculaneum bị chôn vùi bởi vụ phun trào núi lửa cách đây 2.000 năm đã được phát hiện.
  • Những cuộn giấy này đã bị than hóa nên không thể mở ra mà không làm hư hại nếu không có kỹ thuật đặc biệt.
  • Vào ngày 15 tháng 3 năm 2023, Nat Friedman, Daniel Gross và Brent Seales đã khởi động Vesuvius Challenge.
  • Họ công bố các bản quét CT độ phân giải cao và treo giải thưởng hơn 1 triệu USD.
  • Cộng đồng trên toàn thế giới đã bắt tay giải bài toán bằng thị giác máy tính và máy học.
  • Đến tháng 12 năm 2023, dù 95% cuộn giấy vẫn còn chưa được đọc, người ta đã có thể đọc được một phần của cuộn giấy lần đầu tiên sau 2.000 năm.

Giải thưởng lớn

  • Hạng mục giải thưởng lớn của Vesuvius Challenge đã nhận được nhiều bài dự thi xuất sắc.
  • Ban giám khảo đã đánh giá các bài dự thi trong suốt tháng 1.
  • Đội của Youssef Nader, Luke Farritor và Julian Schilliger đã được chọn là bên chiến thắng giải thưởng lớn.
  • Nhóm này đã độc lập phục hồi được lượng văn bản nhiều nhất.
  • Mã nguồn và phương pháp được nộp đã được đội ngũ kỹ thuật kiểm chứng và tái lập.
  • Giải thưởng là 700.000 USD.

Các á quân

  • Mỗi á quân nhận được 50.000 USD.
  • Họ đã đề xuất những cách tiếp cận mới về các sắc thái tinh vi trong gán nhãn mực và lấy mẫu.

Cuộn giấy nói gì?

  • Đã thành công trong việc mở và đọc khoảng 5% của cuộn giấy đầu tiên.
  • Cuộn giấy này không phải là bản sao của các tác phẩm đã biết, mà chứa một văn bản cổ đại.
  • Nội dung văn bản bàn về khoái lạc và bao gồm thảo luận triết học về niềm vui từ thức ăn và âm nhạc.

Độ chính xác của hình ảnh ra sao?

  • Nhiều biện pháp đã được áp dụng để ngăn mô hình máy học bị "ảo giác".
  • Chúng bao gồm tái lập kỹ thuật, nhiều bài dự thi khác nhau trên cùng một vùng, và sử dụng các cửa sổ đầu vào/đầu ra nhỏ.

Làm thế nào để mở cuộn giấy?

  • Mở cuộn giấy ảo gồm ba bước: quét, phân đoạn và phát hiện mực.
  • Các bản quét 3D được tạo ra bằng chụp cắt lớp tia X tại Diamond Light Source.
  • Phân đoạn là quá trình nhận diện và mở các lớp trong cuộn giấy phức tạp.
  • Phát hiện mực sử dụng mô hình máy học để xác định các vùng có mực trên phần đã được mở.

Cần những gì?

  • Vesuvius Challenge hy vọng giải được bài toán đọc các cuộn giấy cói Herculaneum và truyền cảm hứng cho các dự án tương tự.
  • Việc đặt mục tiêu rõ ràng, có điểm khởi đầu vững chắc, kết hợp giữa cạnh tranh và hợp tác, thuê đội phân đoạn nội bộ, và tối đa hóa bề mặt cho các đột phá là rất quan trọng.

Tiếp theo là gì? Công bố giải thưởng lớn Vesuvius Challenge 2024.

  • Mục tiêu của năm 2024 là đi từ việc đọc 5% của một cuộn giấy lên 90% của bốn cuộn giấy.
  • Giải thưởng lớn 2024 sẽ được trao cho đội đầu tiên đạt được điều đó.
  • Tự động hóa quá trình phân đoạn là mục tiêu chính.

Lời cảm ơn

  • Xin cảm ơn tất cả những người đã đóng góp cho dự án, các nhà tài trợ, đội ngũ tổ chức, đối tác, học giả, nhân viên hỗ trợ và những người chiến thắng giải thưởng lớn.

GN⁺ ý kiến:

  • Dự án này là một bước tiến quan trọng khi kết hợp phục dựng số các tài liệu cổ với máy học để mang lại hiểu biết mới về lịch sử nhân loại.
  • Vesuvius Challenge có thể được xem là một điển hình trong việc thúc đẩy nghiên cứu đổi mới tại giao điểm giữa công nghệ và nhân văn.
  • Những nỗ lực như vậy có thể phục hồi tri thức văn hóa và triết học đã bị lãng quên hàng nghìn năm, từ đó mang lại góc nhìn mới cho xã hội hiện đại.

1 bình luận

 
GN⁺ 2024-02-06
Ý kiến trên Hacker News
  • Tóm tắt bình luận đầu tiên:

    • Bị cuốn hút bởi kỹ thuật mở cuộn bản thảo bằng phương pháp số, cách nhận diện các vết nứt trên giấy như tín hiệu của mực, và quá trình ghép nối từng mảnh để tạo ra mô hình phát hiện chúng.
    • Cảm thấy bối rối về việc dùng TimeSFormer. Vốn nghĩ nó dành cho video, nên thắc mắc họ đã áp dụng nó cho hình ảnh như thế nào.
    • Đây là một ngày tuyệt vời cho khảo cổ học, và xin dành tràng pháo tay lớn cho những bộ óc trẻ đã đạt được thành tựu này.
  • Tóm tắt bình luận thứ hai:

    • Ngạc nhiên trước việc dự án trông như bất khả thi và sự thông minh của những người tham gia.
    • Ban đầu nghĩ sẽ mất 5-10 năm, nhưng giờ bày tỏ sự kinh ngạc và chúc mừng trước thành quả đạt được.
  • Tóm tắt bình luận thứ ba:

    • Công nghệ phát triển đến mức đáng kinh ngạc, gần như không thể phân biệt với phép thuật.
    • Bày tỏ sự tò mò về việc công nghệ máy học là phát hiện gần đây hay đã tồn tại từ lâu, và cách các thuật toán này được áp dụng cho những vấn đề mới khi chúng trở nên phổ biến.
  • Tóm tắt bình luận thứ tư:

    • Đây là điều tuyệt vời nhất từng đọc trong năm nay; việc có thể đọc văn bản từ một cuộn bản thảo bị than hóa 2.000 năm tuổi nghe như khoa học viễn tưởng.
  • Tóm tắt bình luận thứ năm:

    • Việc tách các cuộn bản thảo đã quét bằng thủ công và chi phí quét các cuộn mới là những nút thắt lớn nhất để đọc thêm nhiều văn bản hơn.
  • Tóm tắt bình luận thứ sáu:

    • Một trong những khía cạnh hấp dẫn của khảo cổ học là thực hành cố ý không khai quật một số hiện vật để dành cho công nghệ tương lai.
    • Những người phát hiện ban đầu từng cố gắng mở các cuộn bản thảo nhưng nhận ra điều đó là bất khả thi, nên đã để nguyên phần còn lại.
  • Tóm tắt bình luận thứ bảy:

    • Thật đáng kinh ngạc khi mô hình ban đầu được huấn luyện trên card đồ họa 1070.
  • Tóm tắt bình luận thứ tám:

    • Rất phấn khích trước khả năng bộ sưu tập các cuộn bản thảo này có thể chứa những câu chuyện đã thất lạc.
  • Tóm tắt bình luận thứ chín:

    • Philodemus đã viết trong một biệt thự bị chôn vùi dưới dung nham núi lửa Vesuvius, và 2.000 năm sau chúng ta dùng công nghệ tiên tiến để tái dựng các tác phẩm của ông.
    • Vì ông là một người của tư tưởng, nên rất muốn cho ông biết rằng giờ đây chúng ta có thể đọc được những gì ông đã viết.
  • Tóm tắt liên kết liên quan:

    • Cung cấp liên kết đến bài viết về sinh viên khoa học máy tính đã phát hiện từ đầu tiên trong các cuộn Herculaneum và liên kết thảo luận về Vesuvius Challenge.