2 điểm bởi GN⁺ 2025-06-12 | 1 bình luận | Chia sẻ qua WhatsApp
  • Kho lưu trữ thứ 1 tỷ đã được tạo trên GitHub
  • Đây là một cột mốc cho thấy sự tăng trưởng bùng nổ của hệ sinh thái mã nguồn mở
  • Vô số nhà phát triển và dự án sử dụng GitHub như trung tâm của cộng tác và đổi mới
  • Cần chú ý đến tốc độ tăng trưởng cho đến nay và tiềm năng phát triển công nghệ trong tương lai
  • Đây là một sự kiện quan trọng phản ánh sự mở rộng và đa dạng của cộng đồng công nghệ toàn cầu

Tổng quan

  • Gần đây, sự kiện kho lưu trữ thứ 1 tỷ được tạo trên nền tảng GitHub đã diễn ra
  • Điều này tượng trưng cho sự tăng trưởng liên tục của cộng đồng nhà phát triển và sự lan rộng của văn hóa mã nguồn mở kể từ khi ra mắt vào năm 2008
  • GitHub đã trở thành công cụ cốt lõi của phát triển phần mềm, bao gồm quản lý mã nguồn, cộng tác và quản lý phiên bản
  • Khi 1 tỷ dự án và kho lưu trữ được tạo ra, không gian cho ý tưởng đổi mới và cộng tác trên toàn thế giới cũng được mở rộng
  • Cột mốc này một lần nữa cho thấy sức mạnh của phần mềm mã nguồn mở và tầm ảnh hưởng của mạng lưới nhà phát triển toàn cầu

1 bình luận

 
GN⁺ 2025-06-12
Ý kiến Hacker News
  • Chia sẻ một trải nghiệm gợi nhớ đến changeset OpenStreetMap thứ 100.000.000: tôi và một vài người từng nhắm tới cột mốc này, nhưng cuối cùng nó lại thuộc về một người chỉ đang mải mê lập bản đồ ở châu Phi mà chẳng hề bận tâm gì; nhìn lại sau thời gian trôi qua thì đây có cảm giác như một cái kết ấm lòng hơn. Người này trước đây cũng từng là ứng viên nhận giải của OSM. Vì OpenStreetMap áp dụng mọi thay đổi trực tiếp lên production theo thời gian thực, nên rất khó tạo ra những đóng góp vô nghĩa; bởi vậy các con số cột mốc thường được một người nào đó vô tình chiếm được. Tôi nghĩ cột mốc kiểu này của GitHub cũng là một thành tựu thú vị. Nếu quan tâm đến các cột mốc của OSM, khuyến nghị xem blog chính thứcbài tôi tổng hợp
  • Nhắc đến chuyện số ID kho lưu trữ GitHub có thể tăng tới mức overflow, và rằng nếu còn tạo thêm 1 tỷ kho nữa thì GitHub OpenAPI Spec cũng có thể vượt giới hạn int32; tham khảo: issue liên quan
    • Trước đây ở một công ty nơi tôi làm CTO, họ dùng số nguyên 32-bit (primary key) cho các bảng chính, mà lúc đó đã tích lũy tới 1,3 tỷ bản ghi; cứ đà này thì chỉ vài tháng nữa là có thể gặp vấn đề overflow. Tôi còn nhớ đã phải gấp rút mở rộng sang 64-bit để tránh một sự cố lớn
  • Chia sẻ vui về điểm khởi đầu của ID kho lưu trữ GitHub: kho đầu tiên có thể xem trực tiếp qua API, còn địa chỉ kho là ở đây
  • Ngạc nhiên vì việc tính tốc độ tạo kho lưu trữ trên GitHub lại quá dễ; tôi vốn nghĩ loại thông tin này thường được xem là bí mật doanh nghiệp
    • Một phép ví von hài hước rằng khi một dịch vụ như GitHub trở nên khổng lồ, họ có xu hướng thoải mái hơn với việc để lộ thông tin
    • Tò mò không biết GitHub có lý do gì để phải giấu thông tin này, và liệu dữ liệu như vậy có thể được tận dụng theo cách nào đó để gây hại cho GitHub hay không; trong khi nhiều công ty có xu hướng theo nguyên tắc chỉ công khai tối thiểu
  • Nhìn rộng hơn thì thấy tò mò thực sự có bao nhiêu kho lưu trữ tồn tại trên từng máy chủ khác nhau (bao gồm Forgejo, GitLab), và trong một số trường hợp còn tính cả Subversion, Mercurial, lẫn git; tự hỏi liệu đã từng có ai tạo ra một công cụ tìm kiếm cho các kho phân tán như vậy chưa, hoặc có thể ước tính quy mô toàn cục chỉ bằng cách tìm kiếm một từ đơn giản như 'a' hay không. Cảm giác một lợi thế của các nền tảng tập trung như GitHub là việc tìm mã nguồn mở rất dễ. Sau khi Microsoft mua lại GitHub, tôi từng nghĩ tới chuyện tự làm một công cụ tìm kiếm, nhưng bỏ cuộc vì khó quảng bá; gần đây khi đưa nhiều dự án lên codeberg thì lại thấy hứng thú trở lại, dù có lẽ ai đó đã làm rồi
  • Tò mò không biết AasishPokhrel có cố tình tạo kho để nhắm tới cột mốc kho thứ 1 tỷ hay không
    • Giải thích rằng thực ra nhắm vào kiểu này không quá khó: cứ tiếp tục tạo kho thì sớm muộn gì cũng có thể giành được đúng số đó; dĩ nhiên vì người khác cũng đang tạo cùng lúc nên cuối cùng vẫn là chuyện may rủi. Việc thử thì đơn giản nhờ API hỗ trợ, chỉ có rate limits là biến số
    • Có ghi nhận rằng hôm qua AasishPokhrel đã tạo hai kho tên là shityep, sau quãng không hoạt động từ 17/5 đến 10/6 mới lại tạo mới; tuy vậy người nói không chắc việc canh thời điểm để nhắm đúng một số cụ thể như vậy có thực sự khả thi hay không
    • Tôi biết AasishPokhrel là một sinh viên đại học ở Nepal đang học phát triển phần mềm, và thấy xúc động khi một cột mốc toàn cầu như thế này lại chạm tới tận nửa kia của Trái Đất; hy vọng dấu mốc này sẽ nổi bật trên CV của cậu ấy và dẫn tới một sự nghiệp phát triển phần mềm tốt đẹp
    • Có ý kiến rằng khả năng cậu ấy thực sự nhắm tới cột mốc này có lẽ không cao, nhưng cũng không thể nói là bất khả thi
  • Có lẽ họ đã dùng script liên tục kiểm tra những địa chỉ như https://api.github.com/repositories/999999999, rồi ngay khi số đó xuất hiện thì lập tức tạo kho; cũng có thể tạo nhiều kho rồi xóa đi, chỉ giữ lại kho có số mong muốn. Nhìn vào các kho khác được tạo hôm qua thì có vẻ yep là cái họ muốn giữ làm số milestone, còn shit có lẽ là cái tên để thừa nhận rằng đã thất bại. Cũng nhắc đến kỹ thuật canh số tương tự như trường hợp codemod D666666 của Facebook trước đây
  • Diễn đạt kho thứ 1 tỷ là thành viên của “câu lạc bộ ba dấu phẩy”
    • Nhắc đến câu đùa tiếng Tây Ban Nha “Tres commas” (ba dấu phẩy)