Vụ rò rỉ tài liệu nội bộ lớn nhất lịch sử Vạn lý Tường lửa Trung Quốc (GFW): phân tích liên quan đến Geedge và MESA
(gfw.report)- Đã xảy ra vụ rò rỉ hơn 500GB gồm tài liệu nội bộ, mã nguồn, nhật ký công việc của Vạn lý Tường lửa Trung Quốc (GFW)
- Dữ liệu bị rò rỉ được cho là bắt nguồn từ Geedge Networks và MESA Lab, bao gồm các công nghệ kiểm duyệt và giám sát liên quan đến Trung Quốc và nhiều quốc gia khác
- Nhiều loại tệp với tổng dung lượng hơn 600GB đã được công khai, cần đặc biệt lưu ý an ninh khi truy cập và phân tích
- Geedge và MESA Lab là các tổ chức nòng cốt về nghiên cứu và phát triển của GFW, đồng thời phụ trách xuất khẩu công nghệ cho các cơ quan Trung Quốc và các quốc gia thuộc sáng kiến Vành đai và Con đường
- Cho đến nay, phân tích chi tiết mã nguồn vẫn chưa được thực hiện, và các kết quả phân tích bổ sung sẽ tiếp tục được cung cấp qua GFW Report và các kênh khác
1. Giới thiệu
- Vào ngày 11 tháng 9 năm 2025, vụ rò rỉ tài liệu nội bộ lớn nhất trong lịch sử Vạn lý Tường lửa Trung Quốc (GFW) đã xảy ra
- Vụ rò rỉ lần này bao gồm một lượng dữ liệu rất lớn như hơn 500GB mã nguồn, nhật ký công việc và hồ sơ liên lạc nội bộ
- Nguồn gốc của dữ liệu rò rỉ được xác định là Geedge Networks (nhà khoa học chủ chốt Fang Binxing) và MESA Lab (Viện Nghiên cứu Kỹ thuật Thông tin thuộc Viện Hàn lâm Khoa học Trung Quốc), hai nhóm công nghệ cốt lõi của GFW
- Theo tài liệu, các tổ chức này không chỉ hoạt động tại các khu vực của Trung Quốc như Tân Cương, Giang Tô và Phúc Kiến, mà còn xuất khẩu công nghệ kiểm duyệt và giám sát sang Myanmar, Pakistan, Ethiopia, Kazakhstan và các quốc gia khác thông qua các khuôn khổ như Vành đai và Con đường
- Do quy mô dữ liệu và mức độ ảnh hưởng là rất lớn, các phân tích và cập nhật sẽ tiếp tục được thực hiện trên GFW Report và Net4People
2. Liên kết tải xuống
- Có thể truy cập khoảng 600GB tệp bị rò rỉ qua trang Enlace Hacktivista (torrent và tải trực tiếp qua HTTPS)
- Chỉ riêng tệp lưu trữ
mirror/repo.tarđã chiếm 500GB, đồng thời trang cũng cung cấp danh sách đầy đủ các tệp và thông tin dung lượng
- Chỉ riêng tệp lưu trữ
- Hướng dẫn chi tiết liên quan đến việc sử dụng các tệp đã được David Fifield giải thích trên Net4People (GitHub)
3. Lưu ý bảo mật
- Cần nhấn mạnh rằng dữ liệu bị rò rỉ có tính chất rất nhạy cảm, do đó việc tải xuống và phân tích đòi hỏi một môi trường an toàn vận hành phù hợp
- Vì các tệp có thể chứa yếu tố rủi ro tiềm ẩn (giám sát hoặc mã độc), nên khuyến nghị phân tích trong môi trường cô lập như máy ảo không kết nối Internet
4. Bối cảnh
- Vạn lý Tường lửa (GFW) là tên gọi chung của hệ thống kiểm duyệt Internet, vận hành theo cấu trúc trong đó các cơ quan và doanh nghiệp phân chia vai trò và phối hợp với nhau theo nhiều loại hợp đồng khác nhau
- Nguồn gốc của vụ rò rỉ lần này là Geedge Networks và MESA Lab, các tổ chức nòng cốt về nghiên cứu và phát triển (R&D) của GFW
- MESA Lab trực thuộc Viện Nghiên cứu Kỹ thuật Thông tin của Viện Hàn lâm Khoa học Trung Quốc, và được phát triển từ NELIST (từ năm 2008~) do Fang Binxing dẫn dắt
- Theo lịch sử phát triển của MESA Lab, nhóm được đặt tên chính thức là MESA vào năm 2012, đã thực hiện các dự án an ninh mạng quan trọng, nhận các giải thưởng trong chương trình nhân tài, triển khai các dự án kỹ thuật quy mô lớn, tuyển dụng thêm nhà nghiên cứu và giành nhiều giải thưởng khoa học công nghệ cấp quốc gia
- Năm 2018, Geedge Networks được thành lập, với các thành viên nòng cốt là nhân sự xuất thân từ Viện Hàn lâm Khoa học Trung Quốc và các trường đại học lớn
5. Phân tích các tệp ngoài mã nguồn
- Trong số các tệp bị rò rỉ, các tài liệu không phải mã nguồn đã được nhiều nhóm chuyên môn phân tích chi tiết
- David Fifield hiện đang tổng hợp các bài đưa tin liên quan và phân tích kỹ thuật
- Tuy vậy, việc phân tích các tệp mã nguồn vẫn chưa hoàn tất
6. Phân tích các tệp mã nguồn
- Phần mã nguồn hiện vẫn chưa được phân tích một cách có hệ thống
- Vì vụ rò rỉ lần này quan trọng và có tác động lớn, nội dung phân tích sẽ tiếp tục được cập nhật trên trang hiện tại và các nơi như Net4People
- Các nội dung như phân tích, câu hỏi, ý kiến và tài liệu bổ sung sẽ được thu thập và hướng dẫn công khai hoặc riêng tư thông qua GFW Report
Tham khảo
- Báo cáo này ban đầu được đăng trên GFW Report, và tình trạng phân tích cùng các tài liệu sẽ tiếp tục được chia sẻ trên Net4People và các kênh khác
8 bình luận
Các tập đoàn độc tài khổng lồ cấu kết để giám sát hàng trăm triệu người... nghe như một câu chuyện SF kinh dị, nhưng thật đáng sợ khi đó lại là điều đang diễn ra trong thế giới thực
Vụ Edward Snowden vẫn còn rất rõ trong ký ức mà, chuyện độc tài các kiểu… chẳng lẽ ở đây tôi cũng phải đọc những bình luận như thế này sao, chẳng lẽ là người ủng hộ số 2? Làm ơn đừng chỉ ngồi viết code trong phòng nữa, hãy đi đây đi đó để nhìn thế giới đi ~
Bỏ qua chuyện chính trị sang một bên, rốt cuộc bạn muốn nói gì vậy?
Tôi hoàn toàn không hiểu được mạch câu và ngữ cảnh.
Không thấy nói gì về Hàn Quốc ở đâu cả, nên tôi không hiểu vì sao đột nhiên lại lôi chuyện chính trị Hàn Quốc ra.
Xin hãy rời khỏi trang này. Bạn kiểu đầu óc chính trị như vậy không cần thiết cho cộng đồng này.
Chỉ nghe những gì bạn nói thôi cũng thấy bạn có vẻ là người đã sống quá lâu trong thế giới Internet và không thể giao tiếp tử tế ngoài đời thực.
Đừng chỉ ngồi trong phòng viết mấy bình luận kiểu này nữa, hãy đi đây đi đó ngoài xã hội và sống bằng cách giao lưu với "người thật".
Mã nguồn Big Brother bị rò rỉ!
Ý kiến trên Hacker News
Có một số phân tích và thảo luận thú vị ở đây
Trong số những khách hàng đầu tiên của Geedge kể từ khi thành lập năm 2018 có chính phủ Kazakhstan, và công ty đã bán sản phẩm chủ lực của mình là Tiangou Secure Gateway (TSG)
Giải pháp này giám sát và lọc toàn bộ lưu lượng web tương tự Great Firewall của Trung Quốc, đồng thời kiểm soát cả các nỗ lực vượt chặn
Công cụ tương tự cũng đã được triển khai tại Ethiopia và Myanmar để thực thi lệnh cấm VPN một cách hiệu quả. Geedge đã hợp tác với các nhà mạng địa phương (Safaricom, Frontiir, Ooredoo v.v.) để xây dựng các hệ thống kiểm duyệt cấp quốc gia
Từ vụ rò rỉ tài liệu nội bộ, quá trình nhân viên Geedge đảo ngược các công cụ VPN chủ chốt để tìm cách chặn đã bị phơi bày. Cụ thể, họ nói rằng đã “giải quyết” được 9 VPN thương mại, và áp dụng nhiều kỹ thuật để phát hiện và chặn lưu lượng của chúng
Ở Trung Quốc, phần lớn VPN thương mại hiện không thể truy cập, và các công cụ chống kiểm duyệt chủ chốt cũng rất khó tiếp cận
Tài liệu bị rò rỉ còn bao gồm cả thông tin chụp bắt email dạng văn bản thuần
Có suy đoán rằng xu hướng chặn VPN gần đây của Nga cũng sẽ dùng công nghệ kiểu này
Khi thấy nhắc tới việc chụp bắt email dạng văn bản thuần, có người nghĩ rằng các nước phương Tây chắc chắn cũng không thể không làm điều tương tự
Nhấn mạnh rằng khi chính phủ triển khai các cơ chế kiểm soát kỹ thuật lên chính công dân của mình, năng lực kiềm chế chính phủ mà người dân từng có sẽ biến mất
Kiểm duyệt quy mô lớn, giám sát và xâm phạm quyền riêng tư là điều không thể dung hòa với phẩm giá con người
Lập luận vị lợi cho việc kiểm duyệt trực tuyến nhân danh “lợi ích công” như chống khủng bố, bảo vệ trẻ em chỉ nhìn vào hiệu ứng bậc một và bỏ qua các tác động xa hơn
Một khi đã nếm vị ngọt của kiểm duyệt, chính phủ sẽ không bao giờ đậy lại cái chai đó nữa
Rốt cuộc, việc chặn không chỉ dừng ở nội dung nguy hiểm hay gây khó chịu, mà kiểm duyệt sẽ tùy tiện mở rộng để phục vụ lợi ích của những kẻ muốn giữ quyền lực
Mong rằng vụ rò rỉ liên quan tới Great Firewall lần này sẽ giúp các nhà nghiên cứu và nhà hoạt động tìm ra những cách mới để chống lại kiểm duyệt
Có một lời chỉ ra ngắn gọn rằng bạn đang hiểu sai chiến trường từ gốc
Lấy ví dụ việc thanh niên Nepal hồi đầu tháng này đã trực tiếp đốt nhà và đuổi các nghị sĩ để phản ứng với đợt chặn mạng xã hội quy mô lớn của chính phủ, và nói rằng thật ra đã từng có lúc cái “chai” đó được đậy lại
Nhắc lại trường hợp Đức và cảnh báo về sự lạc quan rằng vụ rò rỉ GFW sẽ hữu ích
Khiến người ta tự hỏi kiểu người thất bại đến mức nào mới quyết định dùng tài năng của mình để tạo ra những công cụ như thế này
Chia sẻ kinh nghiệm từng sống ở một quốc gia dùng GFW trước đây
Trước khi v2ray xuất hiện, việc dùng một giao thức tùy ý thường hay vượt chặn thành công
Nếu biến kết nối SSH thành socks5 rồi bọc bằng ROT13 hoặc mã hóa ROTn tùy ý, có thể tránh được hiện tượng tường lửa giảm tốc độ dần sau vài KB
OpenSSH để lộ tên và phiên bản của nó dưới dạng văn bản thuần khi kết nối nên rất dễ bị đoán
Theo thời gian tường lửa cũng trở nên chủ động hơn, bắt đầu hạ tốc độ ngay lập tức với các giao thức chưa xác định
Nếu bắt chước lưu lượng HTTP hợp lệ, chẳng hạn giả vờ tải tệp favicon.ico, thì có thể trao đổi an toàn chỉ phần packet chứa nội dung
Dự án Iodine cũng thử cách tương tự với packet ping nhưng tốc độ chậm hơn
Ngày nay v2ray thậm chí còn khuyến nghị ngụy trang giống lưu lượng thật nhất có thể, bao gồm cả hình dạng trang web hợp lệ, chứng chỉ v.v.
Sau khi bắt đầu kiếm được tiền, người này còn nghĩ tới việc gửi lưu lượng theo kiểu round-robin qua nhiều IP vì một IP nhất quán sẽ tạo dấu vân tay
Vì không còn sống ở quốc gia đó nữa nên chưa thử được giả thuyết này, nhưng sau khi xem mã nguồn bị rò rỉ thì nghĩ đây có thể là một dự án cuối tuần thú vị
Trong khi các bộ giải mã lưu lượng như TCP, HTTP, QUIC v.v. được ghi rõ, thì không có UDP, và điều đó không ảnh hưởng tới việc vượt chặn. Có lẽ cùng một giới hạn tốc độ theo IP đã hoạt động với UDP ở tầng thấp hơn
Bổ sung thêm từ kinh nghiệm của tôi, khi vận hành một máy chủ Outline trên cùng một IP trong 3 năm thì GFW luôn chặn IP đó sau khoảng 3 ngày
Có người muốn được giải thích thêm về ý tưởng bọc kết nối SSH bằng ROT13 hoặc ROTn để tránh bị tường lửa chặn
Tò mò không biết ai là “Snowden của Trung Quốc” đứng sau vụ rò rỉ lần này
Tôi biết lưu lượng QUIC không thể bị tấn công bằng kỹ thuật MITM, nên thấy tò mò GFW xử lý nó ra sao. Không rõ họ chặn hoàn toàn hay chỉ lọc
Không chỉ QUIC mà TLS và các kênh mã hóa khác cũng có thể được bảo vệ tương tự
Theo báo cáo https://gfw.report/publications/usenixsecurity25/en/#3, tường lửa Trung Quốc cũng sniff thông tin SNI trong bắt tay giống như với TLS để chặn
Thắc mắc tại sao QUIC lại khác HTTP1.1 hay 2 từ góc nhìn tấn công MITM
Việc lưu lượng QUIC được mã hóa không có nghĩa là nó ngăn được MITM
Thông thường người ta dựa vào metadata như IP đích, hoặc vào các đòn tấn công hạ cấp
Việc những hệ thống kiểm duyệt như thế này đang được cài đặt khắp nơi được xem là kết quả của một nỗ lực có chủ đích
Tôi chỉ cần một tường lửa đơn giản chỉ chặn quảng cáo thôi
Ban đầu tôi lo rằng các nước phương Tây như Anh sẽ bắt chước những hệ thống như vậy
Tôi không nghĩ ngay lúc này mọi người đều đang tích cực cố gắng làm theo, nhưng đó cũng không phải nỗi lo quá mức
Thực tế là chúng ta đang tiến gần hơn tới kiểu hệ thống như thế
Việc Đảng Cộng sản Trung Quốc phải huy động một hệ thống khổng lồ như vậy chỉ để ngăn người dân tiếp cận thông tin và bày tỏ ý kiến trái chiều cho thấy chế độ đó có vấn đề nghiêm trọng
May mắn là chúng ta đang sống trong những xã hội tương đối tự do
Internet đang ngày càng lép vế trước sự can thiệp và kiểm duyệt của chính phủ. Tôi cảm thấy đó không phải điều tốt
Mục tiêu của các hệ thống này không phải là chặn tận gốc mọi sự bất tuân hay mọi nhận thức, mà là làm chậm tốc độ lan truyền kiểu viral của tin đồn hay thông tin kích động
Tôi nghe podcast chính trị Anh Not Another One, trong đó có nhắc rằng chính sách chặn nội dung khiêu dâm của Anh đang được các chính trị gia nước ngoài chú ý vì mức độ kiểm soát truy cập nội dung quá mạnh
Ngay từ đầu GFW đã do Cisco làm, và phương Tây cũng đã có sẵn toàn bộ công nghệ liên quan
Thực ra gần như mọi công ty cũng đang dùng một phần các hệ thống như vậy trong nội bộ (proxy, firewall, content filter)
Đối với cách diễn giải rằng chế độ của Đảng Cộng sản Trung Quốc yếu đến mức phải chặn ý kiến của công dân, có người giải thích bằng cách ví với trường hợp OpenAI
Toàn bộ cuộc thảo luận này khiến tôi cảm thấy đầy rẫy những kẻ đóng vai luật sư của quỷ