EY Canada công bố báo cáo an ninh mạng, nhưng phần lớn trích dẫn là ảo giác

(gptzero.me)

1 điểm bởi GN⁺ 2026-06-01 | 1 bình luận | Chia sẻ qua WhatsApp

Báo cáo 44 trang về gian lận trong chương trình khách hàng thân thiết của Ernst & Young Canada bị phát hiện chứa trích dẫn bịa đặt, ghi sai nguồn, thống kê giả và văn bản do AI viết
Phần lớn URL trong bảng tài liệu tham khảo bị hỏng hoặc là giả, hơn một nửa tiêu đề không khớp với nguồn thực tế, và AI Scan đánh dấu 72% văn bản là do AI tạo ra
Nhiều nguồn từ BleepingComputer, Wired, Gartner, McKinsey, Forbes, Cisco Talos, TechCrunch được xác nhận là lỗi 404, trang thẻ, hoặc tài liệu không tồn tại
Con số 200 tỷ USD được dùng với hai nghĩa khó thể cùng đúng: toàn bộ thị trường điểm thưởng và giá trị điểm chưa sử dụng, đồng thời 2 trích dẫn làm căn cứ cũng bị phát hiện là giả mạo
Báo cáo lỗi này đã lan tới Canberra Times và hơn 60 tờ báo, còn Claude, ChatGPT và Perplexity cũng hiển thị thông tin ảo giác liên quan

Vấn đề của báo cáo Ernst & Young

Ernst & Young Canada đã phát hành báo cáo dài 44 trang Points of Attack: Uncovering Cyber Threats and Fraud in Loyalty Systems về các mối đe dọa mạng và gian lận trong hệ thống khách hàng thân thiết vào cuối năm 2025
Báo cáo này được ghi công cho 2 partner và 1 senior manager, nhưng bị phát hiện có trích dẫn bịa đặt, ghi sai nguồn, thống kê giả và văn bản do AI viết
EY Canada là tổ chức tại Canada của Ernst & Young, đơn vị cung cấp dịch vụ trị giá hàng triệu USD mỗi năm cho chính phủ Canada
Hallucination Check của GPTZero được dùng trong một pipeline tự động nhằm tìm và quét các báo cáo công khai gần đây của các công ty tư vấn lớn, cho thấy hiện tượng vibe citing đang lan rộng ngay cả trong báo cáo của các tập đoàn lớn

Cách trích dẫn và kết quả kiểm chứng

Báo cáo của EY Canada không dùng footnote hay trích dẫn học thuật thông thường mà nhắc trực tiếp nguồn trong nội dung hoặc gom nguồn vào resources table ở trang 41~43
Bảng này cung cấp tiêu đề nguồn, mô tả, URL cùng một phần tên nhà xuất bản và ngày tháng, nhưng phần lớn URL bị hỏng hoặc là giả, và hơn một nửa tiêu đề không khớp với nguồn thực tế
GPTZero định nghĩa trích dẫn ảo giác theo các tiêu chí cụ thể vì cân nhắc chi phí uy tín từ false positive, đồng thời kiểm chứng thủ công kết quả của Hallucination Check
Văn bản báo cáo bị GPTZero AI Scan đánh dấu 72% là do AI tạo ra, và các lỗi LLM như thống kê giả, ghi sai nguồn, mâu thuẫn nội bộ lặp lại nhiều lần

Các nguồn sai hoặc không chính xác tiêu biểu

Bài viết BleepingComputer về vụ xâm phạm chương trình khách hàng thân thiết của hãng hàng không
- Airline Loyalty Breach: BleepingComputer được nêu là bài viết về việc hàng triệu tài khoản khách hàng thân thiết của hãng hàng không bị xâm phạm do tấn công credential stuffing
- https://bleepingcomputer.com/news/security/… trả về lỗi 404, cho thấy bài viết ở đường dẫn này либо đã bị xóa hoặc chưa từng tồn tại ngay từ đầu
Bài viết Wired về deepfake giọng nói và bảo mật API
- AI Voice Deepfakes Targeting Call Centers được nêu là bài viết của Wired về việc kẻ tấn công lợi dụng giọng nói do AI tạo ra để khai thác quy trình dịch vụ khách hàng
- Không có bài viết Wired tương ứng tại đường dẫn https://www.wired.com/story/voice-deepfakes-ai-scams/
- Wired: API Security Gaps cũng được nêu là bài viết về lỗ hổng API trong các dịch vụ số hướng tới người tiêu dùng, nhưng https://www.wired.com/story/api-security-risks-retail/ cũng trả về lỗi 404
Báo cáo của Gartner và McKinsey
- Gartner Market Trends – Loyalty Fraud được nêu là hướng dẫn chiến lược về diễn biến của gian lận trong chương trình khách hàng thân thiết số và ví di động
- https://www.gartner.com/en/documents/4000201 chỉ chuyển về trang chính của Gartner, và không tồn tại tài liệu Gartner có tiêu đề đó
- McKinsey & Company – Loyalty Economics Report (2022) được nêu là báo cáo ước tính tổng giá trị điểm thưởng chưa sử dụng trên toàn cầu là 200 tỷ USD, nhưng báo cáo này không tồn tại
Bài viết Forbes về kinh tế điểm thưởng
- Forbes – The $200 Billion Loyalty Economy được nêu làm căn cứ để mô tả các chương trình khách hàng thân thiết là tài sản số quan trọng
- URL bị hỏng, và dù Blake Morgan từng viết cho Forbes, không có bài nào khớp với tiêu đề đó
- Tuy vậy, trong một bài viết Forbes năm 2020 có dùng cụm từ “$200 billion loyalty economy”
Cisco Talos và TechCrunch
- Cisco Talos: API Attacks on Retail được nêu là bài viết về việc lạm dụng API không an toàn trong thương mại và hệ thống khách hàng thân thiết, nhưng https://blog.talosintelligence.com/api-abuse-retail/ trả về lỗi 404
- TechCrunch: Loyalty Program Breaches được nêu là bài viết về các vụ xâm phạm chương trình khách hàng thân thiết và rò rỉ dữ liệu người dùng, nhưng https://techcrunch.com/tag/loyalty-program/ không phải bài viết cụ thể mà là trang thẻ loyalty-program

Mâu thuẫn nội bộ của thống kê 200 tỷ USD

Tuyên bố trong phần tóm tắt
- Executive Summary cho rằng quy mô thị trường điểm thưởng khách hàng thân thiết toàn cầu là 200 tỷ USD, và 30~50% trong số đó không được sử dụng
- Tuyên bố này được chống lưng bằng một trích dẫn Forbes giả
Ý nghĩa bị đổi ở trang 10
- Ở trang 10, cùng con số 200 tỷ USD lại được đổi thành ước tính cho điểm thưởng chưa sử dụng, chứ không phải tổng giá trị toàn bộ điểm trên toàn cầu
- Vì trước đó báo cáo đã nói tối đa 50% số điểm không được sử dụng, nên để cả hai tuyên bố cùng đúng thì quy mô thị trường điểm thưởng toàn cầu phải ít nhất là 400 tỷ USD
Lần theo nguồn của trích dẫn McKinsey
- Báo cáo McKinsey & Company bị bịa ở trang 43 được dùng làm căn cứ cho tuyên bố thứ hai rằng giá trị điểm chưa sử dụng trên toàn cầu là 200 tỷ USD
- Cùng một con số được dùng với hai nghĩa khó thể tương thích, và cả 2 trích dẫn dùng để chống đỡ đều bị xác nhận là giả mạo
- Trích dẫn McKinsey này có thể lần về một bài blog fintech trên Financial IT được xuất bản sớm hơn báo cáo EY 6 tháng
- Bài viết đó tuyên bố rằng “more than $200 billion in points sit idle each year” và trích dẫn trong phần nguồn một tài liệu không tồn tại là McKinsey & Company: Loyalty Economics Report (2022)
- Trích dẫn bịa này sau đó được đưa nguyên vào bảng tài liệu tham khảo của báo cáo EY, biến một nguồn giả từ blog chất lượng thấp thành nội dung được “rửa” qua ấn phẩm của Big Four

Các thống kê 72% và 89% bị trộn lẫn nguồn

Thống kê 72% gian lận trong chương trình khách hàng thân thiết
- Ở trang 6, báo cáo cho rằng 72% chương trình khách hàng thân thiết đã báo cáo có hành vi trộm cắp hoặc gian lận
- Con số này được gán cho bài viết năm 2019 của Paystone, công ty xử lý thanh toán tại Canada
- Ở trang 11, cùng thống kê đó lại được gán cho NRF 2020 summary của Forter, công ty chống gian lận số
- Cả Paystone lẫn Forter đều không có trong bảng tài liệu tham khảo của báo cáo, và nguồn gốc ban đầu có vẻ là khảo sát năm 2017 của Ipsos
Thống kê số vụ tấn công gian lận chương trình khách hàng thân thiết tăng 89%
- Ở trang 6, báo cáo nói các cuộc tấn công gian lận vào chương trình khách hàng thân thiết đã tăng 89% kể từ năm 2019
- Ở trang 11, mức tăng 89% này lại bị giới hạn thành thay đổi trong một năm duy nhất từ 2018 đến 2019, và được gán cho Fraud Attack Index của Forter
- Nguồn này thực sự tồn tại và phần nào xác nhận phiên bản tuyên bố thứ hai, nhưng cũng là dữ liệu cũ giống nhiều nguồn khác được dùng trong báo cáo EY
- Các nguồn mâu thuẫn nhau, nguồn chất lượng thấp, thống kê cũ và cách diễn giải lại không chính xác được nêu là dấu hiệu của AI slop

Tác động công khai và nguy cơ ô nhiễm dữ liệu

Points of Attack dường như không gây chấn động lớn ở Canada, nhưng đã được trích dẫn trong một bài viết của Canberra Times, sau đó bài này được phát hành tới hơn 60 tờ báo trên khắp Australia
Báo cáo cũng có thể đã được lưu hành qua các buổi briefing cho khách hàng, bài thuyết trình nội bộ và truyền thông độc quyền không thuộc miền công khai
Việc xuất bản báo cáo trực tuyến gần giống một hình thức tiêm dữ liệu vào kho tri thức của Internet, và khi một công ty tư vấn nổi tiếng đăng thông tin sai hoặc trích dẫn ảo giác lên website có lưu lượng cao, điều đó có thể đánh lạc hướng các nhà nghiên cứu về sau
Các công cụ AI “deep research” có thể dễ tổn thương hơn trước kiểu ô nhiễm dữ liệu này vì chúng chọn nguồn dựa trên các tín hiệu khác con người
Claude, ChatGPT và Perplexity đã hiển thị thông tin ảo giác xuất phát từ báo cáo lỗi của EY

Mục đích của Hallucination Check

GPTZero cho rằng vibe citing đã trở thành rủi ro hiện hữu với nhà nghiên cứu, giới học thuật, tư vấn viên và những người phụ thuộc vào tìm kiếm web
Hallucination Check được giới thiệu là công cụ để nhận diện trích dẫn ảo giác và thông tin sai mà không cần kiểm tra thủ công toàn bộ trích dẫn
Công cụ này cũng đang được dùng để rà soát các bài nộp cho các hội nghị học thuật như IJCAI, ICLR, ICSE
Kết luận rút ra là ngay cả trích dẫn từ nguồn có uy tín như Ernst & Young cũng không còn dễ dàng được chấp nhận chỉ dựa trên sự tin cậy
Có kèm liên kết tới Hallucination Check của GPTZero

1 bình luận

GN⁺ 2026-06-01

Ý kiến trên Hacker News

Vấn đề thấy ở nhiều ngành nghề là đầu ra AI không được những người có chuyên môn như nhà phân tích lành nghề, kỹ sư cấp cao, luật sư chuyên môn hay bác sĩ nội trú rà soát đúng mức
Tốt nhất thì chỉ lướt qua, tệ nhất là thậm chí không hề được xem trước khi đăng, phát hành, đưa vào production, gửi cho khách hàng hoặc nộp cho tòa
Trong nhiều trường hợp, tổ chức có sẵn năng lực thẩm định cần thiết, nhưng những người đó đã quá tải chỉ với công việc thường ngày
Vài tháng trước, khi đọc bài viết nói Amazon để kỹ sư cấp cao rà soát đầu ra của AI tạo sinh(https://news.ycombinator.com/item?id=47323017), tôi chỉ biết bật cười. Họ vốn đã bận rồi, và thật khó tin Amazon lại chấp nhận việc nút thắt con người gia tăng trên toàn bộ quá trình phát triển dự án và hạ tầng nền tảng
- Một phần vấn đề là người ta chỉ quăng tài liệu hoàn chỉnh cho người khác xem sau khi mọi thứ đã nấu xong hết rồi
  Tôi luôn thúc đẩy việc cả tổ chức cần có những nguyên tắc kỹ thuật cơ bản
  Bạn sẽ không bảo kỹ sư rà soát 1000 dòng code mà không có cả đặc tả ban đầu về mục tiêu cần đạt được. Ít nhất phải có ngữ cảnh, và lý tưởng nhất là người review phải có mặt từ lúc công việc được giới thiệu để nắm toàn bộ bối cảnh
  Nhưng các tài liệu kiểu này lại được chuyển giao theo kiểu được ăn cả ngã về không. Khi chỉ số thứ 39 đã được định nghĩa chi li đến tận cùng rồi thì còn quay ngược lại được nữa không, hay chỉ biết cam chịu vì mọi thứ đã thành ra như vậy
  Chỉ cần một tài liệu một trang, hoặc kiểu Amazon thì có thể là 6 trang, ở mức “đây là điều tôi đề xuất”, cũng đủ để phản biện và gọt giũa hình hài tổng thể của ý tưởng từ giai đoạn khung xương. Phải làm trước khi xuất hiện sự đầu tư cảm xúc vào việc “bản báo cáo quý giá” đã hoàn thành
  Nó giống với cách truyền thống là phía sản phẩm lướt qua đặc tả trong môi trường SCRUM, còn kỹ sư thì review code cho ra hồn. Tất nhiên SCRUM đã chết rồi, nhưng đó lại là câu chuyện khác
- Từ góc nhìn của luật sư, việc rà soát đầu ra AI có cảm giác còn tốn thời gian hơn là tự làm ngay từ đầu. So với việc dùng mẫu có sẵn thì lại càng không cần bàn
  Dùng AI thì phải đọc hết, giải thích vì sao nó sai, rồi nhiều khi cuối cùng vẫn phải viết lại toàn bộ
  Số giờ có thể tính phí tăng lên rất nhiều, nhưng điều đó trông giống một triệu chứng cho thấy ưu điểm của AI là nhanh và dễ tiếp cận với người không hiểu chủ đề đang biến mất như thế nào
- Khi nói “người có chuyên môn không rà soát đầu ra AI”, tôi tự hỏi có phải là đang nói về chính những người vừa bị sa thải và bị bào mòn tinh thần hay không
  Một trong những lý do những “vĩ nhân nam nữ” thích vibe coding là vì giờ họ cảm thấy chỉ với bản thân mình cũng có thể làm những việc mà trước đây phải trải qua quá trình đau đớn là “chuyển cho chuyên gia ngữ cảnh”
  Giờ LLM đã trở thành “chuyên gia ngữ cảnh tích hợp sẵn”, nên họ cho rằng không còn cần phải rà soát đầu ra nữa
- Vấn đề là có những lúc thời gian để xác minh đầu ra còn lâu hơn thời gian tự làm từ đầu
  Khi đó, trong rất nhiều trường hợp AI trở thành một hệ thống có tỷ suất hoàn vốn cực kỳ âm
- Tôi đặc biệt quan tâm đến giáo dục và quản lý tri thức của con người. Tôi đã thấy tốc độ đào tạo IT giảm gần về 0
  Cứ thử nghĩ đến những chương trình đào tạo chuyên môn mà nếu sai sót thì hậu quả có thể lên bản tin tối
  Chính ý tưởng rằng mọi người tiếp nhận những chuỗi ký tự sinh ra từ ma trận số trong trạng thái đình chỉ phán đoán, và ai cũng chỉ cố né trách nhiệm của mình, đã đủ rợn người
  Nó giống chuyện các hãng hàng không Nam Á cấm phi công hạ cánh điều khiển thủ công, làm gia tăng suy giảm kỹ năng và cuối cùng dẫn đến những thảm họa nổi tiếng mà ai cũng biết
  Nếu ngay cả các tư vấn viên lương cao còn không buồn kiểm tra link thì lại càng thấy như vậy
Có nguồn nào xem được ở dạng văn bản thuần không? CSS làm tôi đau đầu, còn chế độ đọc thì có vẻ không chạy hoặc bị chặn
- Cuộn trang thực sự quá khổ sở, và kể cả khi chuyển sang chế độ đọc thì nó cũng bị hỏng
- Firefox có Reader view khá tiện, cho phép trích riêng phần văn bản trên trang rồi hiển thị gọn lại. Trên Mac có thể bật bằng Opt + CMD + R
  Tuy nhiên tính năng này cũng có vấn đề là xóa luôn cả hình ảnh chứa một số nguồn được sử dụng
- Trên Lockdown Mode của iOS cũng vậy
Điều thực sự buồn cười là thấy thứ rác rưởi này lại đi xuống từ ban lãnh đạo cấp cao. Prompt vụng về, rác hallucination, thông tin có thể hành động thì bằng 0, phân tích thật sự hiểu chuyện cũng bằng 0, chỉ toàn ba hoa
Kiểu như “Hãy xem phân tích các vấn đề hỗ trợ lấy từ Jira. Chúng ta nhất định phải sửa ba vấn đề hàng đầu này!!!”, trong khi thực ra đó đều là những thứ ai cũng biết từ nhiều năm trước và ban điều hành đơn giản là chưa từng trao quyền cho ai sửa chúng
Tôi đã thấy chuyện này hơn hai lần nên nó cần một cái tên. Có nên gọi là Garbagemaxxing không
- Nếu câu “phải sửa ba vấn đề hàng đầu” thực chất là các vấn đề mà mọi người đã biết từ lâu nhưng ban lãnh đạo chưa từng trao quyền giải quyết, thì có khi tác động ròng vẫn là tích cực cũng nên
Đây là một trang cực kỳ tệ để khám phá nội dung
- Trên di động, nó chặn thao tác cuộn nên đúng nghĩa là không thể kéo xuống thêm nữa. Chế độ đọc cũng chỉ hiện được cỡ đoạn đầu tiên
  Chắc tôi phải xem lại trên desktop sau. Nội dung có vẻ thú vị, nhưng thực tế là không thể đọc nổi. Tôi không sao vượt qua được phần giới thiệu Ernst and Young
- Tôi cảm giác như thao tác cuộn của mình đang bị hallucination
- Đây là một mức độ thù địch với người dùng hoàn toàn khác. Tôi chưa từng thấy kiểu này trước đây
- iPhone tự động bật chế độ đọc, nhưng khi tôi tắt nó đi để xem họ đang nói gì thì tôi thấy hoàn toàn đồng ý
- Phản hồi phi tuyến có cả điểm dừng theo đúng nghĩa đen, thật kinh khủng
  Có những người không nên làm website
Có ai đã hallucination luôn cả cách cuộn trang trên web nên hoạt động thế nào không?
Điều kỳ lạ là báo cáo này chỉ cần cách đây 12–18 tháng thôi cũng sẽ là một vụ bê bối khổng lồ và gây tổn hại thương hiệu kéo dài, nhưng giờ có vẻ sẽ chẳng ai nhớ hay thậm chí nhận ra nữa
Trước hết họ nên sửa cái website. Cần vứt bỏ đống JavaScript animation tệ hại đó đi. Mấy thứ này đã được giải quyết từ năm 2014 với D3JS và jQuery rồi
Tôi thật sự không hiểu chuyện này xảy ra bằng cách nào. Ví dụ như Qwen Chat hay Perplexity đều gắn trích dẫn ở cuối mỗi câu được tạo ra
Vì thế chỉ cần rê chuột lên từng trích dẫn là có thể xem nó lấy từ website nào
Chẳng lẽ họ chỉ prompt vào ChatGPT bản không có tìm kiếm web rồi copy-paste ra thôi sao?
EY đã âm thầm sa thải người suốt cả năm qua
Nếu cố làm nhiều việc hơn với ít người hơn thì dẫn đến suy giảm chất lượng cũng chẳng có gì đáng ngạc nhiên
- Điều thú vị là ngay cả những dịch vụ chẳng làm gì cũng có thể có nhu cầu kha khá
  Rất nhiều công việc doanh nghiệp thực chất chỉ là điền cho đủ checkbox
  Sếp nói “Lấy cho tôi một báo cáo về X. Tôi sẽ đưa báo cáo đó cho sếp của tôi, và người đó sẽ không đọc đâu”
  Thế là thành ra mô hình “E&Y, làm cho tôi một báo cáo. Đây là 200.000 đô”
Bản thân trang web này cũng rất có thể được làm bằng vibe coding, và người viết chắc cũng chẳng quan tâm chuyện đó

EY Canada công bố báo cáo an ninh mạng, nhưng phần lớn trích dẫn là ảo giác

Vấn đề của báo cáo Ernst & Young

Cách trích dẫn và kết quả kiểm chứng

Các nguồn sai hoặc không chính xác tiêu biểu

Bài viết BleepingComputer về vụ xâm phạm chương trình khách hàng thân thiết của hãng hàng không

Bài viết Wired về deepfake giọng nói và bảo mật API

Báo cáo của Gartner và McKinsey

Bài viết Forbes về kinh tế điểm thưởng

Cisco Talos và TechCrunch

Mâu thuẫn nội bộ của thống kê 200 tỷ USD

Tuyên bố trong phần tóm tắt

Ý nghĩa bị đổi ở trang 10

Lần theo nguồn của trích dẫn McKinsey

Các thống kê 72% và 89% bị trộn lẫn nguồn

Thống kê 72% gian lận trong chương trình khách hàng thân thiết

Thống kê số vụ tấn công gian lận chương trình khách hàng thân thiết tăng 89%

Tác động công khai và nguy cơ ô nhiễm dữ liệu

Mục đích của Hallucination Check

Bài viết liên quan

1 bình luận

Ý kiến trên Hacker News