1 điểm bởi GN⁺ 2024-01-09 | 2 bình luận | Chia sẻ qua WhatsApp

Xác suất “một phần triệu” có thật sự tồn tại không?

  • Chủ đề về xác suất “một phần triệu” là nội dung có thể đưa vào lớp học một cách thú vị.
  • Tác giả hỏi sinh viên rằng khi xác suất “một phần triệu” được nhắc đến trong hội thoại hằng ngày, họ sẽ nghĩ đến tình huống nào.
  • Sinh viên đưa ra các ví dụ điển hình như trúng xổ số hoặc bị sét đánh, cùng cả những gợi ý sáng tạo hơn.
  • Bài viết bàn về cách thu thập dữ liệu xem trong cách dùng đời thường, xác suất “một phần triệu” thực sự được dùng như thế nào.
  • Ngoài việc tìm kiếm trên blog, rất khó tìm ra phương pháp thực tế nào khác.
  • Tác giả đề nghị nêu ra những sự kiện thực sự có thể có xác suất một phần triệu, liệu có thể định lượng xác suất đó hay không, và xem nó có xấp xỉ một phần triệu hay không.

Ví dụ và phản ví dụ về xác suất

  • Bài viết nêu ra các ví dụ hiển nhiên từ trò may rủi như tung đồng xu hoặc trúng xổ số.
  • Ví dụ, xác suất tung đồng xu 20 lần mà đều ra mặt ngửa là “có”.
  • Xác suất trúng xổ số Powerball của bang California nếu mua 6 vé mỗi năm cũng là “có”.
  • Xác suất nhận được một nhân vật nổi tiếng cụ thể từ liên kết “bài viết ngẫu nhiên” trên Wikipedia cũng là “có”.
  • Xác suất xảy ra một trận động đất lớn trên đứt gãy Hayward trong 50 phút tới cũng là “có”.
    • Theo ước tính năm 2007, xác suất xảy ra động đất từ 6,7 độ trở lên trên đứt gãy Hayward là khoảng 1% mỗi năm.
  • Xác suất một trong 24 trẻ sơ sinh tiếp theo sinh ra ở Mỹ trở thành tổng thống cũng là “có”.
    • Tỷ lệ sinh ở Mỹ là khoảng 4 triệu trẻ mỗi năm, và nếu giả định nhiệm kỳ tổng thống trung bình là 6 năm thì sẽ có một người trở thành tổng thống trong số 24 triệu em bé.
  • Xác suất bỏ lá phiếu quyết định trong một cuộc bầu cử thay đổi tùy tình huống, nhưng trong một cuộc bầu cử ở bang California mà khó đánh giá bằng thăm dò thì đó là “có”.

Rủi ro tác động đến cá nhân

  • Kể từ khi bắt đầu dự án “Real World”, tác giả thường xuyên nhận được email về nhiều loại rủi ro khác nhau.
  • Các câu hỏi về rủi ro như rơi máy bay, bị cướp biển bắt cóc, chết đuối do dòng chảy, hay tai nạn giao thông ở Mỹ Latinh không có câu trả lời đơn giản.
  • Chỉ số tử vong thôi là chưa đủ; còn cần biết số người tham gia hoạt động đó.
  • Lấy ví dụ tỷ lệ tử vong do tai nạn khi trượt tuyết hoặc trượt ván, con số này dựa trên mức trung bình 0,7 ca tử vong trên mỗi một triệu lượt đến các khu trượt tuyết chính thức ở Mỹ.
  • Khi so sánh rủi ro giữa các hoạt động khác nhau, cũng cần tính đến thời gian dành cho hoạt động đó.
  • Thuật ngữ “micromort” biểu thị xác suất tử vong một phần triệu do một hoạt động cụ thể gây ra, và trang này cung cấp so sánh giữa nhiều hoạt động khác nhau.
  • Ví dụ, xác suất tử vong trong một lần nhảy dù là “không”.
    • Nó gần với khoảng 10 micromort hơn.
  • Vì xác suất có thể thay đổi rất nhiều tùy theo hành vi của từng cá nhân, việc áp dụng mức trung bình dân số cho một người cụ thể cần có phán đoán hợp lý.
  • Ví dụ, xác suất tử vong trong một chuyến đi ô tô 200 dặm ở California là “có”.
    • Ở đây dùng tỷ lệ tử vong tại California là khoảng 1 ca trên mỗi 150 triệu dặm xe chạy.
  • Xác suất bị sét đánh là “không”.
    • Không có dữ liệu đáng tin cậy về việc bị sét đánh, và nếu không nhận hỗ trợ y tế thì sự việc sẽ không được đưa vào thống kê chính thức.
  • Cuối cùng, xác suất nam giới mắc ung thư vú là “không”.
    • Tỷ lệ mắc ung thư vú ở nam giới là hiếm, nhưng phổ biến hơn người ta nghĩ; xác suất mắc trong đời là khoảng một phần nghìn, còn xác suất tử vong là một phần năm nghìn.
  • Khi đánh giá tác động của bệnh tật, hút thuốc, béo phì và các yếu tố tương tự, tốt hơn nên dùng khái niệm “microlife”.
    • Nó có nghĩa là thay đổi khoảng 30 phút trong tuổi thọ kỳ vọng, và khoảng thời gian này tương ứng xấp xỉ một phần triệu của cuộc đời một người trưởng thành.

Ý kiến của GN⁺

  • Xác suất “một phần triệu” thường được dùng trong hội thoại hằng ngày như một cách nói cường điệu về nhiều tình huống khác nhau, nhưng những sự kiện thực sự có xác suất này rất hiếm và phụ thuộc vào các điều kiện cụ thể.
  • Việc hiểu và tính toán những xác suất như vậy giúp phát triển tư duy thống kê, đồng thời đóng vai trò quan trọng trong quản lý rủi ro và ra quyết định.
  • Vì mức độ rủi ro có thể thay đổi lớn tùy theo hành vi và hoàn cảnh của từng cá nhân, cần thận trọng khi áp dụng các mức trung bình nhân khẩu học cho từng người.

2 bình luận

 
GN⁺ 2024-01-09
Ý kiến trên Hacker News
  • "Các nhà khoa học tính rằng xác suất một chuyện thực sự xảy ra là một trên một triệu. Nhưng các pháp sư tính rằng xác suất một trên một triệu trên thực tế xảy ra đến chín lần trong mười lần." -- Terry Pratchett

    • Đây là một câu đùa rằng trong tiểu thuyết, nếu nói "xác suất là một trên một triệu, nhưng có thể nó sẽ hiệu quả!" thì thực ra nó sẽ hiệu quả.
    • Trong Guards! Guards!, có nhắc rằng chỉ bắn mũi tên trúng điểm yếu của con rồng là chưa đủ, mà còn phải tạo ra nhiều tình huống tưởng như bất khả thi để đưa xác suất về đúng một trên một triệu.
  • "Có lần ai đó hỏi tên tôi. Tôi trả lời 'Mark Xu'. Sau đó hẳn họ đã tin rằng tên tôi là 'Mark Xu'. Có lẽ họ sẽ cược với tỷ lệ 20:1 rằng trên bằng lái xe của tôi sẽ ghi 'Mark Xu'."

    • Giả sử xác suất tên một người là 'Mark Xu' theo cách rất rộng rãi là 1:1.000.000.
    • Việc tôi nói rằng tôi là 'Mark Xu' tạo ra tỷ lệ xác suất 20.000.000:1, tức khoảng 24 bit bằng chứng.
    • Những tuyên bố phi thường cần bằng chứng phi thường, nhưng bằng chứng phi thường có thể phổ biến hơn ta nghĩ.
  • Sau đây đều là các hoạt động có xác suất tử vong khoảng một phần một triệu, tức 1 micromort:
    • Di chuyển 6 dặm (9,7 km) bằng xe máy
    • Đi bộ 17 dặm (27 km)
    • Đi xe đạp 20 dặm (32 km)
    • Di chuyển 230 dặm (370 km) bằng ô tô
    • Bay 1.000 dặm (1.600 km) bằng máy bay phản lực
    • Đi 6.000 dặm (9.656 km) bằng tàu hỏa
    • Tuy nhiên, đi xe đạp quãng ngắn lại làm tăng tuổi thọ kỳ vọng nhờ lợi ích sức khỏe.
  • "Một lần trong một triệu năm" — tức một chuyện có thể xảy ra với một cá nhân một lần trong một triệu năm — lại xảy ra hơn 8.000 lần mỗi năm nếu xét trên toàn bộ loài người trên Trái Đất. Rất nhiều người có smartphone gắn camera, nên hoàn toàn có thể có video thật về một con cáo nâu nhanh nhẹn nhảy qua một con chó lười biếng.

  • Rất thích "Becker Bottle". Nó cho khả năng thực sự hình dung được khái niệm này, đồng thời là công cụ học tập rất tốt cho lớp hóa và cũng là món đồ chơi vui.

  • Điều này làm tôi nhớ đến khi làm việc với các dịch vụ có lưu lượng rất lớn

    • Với những dịch vụ có lượng traffic lớn như vậy, thật thú vị khi nghĩ xem các trường hợp biên xảy ra thường xuyên đến mức nào.
    • Những chuyện khó tái hiện trên máy local thì nhìn log lại thấy xảy ra khoảng 100 lần mỗi tuần.
  • Ừm, sóng đã đánh vào nó.

    • Sóng đánh vào nó à?
    • Sóng đánh vào con tàu.
    • Thế có gì lạ?
    • Ồ, ngoài biển ấy à? Xác suất một phần một triệu!
  • Hình dung tinh thần tôi thích nhất mà tôi từng nghĩ ra là: hãy tưởng tượng lái xe từ New Jersey đến Florida (hoặc thay bằng một chuyến lái xe dài mà bạn từng đi).

    • Với tôi thì khoảng 1.200 dặm, mất 20 giờ nếu đi 60 dặm/giờ. Đó là 72.000 giây lái xe buồn tẻ.
    • Nếu trong suốt 20 giờ lái xe bạn giữ nút bấm, và nếu nó rơi vào một "vùng nguy hiểm" kéo dài 15 giây thì bạn thua.
    • Ví dụ này còn hay hơn khi nhìn vào xác suất trúng xổ số (còn thấp hơn một phần một triệu) — bạn có thể tưởng tượng ném một đồng 25 xu ra ngoài cửa sổ và hy vọng nó rơi đúng vào một đoạn dài 1 inch phù hợp trên mặt đường.
    • Ví dụ này cho bạn cảm giác trực quan — có thể so sánh các xác suất khác nhau bằng cách so chiều dài con đường hoặc khoảng thời gian.
  • Cũng đáng để biết về các hệ số an toàn trong kỹ thuật kết cấu cho nhà ở, văn phòng và các tòa nhà thông thường khác ở EU.

    • Eurocode định nghĩa 3 lớp hậu quả: CC1, CC2, CC3.
    • CC1 có mức hậu quả thấp nhất và dùng cho nhà ở thông thường, công nghiệp nhẹ và nông nghiệp. Xác suất có người chết do hỏng kết cấu là thấp, 0,001.
    • Các tòa nhà CC2 (chung cư, văn phòng, khách sạn, v.v.) có xác suất tử vong ở mức trung bình, 0,03.
    • CC3 dùng cho các công trình đặc biệt như sân vận động lớn, nơi rủi ro tử vong nếu kết cấu hỏng là cao, 0,3.
    • Lớp hậu quả có liên quan đến xác suất tòa nhà có thể sụp đổ trong một năm nhất định. Nguyên nhân có thể là thời tiết cực đoan, v.v.
    • Với CC1 thì đó là xác suất 1 trên 100, CC2 là 1 trên 10.000, CC3 là 1 trên 100.000.
    • Nếu chỉ nhìn thuần túy vào thống kê đằng sau các tiêu chuẩn an toàn kết cấu, thì xác suất trong một năm có ít nhất một người chết trong sân vận động do hỏng kết cấu vì bão có thể là 1 trên 300.000.
    • Các thống kê này được ánh xạ thành các giá trị tham chiếu đơn giản cho tải trọng do gió, tuyết, mưa, sử dụng... cùng các hệ số an toàn dễ áp dụng. Ví dụ, CC2 có hệ số an toàn 1,5 cho mọi tải trọng biến đổi.
  • Xác suất một nam giới trẻ mắc ung thư vú trong đời là 1 trên 1000 thực sự khá thú vị: nó không thấp hơn quá nhiều so với xác suất mắc ung thư tinh hoàn của anh ta, vốn có xác suất trọn đời khoảng 1 trên 250 (giả định theo số liệu Mỹ).

    • Và xác suất một nam giới tử vong vì ung thư vú cũng xấp xỉ bằng xác suất tử vong vì ung thư tinh hoàn: cả hai đều có xác suất trọn đời khoảng 1 trên 5000.
 
dlehals2 2024-01-10

Giả sử một cách rất rộng rãi rằng xác suất tên của ai đó là "Mark Shea" là 1:1.000.000.
Việc tôi nói "Mark Shea" có tỷ lệ khả năng là 20.000.000:1, tức khoảng 24 bit bằng chứng.
Những tuyên bố phi thường đòi hỏi bằng chứng phi thường, nhưng bằng chứng phi thường có thể phổ biến hơn bạn nghĩ.

Có ai giải thích giúp đây là nói về điều gì không? Tôi hơi ngốc nên không hiểu lắm hu hu