1 điểm bởi GN⁺ 1 giờ trước | 1 bình luận | Chia sẻ qua WhatsApp
  • Các lao động Sama tại Kenya từng kiểm duyệt nội dung kính thông minh phục vụ huấn luyện AI đang vướng vào tranh chấp có thể dẫn tới 1.108 người bị sa thải sau khi Meta chấm dứt hợp đồng
  • Việc chấm dứt hợp đồng diễn ra chưa đầy hai tháng sau khi các lao động nói rằng họ đã xem các cảnh người dùng đi vệ sinh và quan hệ tình dục trong video từ kính Meta
  • Meta cho biết Sama không đáp ứng các tiêu chuẩn vận hành, còn Sama phản bác rằng họ đã đáp ứng các tiêu chuẩn vận hành, bảo mật và chất lượng trong công việc cho khách hàng gồm cả Meta và chưa từng nhận thông báo không đạt chuẩn
  • Meta cho biết nội dung từ kính thông minh mà người dùng chia sẻ với Meta AI đôi khi có thể được lao động thuê ngoài xem xét, và việc rà soát thủ công để cải thiện hiệu năng sản phẩm đều có sự đồng ý rõ ràng của người dùng
  • ICO của Anh và Ủy viên Bảo vệ Dữ liệu Kenya đã phản ứng trước lo ngại về quyền riêng tư, trong khi tranh cãi từ hợp đồng moderation nội dung Facebook trước đây của Sama tiếp tục phơi bày rủi ro của lao động dữ liệu AI

Các điểm tranh cãi quanh việc Meta chấm dứt hợp đồng với Sama

  • Meta đã chấm dứt hợp đồng lớn với Sama, đơn vị từng được dùng cho huấn luyện AI, và Sama cho rằng quyết định này sẽ khiến 1.108 người mất việc
  • Việc chấm dứt hợp đồng diễn ra chưa đầy hai tháng sau khi các lao động tại Kenya của Sama nói rằng họ đã xem các cảnh người dùng đi vệ sinh và quan hệ tình dục trong video từ kính thông minh Meta
  • Meta nói họ kết thúc hợp đồng vì Sama không đáp ứng các tiêu chuẩn vận hành của công ty
  • Sama phản bác rằng họ đã liên tục đáp ứng các tiêu chuẩn vận hành, bảo mật và chất lượng được yêu cầu trong công việc cho khách hàng, bao gồm cả Meta, và chưa từng nhận thông báo nào về việc không đạt chuẩn
  • Các tổ chức lao động tại Kenya cho rằng quyết định của Meta được đưa ra vì nhân viên đã lên tiếng công khai, nhưng Meta không trả lời trực tiếp nghi vấn này

Việc rà soát video từ kính thông minh và vấn đề dữ liệu cá nhân

  • Trong điều tra của các báo Thụy Điển Svenska Dagbladet và Goteborgs-Posten vào cuối tháng 2, các lao động ẩn danh cho biết họ đã rà soát video được quay bằng kính Meta
  • Một lao động nói rằng họ “nhìn thấy mọi thứ, từ phòng khách đến cảnh khỏa thân”, và các video đó cũng bao gồm cảnh đi vệ sinh hoặc quan hệ tình dục
  • Meta thừa nhận rằng nội dung từ kính thông minh được người dùng chia sẻ với Meta AI đôi khi có thể được các lao động thuê ngoài xem xét
  • Meta cho rằng việc rà soát này nhằm cải thiện trải nghiệm khách hàng và là thực tiễn phổ biến ở các công ty khác
  • Trong tuyên bố gửi BBC, Meta nói rằng ảnh và video là riêng tư đối với người dùng, và việc con người rà soát nội dung AI để cải thiện hiệu năng sản phẩm đều có sự đồng ý rõ ràng của người dùng

Cơ quan quản lý và rủi ro khi sử dụng sản phẩm

  • Ngay sau các bài báo tại Thụy Điển, cơ quan giám sát dữ liệu ICO của Anh coi các thông tin này là “đáng lo ngại” và đã gửi thư cho Meta
  • Ủy viên Bảo vệ Dữ liệu Kenya cũng bắt đầu điều tra các lo ngại về quyền riêng tư phát sinh từ kính thông minh
  • Vào tháng 9, Meta đã giới thiệu dòng kính tích hợp AI cùng Ray-Ban và Oakley
  • Các tính năng gồm dịch văn bản, trả lời câu hỏi về vật thể mà người dùng đang nhìn, và có thể đặc biệt hữu ích với người mù hoặc người có thị lực kém
  • Khi thiết bị ngày càng phổ biến, lo ngại về lạm dụng cũng gia tăng, và tại Kenya chúng còn bị liên hệ với các vụ quay lén không có sự đồng thuận nhắm vào phụ nữ
  • Kính Meta được thiết kế để đèn báo ở góc gọng sáng lên khi camera tích hợp đang ghi hình

Lao động gắn nhãn dữ liệu và tranh cãi từ các hợp đồng trước đó

  • Các lao động của Sama làm việc như data annotator, gắn nhãn thủ công cho nội dung để Meta AI hiểu hình ảnh, đồng thời rà soát cả transcript tương tác với AI
  • Theo một lao động, chiếc kính của một người đàn ông tiếp tục ghi hình trong phòng ngủ, sau đó quay lại cảnh một phụ nữ được cho là vợ ông ấy cởi quần áo
  • Sama là công ty outsourcing có trụ sở tại Mỹ, khởi đầu từ một tổ chức phi lợi nhuận nhằm mở rộng việc làm thông qua tạo ra việc làm công nghệ, và hiện hoạt động như một B-corp “ethical”
  • Hợp đồng moderation nội dung Facebook trước đây giữa Meta và Sama cũng từng gây chỉ trích và dẫn tới hành động pháp lý từ các cựu nhân viên; một số người cho biết họ bị phơi nhiễm với nội dung phản cảm và gây sang chấn
  • Sau đó, Sama cho biết họ hối tiếc vì đã nhận công việc đó
  • Naftali Wambalo của Africa Tech Workers Movement cho biết ông cũng đã liên hệ với các lao động trong hợp đồng về kính thông minh, và cho rằng Meta không muốn việc con người rà soát nội dung từ kính thông minh bị công khai
  • Wambalo nói tiêu chuẩn mà Meta nhắc tới gần giống với “tiêu chuẩn giữ bí mật” hơn
  • Meta trước đây từng nói rằng trong điều khoản dịch vụ, người dùng đã có thể biết khả năng nội dung bị con người rà soát
  • Mercy Mutemi của Oversight Lab cho rằng phát ngôn của Meta phải là lời cảnh báo với chính phủ Kenya, vì nền tảng được giới thiệu như con đường gia nhập hệ sinh thái AI là vô cùng mong manh

1 bình luận

 
Ý kiến Hacker News
  • Meta đã hủy hợp đồng với công ty gia công phần mềm được giao phân loại nội dung từ kính thông minh, và việc này xảy ra sau khi nhân viên của công ty đó tố giác nội bộ về các vấn đề quyền riêng tư nghiêm trọng trong chính nội dung họ phải phân loại

    • Một dữ kiện thưởng “thú vị”: đây không phải lần đầu Sama vướng vào kiểu vấn đề này
      OpenAI từng giao cho Sama việc phân loại CSAM, và năm 2022 Sama đã chấm dứt OpenAI với tư cách khách hàng: https://time.com/6247678/openai-chatgpt-kenya-workers/
      Bốn năm sau đó, và ba năm sau khi bài báo ấy được đăng, cách vận hành của các công ty công nghệ vẫn không cải thiện chút nào
    • Nghe rất có lý. Nếu bạn biết ai đang đeo loại kính thông minh này thì điều quan trọng là tuyệt đối không chấp nhận điều đó
      Đừng trò chuyện hay tương tác, thậm chí cũng không nên ở cùng một không gian
    • Mark Zuckerberg và sự coi thường quyền riêng tư người dùng, khó có cặp đôi biểu tượng nào hơn thế này
    • Người ta nói đây là “nội dung được trả tiền để phân loại”, nhưng các tổ chức lao động ở Kenya cho rằng quyết định của Meta là vì nhân viên đã lên tiếng công khai về vấn đề này
      Meta nói Sama không đáp ứng tiêu chuẩn của họ, còn Sama phủ nhận chỉ trích đó
    • Bảo vệ người tố giác là cốt lõi của một xã hội vận hành đúng đắn
      Vừa bảo vệ kẻ phạm tội vừa bêu riếu người tố giác chỉ có ở các chế độ độc tài và đầu sỏ
      Không quan trọng công ty gia công ở nước nào; nếu tội phạm đã mang tính toàn cầu thì việc bảo vệ người tố giác cũng phải mang tính toàn cầu
  • Một lao động nói rằng họ “thấy mọi thứ từ phòng khách đến ảnh khỏa thân”
    Meta nói đây là để cải thiện trải nghiệm khách hàng và là thông lệ phổ biến ở các công ty khác, nhưng tôi thật sự không chắc mình có đọc đúng câu đó không
    Đây có lẽ là phát ngôn kỳ quái nhất tôi từng thấy trên Internet trong 20 năm qua

    • Hoàn toàn là chuyện viển vông. Tôi từng làm ở Big Tech, và việc tải lên ảnh riêng tư chưa qua chỉnh sửa hoặc ảnh bên trong nhà để công ty hay nhà thầu xem chỉ vì lý do mơ hồ như “cải thiện trải nghiệm khách hàng” thì ở bất kỳ nơi nào tôi từng làm cũng sẽ không qua nổi ngay cả vòng rà soát bề ngoài về quyền riêng tư và bảo vệ dữ liệu
      Tôi thật sự tự hỏi Meta có đọc lại những gì họ đang nói không
    • Trước đây tôi từng đọc hướng dẫn của robot lau sàn nhỏ Ecovacs Deebot U2 pro, trong đó ghi kiểu như khi sử dụng thì bạn trao quyền cho họ chụp ảnh và gửi lên máy chủ từ xa
      Hình như lý do là để phân tích sự cố hay đại loại vậy
    • Thứ đáng lẽ phải đọc kỹ là điều khoản Facebook
      Đến giờ tôi vẫn bị nhìn lạ khi nói mình không dùng WhatsApp, nhưng mọi tài sản của Meta đều đã bị ô nhiễm nên tôi tránh dùng hết
    • Tôi không hiểu tại sao điều này lại bị xem là kỳ lạ. Con người từ lâu đã đánh đổi quyền riêng tư lấy những tiện lợi rất nhỏ
    • Toàn là gắn nhãn, gắn nhãn, gắn nhãn. “Cải thiện” ở đây nghĩa là huấn luyện LLM và các mô hình diffusion
  • Tôi không biết cái nào tệ hơn ở đây: Meta ghi hình từ kính thông minh của khách hàng, hay sa thải những người đã nói ra chuyện đó

    • Vế sau tệ hơn. Ít nhất chuyện kia còn có thể bị biện hộ là nhầm lẫn hoặc “chỉ là lỗi” thôi
    • Cũng có thể tệ hơn là việc mọi người đeo kính giám sát khi quan hệ với bạn đời
      Đúng là cần gây áp lực để các công ty như thế này không thể hành xử tồi tệ, nhưng rốt cuộc muốn làm điều tồi tệ với dữ liệu thì trước hết phải có dữ liệu do chính mọi người giao nộp
      Dĩ nhiên vẫn có ngoại lệ như Flock, nơi họ làm điều tồi tệ với dữ liệu giám sát “công cộng”
      Tôi biết văn hóa đã xuống cấp đến mức chuyện đeo kính giám sát của doanh nghiệp trong những khoảnh khắc thân mật có thể bị bình thường hóa, nhưng tôi không hiểu sao người ta lại tin tưởng đến vậy
    • Mọi thứ liên quan đến Meta, bắt đầu từ chính cái tên đó, ngay từ đầu đã là cái ác
    • Nói nhẹ một chút thôi, tôi không hiểu vì sao ai đó lại đeo camera Internet trên người khi đang khỏa thân hay đang quan hệ
      Mở rộng ra hơn, tôi cũng không hiểu vì sao lại đeo một chiếc camera có kết nối Internet mà Meta chắc chắn sẽ giám sát
  • Tôi nghĩ những vấn đề quyền riêng tư và bảo mật nhạy cảm xoay quanh kính thông minh và các công nghệ “cá nhân” khác hoàn toàn có thể được xử lý tốt nếu đó là một công ty cẩn trọng, có trách nhiệm và phản ứng nhanh
    Vì vậy tôi sẽ tuyệt đối không đụng đến thiết bị cá nhân của Meta
    Toàn bộ DNA của họ được viết ra để khai thác người dùng vì lợi nhuận
    Theo đánh giá của tôi, họ chỉ nhìn những vấn đề này như thứ dùng để che đi mức độ khai thác thật sự khỏi nhận thức của mọi người; họ không thể cân nhắc nghiêm túc theo đúng nghĩa đen, và sau này cũng sẽ không làm vậy

  • Tôi thắc mắc trong những điều kiện nào thì video quay từ kính lại được tải lên để phân loại
    Có lẽ cấu trúc là khi người dùng hỏi chiếc kính điều gì đó về thứ họ đang nhìn, thì video sẽ được tải lên để phân loại nhằm tạo ra câu trả lời
    Có vẻ mọi người nghĩ “chỉ là AI thôi” nên không quá lo về quyền riêng tư

    • Tôi luôn mặc định là theo mặc định thì nó vẫn diễn ra như vậy
  • Đọc tiêu đề này khiến tôi nhớ ra rằng “row” là một trong những từ tôi đã phát âm sai gần như cả đời. Mãi năm nay tôi mới biết cách phát âm đúng
    Trong ngữ cảnh này, row vần với cow chứ không phải dough
    Ví dụ gieo vần đầu tiên tôi nghĩ đến là bow, rồi mới nhận ra bản thân ví dụ đó cũng có vấn đề

    • Ít nhất ở Anh đây là chuyện hay bị đem ra đùa. Đa số người Mỹ không biết sự khác biệt
      Câu “hai quốc gia bị chia cắt bởi một ngôn ngữ chung” đúng là quá chuẩn
    • Đáng ngạc nhiên là tôi cũng đã phát âm sai từ này cả đời. Dù là người bản ngữ, tiếng Anh vẫn không ngừng làm tôi ngạc nhiên
      https://www.merriam-webster.com/dictionary/row#dictionary-en...
    • Phát âm như row trong rowdy là được
  • Tôi là cựu nhân viên Meta. Cứ la ó tôi cũng đáng
    Bên trong công ty có 4 cấp độ dữ liệu, trong đó 1 là thông tin công khai kiểu “bầu trời màu xanh”, còn 4 là dữ liệu người dùng cá nhân hoặc thông tin nhạy cảm nếu bị rò rỉ hay chia sẻ
    Về cơ bản tôi được nghe rằng mọi dữ liệu người dùng đều là cấp 4, và nếu làm gì không có phê duyệt thích hợp thì sẽ bị sa thải ngay lập tức
    Trong thời gian bootcamp, người ta thường kể rằng mỗi tháng lại có ít nhất một người truy cập dữ liệu người dùng và bị áp giải ra khỏi tòa nhà chỉ trong vài giờ
    Ở mảng nghiên cứu thị giác nơi tôi làm, chúng tôi phải qua cả năm quy trình pháp lý chỉ để xin phép ghi hình ở nơi công cộng
    Chúng tôi phải xây dựng pipeline ẩn danh hóa, nhật ký kiểm toán chặt chẽ, xóa càng nhiều dữ liệu càng tốt, và hệ thống tự động xóa nếu có gì sai sót
    Cũng có các quy tắc nghiêm ngặt về nơi lưu trữ dữ liệu và ai được phép truy cập
    Bất kỳ video “ngoài tự nhiên” nào có khả năng xuất hiện dù chỉ thoáng qua người chưa ký thỏa thuận đều bị xem là chuyển cho bên thứ ba, nên không thể chia sẻ cho công việc gắn chú thích
    Tất cả những người và địa điểm có thể truy vết trong các bộ dữ liệu công khai đều đã có giấy miễn trừ trách nhiệm được ký đầy đủ
    Thế mà giờ lại nghe nói dữ liệu riêng tư bị đổ thẳng cho các annotator và dùng làm dữ liệu huấn luyện, tức là ngay cả các kiểm soát cơ bản cũng không tồn tại
    Điều đó chỉ cho thấy nếu Zuck hay bộ phận kiếm tiền muốn điều gì thì quy tắc sẽ không còn được áp dụng
    Tôi mong cả ngành đó tự sụp đổ

    • Với quy mô và tính chất kinh doanh của Meta, tôi từng nghĩ họ sẽ có hệ thống tốt hơn
      Kỹ sư phần mềm chỉ nên được truy cập PII khi có sự đồng ý rõ ràng của người dùng hoặc khách hàng, ví dụ như trong các vé hỗ trợ
      Nhất là với người đang trong bootcamp thì càng phải như vậy, nên tôi thấy khó hiểu việc họ có thể truy cập dữ liệu người dùng không ẩn danh trong lúc đào tạo
      Ở công ty cũ của tôi, ngay cả khi có sự đồng ý của khách hàng thì muốn truy cập dữ liệu người dùng cũng phải qua rất nhiều thủ tục
    • Sau Cambridge Analytica, tôi luôn thắc mắc khi thấy Meta áp điều kiện dùng API cực kỳ nghiêm ngặt cho cả các dự án cá nhân
      Vì rõ ràng bên trong lại đang diễn ra một câu chuyện hoàn toàn khác
  • Một trong những ngách thương mại lớn hơn của kính thông minh là quay POV porn, nên việc loại nội dung đó xuất hiện trong hàng đợi kiểm duyệt cũng không có gì đáng ngạc nhiên
    Dự án đáng ra phải được lên kế hoạch có tính đến trường hợp sử dụng đó

    • Tôi cũng hiểu việc Meta sẽ khó xử đến mức nào khi phải thừa nhận sự tồn tại của trường hợp sử dụng đó
      Ngay từ thời Oculus Go, nội bộ đã có rất nhiều cách nói vòng vo lịch sự để tránh phải nói thẳng rằng “thiết bị của chúng tôi phải ra mắt kèm trình duyệt để mọi người có thể xem khiêu dâm”
    • Tôi còn không hiểu vì sao lại có một hàng đợi kiểm duyệt ngay từ đầu. Đây chẳng phải là bản ghi riêng tư của mọi người sao
    • Họ định kiểm duyệt việc người ta làm bằng cách nào
      Đã phát trực tuyến lên máy chủ rồi thì sẽ cử người tới ngăn họ quan hệ sao
  • https://archive.ph/ubWba

  • Nếu muốn đọc thêm về cách những mặt nhức nhối của việc huấn luyện AI bị đẩy sang cho lao động nghèo ở thế giới thứ ba, tôi khuyên đọc Empire of AI của Karen Hao
    Những lao động này làm công việc bấp bênh, nhận mức lương rẻ mạt theo giờ và bị phơi nhiễm với tài liệu kinh khủng

    • Tôi tò mò không biết cuốn đó đã đề cập những ví dụ nào