Các công cụ phát hiện AI có hiệu quả không? Sinh viên đối mặt với cáo buộc gian lận không công bằng

(bloomberg.com)

1 điểm bởi GN⁺ 2024-10-21 | 1 bình luận | Chia sẻ qua WhatsApp

Khi các công cụ phát hiện AI được dùng để chấm bài tập, nếu bài viết của sinh viên bị xác định là sản phẩm do AI tạo ra, điều này có thể ảnh hưởng trực tiếp đến điểm số và phán quyết về gian lận
Moira Olmsted cho biết trong một khóa học trực tuyến của Central Methodist University năm 2023, bài tập cô nộp bị đánh giá là có khả năng do AI tạo ra và cô nhận 0 điểm
Giáo sư được cho là đã viện dẫn kết quả từ công cụ phát hiện, đồng thời trả lời rằng bài viết của Olmsted trước đó cũng từng bị gắn cờ ít nhất một lần
Khi đó Olmsted đang vừa làm việc toàn thời gian vừa nuôi con, dành tiền để theo học một chương trình từ xa tự học theo tiến độ cá nhân và bắt đầu chương trình đào tạo giáo viên
Nếu khoảng 2/3 giáo viên thường xuyên dùng công cụ phát hiện nội dung do AI tạo ra, chỉ một tỷ lệ lỗi nhỏ cũng có thể dẫn đến hậu quả lớn cho nhiều sinh viên

Trường hợp sinh viên nhận 0 điểm vì công cụ phát hiện AI

Moira Olmsted từng tạm nghỉ đại học vào giai đoạn đầu đại dịch và lập gia đình, rồi sau đó tìm cách quay lại trường
Cô làm việc toàn thời gian, chăm sóc con nhỏ và trong vài tháng đã dành tiền cho một chương trình tự học theo tiến độ cá nhân có thể học từ xa
Năm 2023, khi đang mang thai đứa con thứ hai được 7 tháng, cô đăng ký một khóa học trực tuyến tại Central Methodist University và bắt đầu học để trở thành giáo viên

Phán quyết sau khi nộp bài tập

Vài tuần sau khi học kỳ mùa thu bắt đầu, Olmsted nộp một bài viết trong môn học bắt buộc
Bài tập đó là một trong 3 bài tóm tắt bài đọc phải làm hằng tuần
Điểm cô nhận sau đó là 0 điểm
Khi Olmsted hỏi giáo sư, giáo sư được cho là đã trả lời rằng công cụ phát hiện AI đánh giá bài viết đó có khả năng do trí tuệ nhân tạo tạo ra
Giáo sư được nói là đã cho biết bài viết của Olmsted trước đó cũng từng bị gắn cờ ít nhất một lần

Các công cụ phát hiện được dùng rộng rãi và gánh nặng từ sai sót

Khoảng 2/3 giáo viên cho biết họ thường xuyên sử dụng công cụ phát hiện nội dung do AI tạo ra
Quy mô sử dụng càng lớn, ngay cả một tỷ lệ lỗi rất nhỏ cũng có thể nhanh chóng tích lũy
Nếu kết quả phát hiện dẫn đến điểm bài tập và cáo buộc gian lận, một phán quyết sai sẽ trở thành gánh nặng lớn đối với từng sinh viên

1 bình luận

GN⁺ 2024-10-21

Các ý kiến trên Hacker News

Tôi đã dạy toán trong giáo dục đại học suốt 30 năm và sắp nghỉ hưu; có một lượng gian lận khổng lồ trong các bài tập được chấm điểm mà không có giám sát trực tiếp trong lớp
Những thứ như khóa trình duyệt không ngăn được. Giải pháp duy nhất là bắt buộc thi trực tiếp có giám thị và không cho dùng bất kỳ công nghệ nào trong lúc thi, nhưng làm vậy thì sẽ không còn sinh viên nào đăng ký lớp đó. Tôi chỉ nghĩ được đến việc Higher Learning Commission bắt buộc điều này với mọi lớp học
Vấn đề lớn hơn là sinh viên không quen làm những việc cần thiết để học, mà chỉ quen làm những việc cần thiết để qua môn. Việc đó ngày càng trở thành gian lận. Ngay cả trong số sinh viên học giải tích cũng có người không xử lý được phân số. Nếu tạo ra một hệ thống thật sự ngăn gian lận, nó sẽ phơi bày rằng một tỷ lệ rất cao sinh viên đại học hiện nay chưa sẵn sàng cho giáo dục đại học thực sự. K-12 cũng phải thay đổi
- Tôi nghĩ chúng ta đã khiến chi phí thất bại quá cao, còn gian lận thì quá dễ
  Từ góc nhìn của sinh viên, điều mà tổ chức tiếp theo nhìn vào thường là điểm số, trường học, rồi ngành học, theo thứ tự đó. Nếu cái giá của việc không đạt A là bị loại khỏi các cơ hội tương lai, sinh viên sẽ chọn lớp dễ hơn hoặc gian lận để từ chối việc bị loại
  Tôi học vật lý, chọn những lớp khó mình muốn học và không gian lận, rồi tốt nghiệp với GPA 2.7; những lựa chọn như vậy có hệ quả thực tế. Tôi nghĩ giải pháp là giảm phụ thuộc vào các hình thức đánh giá dễ bị gian lận hoặc những thứ ngoài đời thực máy tính sẽ xử lý
- Ở Đức, mọi kỳ thi đều như vậy. Bài tập về nhà chỉ là điều kiện để được dự thi, hoặc bài tập/dự án chỉ có một lượng nhỏ điểm thưởng, còn điểm số được quyết định bằng kỳ thi
  Các môn bắt buộc là cần thiết để lấy bằng, nên nếu chương trình có đại số tuyến tính thì không thể “không đăng ký”. Trượt 3 lần thì bị buộc thôi học
  Đó là vì các đại học ở Đức và phần lớn châu Âu được vận hành bằng tiền thuế. Ở Mỹ, từ góc độ trường đại học, việc tiếp tục giữ chân những sinh viên trả tiền sòng phẳng là có lợi, nên họ sẽ tiếp tục đi theo con đường vừa mô tả. Đó là một dịch vụ, một cấu trúc khách hàng mua bằng cấp
- Hoàn toàn đúng, và chuyện này không chỉ giới hạn ở Mỹ
  Tôi từng học một lớp đồ họa máy tính ở đại học; nhờ các câu bonus, bộ bài tập về nhà theo nghĩa đen là ai cũng được trên 100%, còn trung vị điểm giữa kỳ thì dưới 50%. Tôi vẫn nhớ trong buổi ôn thi, khi giáo sư nhận câu hỏi, một sinh viên đã nghiêm túc đề nghị “giải thích lại toàn bộ khái niệm ma trận”
  Nói thêm, đó là môn cấp 400, ở một trong những đại học hàng đầu Canada. Chuyện đó đã hơn 20 năm trước, nên giờ chắc bằng cách nào đó còn tệ hơn
- Tôi nhớ trong một lớp toán đại học, giáo sư có cách khá độc đáo để xử lý gian lận. Ông cho dùng sách, ghi chú, và “bất kỳ chức năng máy tính nào” của TI-84
  Lý do là dù sao sinh viên cũng sẽ cố dùng các mánh đó, nên hãy cho phép và biến bài thi thành thứ miễn nhiễm với lợi thế đó. Trước mỗi kỳ thi, ông đều nói có thể dùng công cụ, nhưng “hãy học đi, sách vở, ghi chú và máy tính sẽ không cứu được các em”
  Về lâu dài, tôi nghĩ giáo dục sẽ đi theo hướng thay đổi chương trình học để các công cụ AI không đem lại lợi thế lớn, hơn là cố ngăn việc dùng công cụ AI
- Việc quen làm “những gì cần thiết để qua được” cũng đúng với phỏng vấn xin việc
  Tôi đã thực hiện hàng trăm cuộc phỏng vấn kỹ thuật với vai trò người phỏng vấn trong tuyển dụng kỹ sư phần mềm, và hiện vẫn hỗ trợ các công ty tuyển dụng với tư cách người phỏng vấn độc lập; gian lận nhiều khủng khiếp. Tôi cho rằng ở các công ty thông thường ít nhất 30%, còn ở FAANG hơn 50% là người gian lận
  Rất nhiều người chia sẻ bài kỹ thuật trong các nhóm và diễn đàn kín, rồi nhận trợ giúp dưới hình thức nào đó trong lúc phỏng vấn. Tôi liên tục thấy những bài cố tình làm phức tạp được giải theo cách tối ưu chỉ trong vài phút
Giờ đây, việc đánh giá mức độ hiểu sâu của học sinh về một chủ đề chỉ bằng bài luận viết không còn hiệu quả nữa
AI sẽ tiếp tục tồn tại, và cần có những cách mới để đánh giá kết quả học tập của học sinh. Tôi nhớ từng được nói rằng không được dùng máy tính bỏ túi trong giờ kiểm tra ở trường. Giáo viên nói: “Không thể tin rằng lúc cần nhất em lúc nào cũng có máy tính bỏ túi để dùng”, nhưng trớ trêu là giờ đây trong túi chúng ta có “máy tính bỏ túi” 24/7
Cần chấp nhận rằng thế giới đã thay đổi. Tôi chỉ mong chúng ta có thể cùng quyết định xã hội sẽ ứng phó với thay đổi đó như thế nào, chứ không bị đẩy đi một cách cưỡng ép
- Đánh giá bằng bài luận viết không phải bây giờ mới không hiệu quả, mà trước đây cũng chưa từng là một cách đánh giá hiệu quả. Nó là biện pháp cắt giảm chi phí được dùng vì các tổ chức thậm chí không thể tưởng tượng nổi chi phí dành 30 phút đánh giá trực tiếp cho từng học sinh trong từng môn học
  Mỗi lần nhìn vào khoản vay sinh viên, cũng đáng nghĩ về điều đó. Ngay cả với số tiền ấy, người học vẫn không mua được 30 phút đánh giá riêng với giáo viên cho mỗi môn; thay vào đó họ bị bắt dành nhiều thời gian hơn cho bài viết, rồi việc chấm điểm được đẩy cho trợ giảng nhận lương tối thiểu
- Chỉ dùng bài luận viết để đo lường mức độ hiểu sâu vốn đã không hiệu quả từ lâu, AI chỉ khiến nó kém hiệu quả hơn mà thôi
  Ví dụ tiêu biểu là bài luận tuyển sinh đại học. Một số học sinh có thể được cha mẹ tạo điều kiện để có những trải nghiệm trông hay ho trong bài luận, và cũng có thể thuê gia sư để “hỗ trợ” viết bài. Những thứ như chuyến đi giáo dục ở châu Phi, học hai loại nhạc cụ, huấn luyện golf 1:1
  AI chỉ khiến phần gia sư đó trở nên dễ tiếp cận và dễ chi trả hơn với nhiều tầng lớp hơn. Thật ngây thơ nếu cho rằng trước AI không hề có thị trường xám về huấn luyện viết bài luận, hay thị trường tối của dịch vụ viết thuê. Trong nhiều trường hợp, thị trường đó vẫn hoạt động tốt hơn AI
- Việc cùng nhau quyết định xã hội sẽ ứng phó với thay đổi như thế nào trên thực tế hầu như không xảy ra; kết quả được định đoạt bằng một dạng đấu tranh nào đó
  Thường là đấu tranh ôn hòa diễn ra ở tòa án, nghị viện và thị trường, nhưng vẫn là đấu tranh
  Học sinh đang được đánh giá ngay lúc này, nên nếu cần phương pháp đánh giá mới thì câu trả lời cũng cần có ngay bây giờ. Có thể quay lại các kỳ thi vấn đáp kiểu cũ, và trong chương trình tiến sĩ chúng vẫn còn được dùng. Nhưng chúng hoàn toàn không thể mở rộng quy mô. Có lẽ giáo dục đại học sẽ phải được phân bổ quyết liệt theo lượng thời gian hữu hạn có thể dành cho đánh giá giữa người với người
  Cá nhân tôi cho rằng tất cả chuyện này đều khó dự đoán và bất ổn. Nếu những người ủng hộ AI đúng — dù tôi không nghĩ vậy — thì phần lớn các lĩnh vực văn phòng và học thuật mà học sinh đang được đào tạo và đánh giá để tham gia sẽ biến mất
- Tôi cho rằng chính sách cấm dùng máy tính bỏ túi trong bài kiểm tra bản thân là rất tốt, chỉ là cách giải thích quá tệ
  Lập luận rằng không thể kiếm được máy tính bỏ túi ngay cả khi đó cũng đã vô lý, nhưng quan sát rằng việc lệ thuộc vào máy tính sẽ tước mất rèn luyện tinh thần vốn được nhắm tới là đúng. Chỉ là rất khó giải thích cho trẻ 12 tuổi rằng toán học thực sự đẹp, và các nguyên lý có hệ thống của nó thay đổi căn bản cách ta nhìn thế giới
  Bài luận cũng vậy. Tôi từng ghét viết luận và hợp lý hóa bằng đủ cách rằng sau này mình sẽ không bao giờ phải viết luận, nhưng về sau mới thấy điều mà bài luận buộc ta làm là tư duy có cấu trúc. Bài luận không phải công cụ để đánh giá năng lực ở một môn học nào đó, mà là công cụ để học; bản thân hành vi viết là một phần của việc học
  Đây là phần mà câu “trẻ con không cần tính nhẩm trong đầu” bỏ sót. Khả năng tính toán vốn là một phần, và việc học được rằng mình có thể học cách tính đó ít nhất cũng quan trọng không kém
- Ở Pháp, chúng tôi viết luận ngay trong giờ học, không điện thoại, không sách, chỉ có giấy và bút cùng cái đầu. Cách đó đến nay vẫn khả thi 100%
Điều khó chịu là dường như học sinh không có quyền được nghe vì sao AI gắn cờ bài làm của mình
Với bất kỳ quy trình nào trong đó máy tính phán xét con người, cần có quy định rằng thuật toán phải có thể giải thích chính xác vì sao nó gắn cờ người đó
Làm vậy về cơ bản sẽ giết chết các giải pháp dựa trên AI hiện nay. Lý do là không có cách nào giải thích hay hiểu vì sao nó phán đoán một bài viết có đạo văn hay không, nhưng như thế cũng ổn
- Đi xa hơn một bước, tôi cho rằng không nên để AI đánh giá con người trong bất kỳ bối cảnh nào. Vì đã được chứng minh là nó không hoạt động, và về sau cũng sẽ như vậy
  Nếu muốn biết thêm, tôi khuyên đọc cuốn sách gần đây của Arvind Narayanan và Sayash Kapoor, AI Snake Oil. Đây là một cuốn sách phê phán nhưng cân bằng, giúp nhìn rõ hơn cơn sốt AI
  https://press.princeton.edu/books/hardcover/9780691249131/ai...
- “Bài của em bị gắn cờ là đạo văn nên em được 0 điểm.” “100% là em tự viết. Em đạo văn cái gì ạ?” “Cái đó không hiện ra, nhưng vẫn 0 điểm.”
  Trong thế giới nào mà chuyện như vậy là công bằng? Ít nhất tòa án không vận hành trên tiền đề như thế
- Vấn đề này giống chuyện các hệ thống phát hiện gian lận tự động chặn tài khoản ở các công ty lớn như Google mà không cho biết lý do
  Tôi nghĩ khi chuyện như vậy xảy ra, cần có luật yêu cầu giải thích rõ ràng
- Trẻ em ngày nay chắc thật sự dễ nản lòng. Dùng AI thì bị nói là gian lận, là xấu về mặt đạo đức. Không dùng AI thì cuối cùng lại bị cáo buộc là đã dùng, hoặc bị tụt lại phía sau những người dùng
  Thời trung học, chỉ riêng việc tìm ra mình là ai đã đủ khó rồi; khi đó Kafka chỉ là bài đọc được giao mà thôi
- Yêu cầu như vậy là một phần lớn của GDPR
Tôi là consultant tại một bệnh viện đại học lớn và là người Hà Lan. Vài năm trước, trong luận án tiến sĩ, tôi nhận được nhận xét rằng “đáng lẽ nên nhờ người bản ngữ kiểm tra”
Vì vậy giờ tôi dùng ChatGPT để kiểm tra tiếng Anh. Tôi tự viết nội dung mình muốn, rồi yêu cầu nó sửa “ngắn gọn hơn, mang tính business hơn, nhưng đừng quá kiểu Mỹ”. Vì mặc định của nó quá nhiệt tình như bồi bàn Mỹ
9 lần trong 10, nó diễn đạt điều tôi muốn nói tốt hơn tôi viết, với ít từ hơn và tiếng Anh hay hơn. Tôi không nghĩ thời gian viết báo cáo giảm đi, nhưng kết quả tốt hơn nhiều so với thứ tôi có thể tự làm một mình
Máy phát hiện AI có thể báo động, nhưng thứ đó vô dụng chẳng khác gì máy phát hiện trình kiểm tra chính tả. Nó là mô hình ngôn ngữ lớn, không phải mô hình sự thật lớn. Nếu là giáo viên thì chẳng phải nên giỏi phát hiện những thứ nhảm nhí sao
Nếu xem báo cáo của sinh viên, có lẽ tôi sẽ phản hồi thế này. Làm ơn hãy dùng ChatGPT để kiểm tra ngôn ngữ, nhưng làm ơn hãy kiểm chứng sự thật bằng cách khác
- Hồi lớp 11, giáo viên tiếng Anh nâng cao của tôi cũng dạy AP English, và tất cả học sinh lớp 11 phải viết bài luận cuối kỳ. Giáo viên cho học sinh lớp 12 trong lớp AP đọc lướt bản nháp của chúng tôi và góp ý
  Cả hai lớp gần như được một buổi học miễn phí, và điều đó thật sự hữu ích. Năm sau tôi cũng làm việc tương tự. Tôi còn nhớ khi đó máy tính còn tương đối hiếm, đánh máy cũng là một kỹ năng phải học riêng, nên phần lớn bản nháp là viết tay
  Từ lâu đã có câu rằng nếu thật sự muốn học một chủ đề nào đó, hãy thử dạy nó. Kiểu trao đổi qua lại như vậy hoạt động tốt, và phần còn lại của xã hội nhìn chung cũng vận hành như thế. Dùng AI có lẽ cũng khá tương tự, nhưng tôi nghĩ người khác vẫn tốt hơn. AI sẽ không chặn bạn ngoài hành lang và nói “này, tao hoàn toàn lạc mất ở đoạn giữa bài của mày, rốt cuộc là gì vậy”, mà đôi khi những lời như thế lại thật sự hữu ích
- LLM rất hữu ích trong việc cải thiện mạch lập luận và cấu trúc, không chỉ với người không bản ngữ mà cả với người bản ngữ tiếng Anh
  Làm cho bài viết dễ tiếp cận hơn bằng ngôn ngữ rõ ràng và lập luận được tổ chức tốt là một dịch vụ có giá trị cho độc giả, và tôi có thiện cảm với những người tận dụng LLM cho việc đó. Tôi cũng làm vậy
- Về thiết kế thì nó không phải là mô hình sự thật lớn, nhưng kho ngữ liệu huấn luyện chắc chắn chứa rất nhiều “sự thật”. Chính xác hơn là những khẳng định mà tác giả văn bản gốc đã đưa ra
  Một mô hình cố gắng xuất ra văn bản phi hư cấu về một chủ đề cụ thể thực ra sẽ gặp nhiều hơn các mẫu khẳng định tình cờ là đúng, hoặc ít nhất là có hình thức giống các khẳng định đúng và không có dấu hiệu rõ ràng nào để phân biệt
  Tất nhiên đôi khi nó đi chệch hướng và tạo ra ảo giác. Khi chuyện đó xảy ra, sinh viên không kiểm chứng đầu ra thì gặp xui thôi. Và nếu một trong các động cơ gian lận là không hiểu đủ nội dung để kiểm chứng đúng cách, thì số sinh viên như vậy hẳn là khá nhiều
Trường của con tôi lắp một máy phát hiện vũ khí mới mà học sinh phải đi qua khi vào trường, và họ nói nó dựa trên “AI”. Nhà trường khá tin vào AI đó
Nhưng AI lại nhận diện laptop Lenovo do trường cấp là vũ khí. Vì vậy mọi đứa trẻ đều bị đánh dấu. Thay vì ngừng dùng công cụ ngu ngốc này, họ bắt học sinh lấy laptop ra trước khi đi qua máy quét
Có vẻ như những người không đủ thông minh đang mua các sản phẩm “AI”, tin rằng chúng sẽ làm được việc họ muốn, nhưng thực tế thì không hoạt động
- Đọc chuyện này nghe như đang sống trong một cơn ác mộng phản địa đàng
- Chính những lĩnh vực như thế này mới cần quy định về AI. Độ chính xác phải được công khai theo một định dạng chuẩn như bảng thành phần dinh dưỡng
  Những người mua hệ thống bằng ngân sách công nên bị buộc phải xác định một kế hoạch tốt để xử lý các trường hợp dương tính giả và âm tính giả dự kiến, dựa trên precision và recall được quảng cáo
- Nếu vậy có vẻ học sinh cũng có thể khoét ruột laptop rồi giấu vũ khí mang vào
- Có phải Evolv không? https://www.theverge.com/2024/4/2/24119275/evolv-technologie...
- Đôi khi một công cụ không tối ưu được dùng để né kiện tụng
Việc người lớn chỉ trong 1–2 năm đã bắt đầu tin bất kỳ thuật toán nào là khá điên rồ. Họ không biết nó hoạt động thế nào, không thể giải thích, cũng chẳng quan tâm, chỉ mặc định là nó hoạt động. Về cơ bản là phép thuật. Nếu nó nói đó là gian lận thì đó thành gian lận, và bạn chẳng làm được gì
Điều tôi muốn nhấn mạnh là đây không chỉ là chuyện tin vào phép thuật, mà là ngày nay người ta làm những việc lố bịch quá thản nhiên mà không phải chịu trách nhiệm. Trước đây ở trường, có lần tôi lần đầu thấy bài tập của một môn thú vị và làm nghiêm túc, rồi bị nghi “gian lận”. Nghe nói chắc chắn không đời nào tôi tự làm được thì xúc phạm thật, nhưng dù sao tôi vẫn được điểm. Nếu không chứng minh được thì giáo viên nghĩ gì cũng mặc, cứ ký tên rồi biến đi, kiểu vậy; và đó cũng là bài tập cuối cùng tôi làm cho môn đó
Ngược lại, nếu nội dung bài này đúng, thì giờ giáo viên không cần chứng minh gì cả. Việc đồng xu ra mặt ngửa được coi là bằng chứng đầy đủ. Dường như mọi người đều chấp nhận kiểu “trường có hệ thống như vậy thì biết sao được”. Điên thật
- Có một quan sát hay về vấn đề của mạng nơ-ron và đầu ra sinh sinh. Chúng là chương trình chạy trên máy tính
  Hơn 30 năm qua, chúng ta đã huấn luyện mọi người rằng máy tính tạo ra đầu ra chính xác, đúng đắn và có thể tái lập. Nhưng các công ty mạng nơ-ron lại tạo ra máy phát ký hiệu ngẫu nhiên, và chủ động che giấu việc có tính ngẫu nhiên được lập trình bên trong chương trình đó
  Gần đây lại có một vụ ở tòa án Mỹ xuất hiện văn bản sinh ra tự động, lần này có vẻ không có ác ý. Điểm cốt lõi là nguyên đơn yêu cầu mạng nơ-ron tính toán tài chính lịch sử về giá trị bất động sản, rồi tin ngay “vì đó là máy tính”. Máy tính luôn đúng, mạng nơ-ron chạy trên máy tính nên cũng luôn đúng, kiểu vậy. Chẳng bao lâu nữa lối nghĩ này sẽ lan tới mọi gia đình trên thế giới. Khi đó có lẽ chúng ta sẽ nhớ sự thiếu trung thực và tuyên truyền của truyền thông. Ít nhất trước đây còn có thể phần nào phân biệt được nguồn tin có đang cố ý nói dối hay không
- Không có gì đáng ngạc nhiên. Điều vừa mô tả là cách hơn 95% dân số tiếp cận công nghệ nói chung
  Hiếm khi họ thấy khó chịu vì sự thiếu hiểu biết đó, và cũng gần như không có ham muốn học dù chỉ những điều cơ bản. Có những người lẽ ra bắt buộc phải biết, nhưng với tôi điều đó rất khó hiểu
- Người ta tin vào hệ thống vì những người khác tin vào hệ thống
  Dù hệ thống đó là tòa án dị giáo săn phù thủy, máy móc, hay Gulag của Liên Xô cũng không quan trọng. Hệ thống nói là có tội, và hệ thống không thể sai, kiểu vậy
  Kafka chắc phải trở mình dưới mồ
- Đây không phải bug, mà là feature
  Với cách này, mỗi người ở vị trí của mình có thể nhào nặn xã hội theo ý muốn. Nếu anh chị em của một học sinh từng là kẻ rắc rối, có thể nói “nhà đó vốn vậy, cứ hành nó đi”. Nếu không thích chủng tộc, giới tính, hay xu hướng tính dục của học sinh, “chatGPT” sẽ cung cấp một phương tiện dễ dàng để khiến đời sống học đường của em đó khó khăn hơn
- Các công ty AI đáng lẽ phải dự đoán và hướng dẫn về sự hỗn loạn sẽ ập đến với các nhà giáo dục
Con gái tôi nộp một bài luận cho trường trực tuyến, rồi bị cáo buộc là bài viết do AI viết chỉ vì phần mềm của trường nói vậy. Người mẹ đã ngồi xem con gái viết bài.
Tôi cứ nghĩ việc không thể xác định một văn bản có phải do AI tạo ra hay không là kiến thức phổ thông rồi, nhưng có vẻ nhà cung cấp phần mềm hoặc là thiếu hiểu biết, hoặc đang nói dối, còn ban quản lý nhà trường thì tin vào điều đó.
- Gợi ý nhé: họ không thiếu hiểu biết đâu.
- Tôi nghĩ những chuyện như thế này sẽ sớm dẫn đến tranh chấp pháp lý. Như người khác đã nói, cứ chạy phần mềm phát hiện AI trên các bài luận trước thời ChatGPT để xem độ chính xác là biết.
  Còn có vấn đề bài luận của học sinh trong phổ tự kỷ bị gắn cờ một cách mất cân đối, nên cũng có khả năng đây là một dạng vi phạm dân quyền.
- Tôi cho rằng chuyện không thể xác định văn bản do AI tạo ra gần như là lẽ thường. Nhưng giấc mơ về công cụ phát hiện AI trong giới giáo dục quá mạnh, đến mức họ cứ muốn tin rằng “công ty lần này đã giải được bài toán”.
  Họ tự thử đơn giản, thấy có vẻ phần lớn là hoạt động, rồi kết luận tuyên bố của công ty là đúng. Vấn đề là mọi phép thử đó đều theo hướng cho bài do AI viết lọt qua như thể do người viết, chứ không phải hướng ngược lại.
  Những công cụ này có tỷ lệ dương tính giả khác 0, nên chắc chắn sẽ có một học sinh tội nghiệp dành nhiều tuần cho bài luận cuối kỳ dài 20 trang bị bắt vì dùng AI. Với đứa trẻ đó sẽ không có cứu xét hay kháng cáo gì cả, vì nhà trường đã chi nhiều tiền cho công cụ phát hiện AI và sẽ tin rằng nó đúng.
- Tôi tự hỏi sau một, hai thế hệ kể từ khi con người quyết định rằng năng lực tư duy thông thường không còn cần thiết nữa, lẽ thường sẽ còn lại ít đến mức nào.
  Cũng giống như việc ta đã quyết định rằng máy tính bỏ túi khiến ta không cần quan tâm đến khả năng làm số học nữa.
- Cuối cùng, một thành phần hay nhà cung cấp nào đó nằm sâu trong stack sẽ đưa ra câu trả lời, và tổ chức sẽ dễ dàng chỉ vào “hệ thống”, trong khi được che chắn đủ xa khỏi quyết định khó khăn.
  Ở Mỹ chuyện này xảy ra suốt. Phản hồi từ hệ thống xác minh địa chỉ được chấp nhận mà không cần chủ tài khoản phê duyệt, khiến địa chỉ bị đổi tùy tiện. Gọi lên tổng đài thì họ nói “hệ thống báo địa chỉ không đúng”. Như thể hệ thống biết rõ hơn tôi, DMV hay giấy tờ nhà rằng tôi đã sống ở đâu suốt 5 năm qua. Nếu tỷ lệ lỗi đủ thấp, ở Mỹ người ta cứ thế chấp nhận.
  Rồi mọi chuyện còn tệ hơn. Có thể không phải tỷ lệ lỗi thấp, mà là tỷ lệ lỗi cao trong một nhóm nhỏ cụ thể. Khi đó bạn sẽ thấy vị trí của mình trong xã hội. Cứ hỏi những người da nâu xem việc đi máy bay giai đoạn 2003–2006 vui vẻ đến mức nào là biết. Ở New York, nếu tổ hợp họ và mã ZIP bị khớp sai, bạn còn không thể thuê Citibike vận hành trên đất công.
  Chuyện này cũng sẽ như vậy. Trừ khi một vụ kiện lớn kiểu ACLU phơi bày nó, thiệt hại nhiều khả năng sẽ tiếp diễn cho đến khi được khắc phục. Có lẽ những đặc điểm tinh vi trong phong cách ngôn ngữ, có thể là vô tình, sẽ được dùng làm trigger. Những người thuộc “nhóm trong” không bị ảnh hưởng sẽ khẳng định đó là một hệ thống công bằng, còn những người khác sẽ phải tự biện hộ trước một hộp đen và gánh trách nhiệm chứng minh.
Một trong các giáo viên của con tôi gửi thông báo cảnh báo học sinh rằng thầy/cô sẽ kiểm tra mọi bài luận bằng phần mềm phát hiện AI và nếu bị bắt thì sẽ chịu hình phạt gì.
Một bạn cùng lớp đem chính thông báo cảnh báo của giáo viên đó đưa vào công cụ kiểm tra AI, thì nhận kết quả dương tính là do AI tạo ra.
- Giọng mặc định của ChatGPT và giọng mặc định của văn phong nhà trường/học thuật không hoàn toàn giống nhau, nhưng trong không gian vector khổng lồ của những thứ như vậy thì chúng rất gần nhau.
  Các LLM hẳn đã tiêu thụ một lượng khổng lồ loại văn bản này. Dù ở phổ thông hay đại học, không có gì lạ khi những báo cáo theo khuôn mẫu, vừa khít yêu cầu và thường phải đạt điểm tốt, lại có xác suất cao bị xem là do công nghệ kiểu GPT tạo ra.
  LLM cũng đã học rất nhiều đề cương môn học và tài liệu cơ bản dành cho giáo viên, nên những trao đổi ngắn giữa giáo viên-phụ huynh hoặc giáo viên-học sinh sẽ khó thoát khỏi vùng hấp dẫn văn phong mà LLM hay dùng.
- Thiếu mất phần quan trọng nhất rồi. Sau đó chuyện gì xảy ra? Lý trí có thắng không?
  Tôi tò mò vì vấn đề tạo văn bản “AI” này không phải là vấn đề kỹ thuật, mà là vấn đề con người 101%.
- Tôi hy vọng cơn náo động lịch sử này sẽ sớm kết thúc, và chúng ta sẽ thích nghi bằng cách rời xa kiểu bài tập về nhà bị chấm điểm.
  Tỷ lệ dương tính giả 4% là cao đến vô lý nếu điều đó có thể đồng nghĩa với trượt môn hoặc bị đuổi học. Lại càng vô lý hơn vì những người gian lận nghiêm túc có thể vượt qua trong 2 phút bằng prompt đặt trước kiểu “hãy viết theo phong cách của người này người kia”.
- Tôi nghĩ bản thân sự thật đó không cần phải bận tâm.
  Nó giống như: “Giáo viên cảnh báo rằng sẽ đối chiếu mọi bài luận với bài luận của các học sinh khác để xem có giống nhau không, và nếu bị phát hiện thì sẽ bị phạt. Một học sinh tìm Google thì thấy câu hỏi bài luận xuất hiện như ví dụ trong một cuốn sách.”
  Một bên hoàn toàn hợp lý, bên kia thì không. Tất nhiên vẫn có vùng xám. Dùng ChatGPT cho một số mục đích nào đó không phải là sao chép, cũng có thể nói đó là việc trẻ em học cách dùng công cụ. Nhưng nếu giao 95% bài luận cho nó làm thì đó là sao chép.
Nếu bạn là người xử lý bài tập của sinh viên hoặc đọc hồ sơ xin việc, việc nhanh chóng nhận ra bài viết do AI tạo đã trở nên rất dễ
Bài viết trông như dùng cùng một khung chung, chỉ thay từ ngữ. Còn có một hiện tượng mà tôi gọi là “từ của tuần”: một công cụ AI nào đó bị ám ảnh với một từ tiếng Anh nhất định, thường là một từ lạ, và dùng nó mọi lúc có thể. Không mất lâu để nhận ra câu nói rằng đây là tự động hoàn thành được tiêm steroid là đúng
Nhưng lập trình để máy tính làm được việc này thì không dễ. Ở công việc trước, tôi từng làm với công cụ phát hiện đạo văn, và nhanh chóng nhận ra những công cụ đó tệ đến mức nào. Tôi cũng biết chúng dễ bị qua mặt ra sao, nhưng đó là chuyện khác. Vì giảng viên cũng sớm biết công cụ rất lộn xộn, nên khi một sinh viên bị cáo buộc đạo văn phản bác lại, cáo buộc thường âm thầm được rút lại
- Ở trường kỹ thuật, tôi học giao tiếp kỹ thuật như một môn bắt buộc. Giáo sư hiểu rằng người chọn ngành kỹ thuật không nhất thiết thích sự tinh tế của văn chương hay, nên bài tập rất máy móc
  Kiểu như “hãy viết về một chủ đề kỹ thuật, chủ đề nào cũng được, 1500 từ, đây là rubric chấm điểm”. Trong rubric có các mục như “sử dụng câu giới thiệu chủ đề của đoạn”, và kết quả là phải viết thứ văn xuôi cực kỳ công thức
  Tôi không biết nó có biến người ta thành người truyền đạt xuất sắc hay không, nhưng tôi nghĩ nó rất hiệu quả trong việc kéo những người giao tiếp rất kém lên mức tối thiểu cơ bản. Nó cũng hiệu quả với một số bài viết khác, một phần vì càng công thức thì nghiên cứu sinh chấm bài đang quá tải càng thích
  Một sinh viên đủ kỷ luật có thể trông giống ChatGPT, và cái giá của cáo buộc sai là rất lớn
- Tôi tự hỏi khi nào sẽ có sinh viên kiện giảng viên về tội phỉ báng vì bị cáo buộc oan là đạo văn bằng AI
- Chẳng phải điều đó có nghĩa là dễ bắt những người thậm chí hầu như không cố gắng che giấu sao?
  Tôi cũng có thể đưa kho bài viết của mình vào ChatGPT và bảo nó viết theo phong cách của tôi
- Con người cũng vậy. Nhiều người có cụm từ ưa dùng hoặc từ ngữ mà họ dùng thường xuyên hơn hẳn người khác
- Vợ/chồng tôi không phải người bản ngữ tiếng Anh. Cô ấy/anh ấy nói lưu loát, nhưng từ khi có ChatGPT, việc dán một đoạn văn vào và nhận phiên bản tốt hơn trở nên rất hữu ích. Không cần nhờ tôi viết lại như trước nữa
  Tuy vậy, đôi khi khi cô ấy/anh ấy gửi một câu nào đó, tôi đoán được 100% liệu trước đó nó đã đi qua AI hay chưa. Khi đã quen với cách nó dựng cấu trúc câu thì rất dễ nhận ra. Nếu ở vị trí có thẩm quyền như giáo viên, phần khó nhất có lẽ là chứng minh điều đó
Tôi thấy khó hiểu phần lớn các bình luận ở đây
Hồi học phổ thông, vì không được dùng điện thoại trong giờ học nên không thể gian lận. Bài tập trên phiếu hay quiz cũng vậy, kể cả các bài thi trắc nghiệm, vấn đáp và tự luận
Nhưng các luồng thảo luận phía trên nói như thể phải thiết kế lại toàn bộ hệ thống trường học, và nhiều người đề xuất dựa vào thi vấn đáp và thi có giám sát. Tôi không rõ chúng giải quyết thêm chính xác điều gì so với một bài thi OMR đơn giản trong lớp, nơi giáo viên kiểm tra để đảm bảo học sinh không dùng điện thoại
- Bài thi mà giáo viên kiểm tra để đảm bảo không dùng điện thoại, đó chính là thi có giám sát
- Ở phổ thông của bạn hoàn toàn không có bài tập về nhà mang tính đánh giá tổng kết sao?
  Ở nhiều nơi, đặc biệt là Mỹ, gần như không có thi có giám sát, và một phần khá lớn điểm tổng kết đến từ bài tập môn học. Cùng với việc số hóa giáo dục diễn ra không thể đảo ngược, đó là cách chúng ta đi đến tình trạng hiện nay
  Lên bậc đại học còn có những dự án như bài luận hoặc báo cáo cuối kỳ, quá lâu để hoàn thành trong lớp. Những dự án này từ trước đã dễ bị viết thuê hơn là đạo văn, và bạn sẽ ngạc nhiên nếu biết chuyện đó thực sự phổ biến đến mức nào ngay cả ở các trường danh tiếng. LLM chỉ hạ thấp rào cản và khiến nó phổ biến hơn thôi
  Đây là vấn đề thật sự, và người ta gian lận tinh vi hơn rất nhiều so với suy nghĩ ban đầu
- Ngày xưa người ta cũng nhập ghi chú vào máy tính đồ thị hoặc giấu thứ gì đó trong tay áo
  Điện thoại không phải phương tiện gian lận duy nhất, và thực ra có thể còn khó dùng lén hơn so với các cách cũ
- Tôi đã thấy hàng trăm sinh viên đại học gian lận thành công bằng điện thoại trong giờ học

Các công cụ phát hiện AI có hiệu quả không? Sinh viên đối mặt với cáo buộc gian lận không công bằng

Trường hợp sinh viên nhận 0 điểm vì công cụ phát hiện AI

Phán quyết sau khi nộp bài tập

Các công cụ phát hiện được dùng rộng rãi và gánh nặng từ sai sót

Bài viết liên quan

1 bình luận

Các ý kiến trên Hacker News