4 điểm bởi GN⁺ 2025-12-16 | 2 bình luận | Chia sẻ qua WhatsApp
  • Văn phong tiếng Anh trang trọng được hình thành trong hệ thống giáo dục Kenya liên tục bị cho là trông giống văn bản do AI tạo ra
  • Quá trình rèn luyện mang tính cấu trúc trong dạy viết tiếng Anh nhấn mạnh sự cân bằng câu chữ, mạch lập luận và cách dùng từ nối, từ đó tạo ra kết quả tương tự lối viết của AI
  • Văn phong này là di sản của nền giáo dục tiếng Anh kiểu Anh thời thuộc địa, và đã được duy trì như một biểu tượng của địa vị xã hội và học thức
  • Bài viết chỉ ra vấn đề thiên lệch của công cụ phát hiện AI và mô hình ngôn ngữ khi đánh giá bài viết của người không phải bản ngữ là “phi con người”
  • Tác giả nhấn mạnh rằng điều bộc lộ qua lối viết không phải là máy móc mà là sản phẩm của lịch sử, giáo dục và bản sắc ngôn ngữ

Hiểu lầm giữa AI và lối viết của con người

  • Bài viết bắt đầu từ trải nghiệm tác giả nhận được phản hồi rằng bản đề xuất của mình “trông như do ChatGPT viết”
    • Tác giả bị đánh giá là “thiếu chất người” chỉ vì văn phong có cấu trúc và logic
  • Nhiều cây bút khác cũng gặp phản ứng tương tự, và điều này gắn liền với định kiến đối với người viết không phải bản ngữ
  • Tác giả giải thích rằng lý do văn phong của mình giống AI là vì AI đã học từ chính phương thức giáo dục của họ

Sự hình thành của giáo dục tiếng Anh kiểu Kenya

  • Bài thi viết tiếng Anh trong KCPE (Kỳ thi Chứng chỉ Giáo dục Tiểu học Kenya) là cốt lõi của quá trình rèn luyện viết
    • Để đạt điểm cao trong bài thi 40 điểm, học sinh phải nắm được vốn từ phong phú và cấu trúc câu phức
  • Các quy tắc viết có thể tóm gọn thành ba điều
    • Mở đầu bằng tục ngữ hoặc một câu mạnh, dùng từ vựng đa dạng, duy trì cấu trúc hoàn chỉnh
  • Giáo viên đóng vai trò như “thuật toán nguyên bản” dùng bút đỏ để sửa ngữ pháp và cấu trúc
  • Việc rèn luyện này nhấn mạnh cách tổ chức câu chữ logic và cân đối, và tiếp tục kéo dài ở bậc trung học lẫn đại học

Di sản thuộc địa và thứ bậc ngôn ngữ

  • Giáo dục tiếng Anh ở Kenya bắt nguồn từ hệ thống ngôn ngữ của Đế quốc Anh
    • Đề cao tính chuẩn xác ngữ pháp và sự trang trọng dựa trên chuẩn ‘Queen’s English’
  • Ngay cả sau độc lập, ngôn ngữ này vẫn được duy trì như ngôn ngữ chính thức và biểu tượng của địa vị xã hội
    • Việc sử dụng tiếng Anh trau chuốt trở thành tiêu chí phân biệt trình độ học vấn và tầng lớp
  • Kết quả là kho văn phong trang trọng khổng lồ mà AI học được mang hình thức tương tự sản phẩm của nền giáo dục tiếng Anh kiểu Kenya

Thiên lệch và giới hạn của công cụ phát hiện AI

  • Công cụ phát hiện AI phán đoán dựa trên ‘perplexity (mức độ dễ đoán)’‘burstiness (mức độ đa dạng độ dài câu)’
    • Cấu trúc câu dễ đoán và nhịp điệu đều đặn bị xem là phi con người
  • Nhưng giáo dục kiểu Kenya lại chính là nơi coi văn phong dễ đoán và cân đối như một lý tưởng
  • Kết quả nghiên cứu cho thấy các công cụ này có khả năng cao phân loại nhầm bài viết của người không phải bản ngữ là nội dung do AI tạo ra
  • Điều đó phơi bày thiên lệch kỹ thuật loại trừ sự đa dạng ngôn ngữ

Định nghĩa lại tính con người và ngôn ngữ

  • Bài viết của các tác giả Kenya là kết quả của giáo dục, lịch sử và văn hóa chứ không phải của máy móc
  • Tác giả phê phán thực tế rằng tiêu chuẩn của “lối viết mang tính con người” đang bị giới hạn vào kiểu diễn đạt không trang trọng và đậm chất Mỹ
  • Các cây bút ở Nairobi, Lagos, Mumbai và nhiều nơi khác cũng chia sẻ truyền thống viết đề cao độ chính xác và tính logic
  • Nhận định rằng một bài viết “trông giống AI” thực chất là góc nhìn không nhận ra những hình thức khác của tính người
  • Kết luận của bài viết khép lại bằng một lời khẳng định: đây chính là lối viết của người Kenya, và nó đã tồn tại từ rất lâu

2 bình luận

 
GN⁺ 2025-12-16
Ý kiến trên Hacker News
  • Thế hệ chúng tôi đã học những luật bất thành văn của việc viết được truyền từ giáo viên sang học trò
    Câu đầu tiên luôn phải mở bằng một câu tục ngữ hoặc một câu thật mạnh, và thay vì từ ngữ bình thường thì phải dùng những cách diễn đạt như strode purposefully
    Nhưng rồi khi học viết ở đại học, tôi dần bị đẩy sang phía câu đơn giản và cách diễn đạt ngắn gọn
    Giờ tôi cảm thấy văn phong kiểu Hemingway là lý tưởng. Văn phong hoa mỹ của ChatGPT ngược lại chỉ gây mệt mỏi
    Tôi công nhận năng lực của tác giả, nhưng cá nhân tôi thích lối viết đơn giản và rõ ràng hơn

    • Nỗi ám ảnh phải viết câu ngắn đã phá hỏng văn xuôi tiếng Anh
      Với đa số mọi người thì sự đơn giản là có ích, nhưng xu hướng xem câu dài, dấu chấm phẩy hay từ vựng tinh tế là “văn dở” mới là vấn đề
      Thái độ đó cản trở sự phát triển của cả người đọc lẫn người viết
      Dù vậy, những cách nói như proceeded to thì vẫn là rác. Bắt học sinh phải cố dùng từ ngữ “trông thông minh” là kiểu giáo dục tệ hại nhất
      Vợ tôi là nhà văn, và cô ấy bảo trong fanfic hay tiểu thuyết ngôn tình, từ strode xuất hiện nhiều một cách bất thường. Việc ai cứ hễ đi bộ là lại “sải bước đầy tự tin” đúng là một dấu hiệu rất nghiệp dư

    • Trong phong cách viết có ẩn chứa tín hiệu giai cấp
      Như bài viết nói, thứ tiếng Anh chúng ta học là “Queen’s English” của thời đế quốc, tức là ngôn ngữ của quyền lực
      Việc học vẻ đẹp hình thức của câu chữ không chỉ để vượt qua kỳ thi mà còn là hành động chứng minh mình là “người văn minh”
      Mốt viết lách cũng giống chu kỳ thời trang trong xã hội. Khi văn phong cầu kỳ trở nên đại chúng, tầng lớp thượng lưu lại phân biệt mình bằng lối viết đơn giản
      Văn phong tiết chế kiểu Hemingway giống như “chiếc quần jeans rách giá 1000 đô”, kiểu chỉ người dư dả mới cố tình tỏ ra giản dị được

    • Tôi từng làm ở một trong Big Three, và văn phong của ChatGPT giống hệt văn phong báo cáo tự đánh giá mà tôi học trong công ty
      Chìa khóa để thăng tiến là gói ghém “câu chuyện” cho hay chứ không phải thành tích thực tế

    • Có phải bạn là người Mỹ không? Ngay cả trong thế giới nói tiếng Anh thì cũng có khác biệt văn hóa giữa Anh và Mỹ khá lớn
      Người Mỹ ít màu mè và thẳng thắn hơn, trong khi tiếng Anh kiểu Anh vẫn có xu hướng hoa mỹ và trang trí hơn
      Theo cảm nhận của tôi thì vốn từ của người Anh đang giảm dần qua từng thế hệ

    • Viết lách có hai mục đích
      (1) Viết để truyền đạt ý tưởng — càng đơn giản càng tốt. Như các bài luận của Paul Graham, thông tin đi vào đầu gần như không ma sát
      (2) Viết để tự biểu đạt — văn phong hoa mỹ và giàu tính nghệ thuật sẽ phù hợp hơn
      Như David Foster Wallace nói, cái đầu là kiểu viết giao tiếp như trò chuyện, còn cái sau là kiểu nhật ký hét lên rằng “đây là tôi!”

  • Điều thú vị là một phần đáng kể dữ liệu huấn luyện của LLM đã được tuyển chọn ở Kenya
    Nếu dữ liệu được tạo ở Nhật, có khi ChatGPT đã dùng những đuôi câu kiểu Nhật như “Don’t you agree?”
    Bài liên quan

    • Ảnh hưởng của tác giả sách giáo khoa người Ấn Độ Malkiat Singh là rất lớn
      Sách của ông được dùng làm giáo trình chuẩn ở Kenya, và khi các học trò của ông trở thành người tuyển chọn dữ liệu cho LLM, văn phong đó cũng thấm vào AI trên toàn thế giới
      Wiki về Malkiat Singh

    • (Ngắn gọn) Có vẻ đây là chuyện không tránh khỏi

    • Có lẽ 樣 đang chuẩn bị cho meme “ChatGPT (Japan)” đây XD

    • Nhưng gán nhãn dữ liệu là chuyện khác với dữ liệu huấn luyện để sinh văn bản của LLM. Có rất nhiều hiểu lầm ở điểm này

  • Tôi đã đọc style guide của City News Bureau ở Chicago năm 1897, và có rất nhiều quy tắc thú vị
    Ví dụ như đừng nhầm night với evening, và đừng dùng very một cách không cần thiết
    Những quy tắc chi li như vậy cho thấy cảm quan ngôn ngữ của thời đó

    • Tham khảo thêm thì LWN đến giờ vẫn giữ quan điểm tránh dùng very
  • Trong mắt tôi, văn phong của bài này trông hoàn toàn khác ChatGPT
    Nhiều người xem việc dùng em-dash (—) là dấu vết của AI, nhưng đó là tín hiệu khá yếu
    Ngược lại, ChatGPT thường tạo ra giọng điệu cường điệu và một thứ “sự hùng vĩ rỗng tuếch”
    Nếu so trực tiếp các đoạn văn thì bản AI hoa mỹ hơn nhưng lại kém chân thành hơn

    • Bài này có sức cuốn hút. Phần lớn đầu ra của GPT chỉ qua một đoạn là tôi đã mất tập trung
      Đọc xong có cảm giác chẳng đọng lại thông tin gì

    • Khác biệt giữa LLM và con người nằm ở khả năng dùng rất nhiều từ mà chẳng nói gì cả

    • Nếu đưa cho GPT một câu vốn đã được viết tốt rồi và bảo nó “cải thiện”, đương nhiên nó chỉ có thể làm câu đó dài dòng hơn
      Bản gốc có trang trí về mặt cấu trúc nhưng ý nghĩa vẫn sống động. Văn bản do AI viết thì mật độ thông tin thấp và gây chán

    • Đi săn em-dash một cách mù quáng là hành vi của những người không hiểu ngữ pháp

  • Nghệ sĩ hay YouTuber cũng đang gặp cùng một vấn đề
    Hiện tượng bị hiểu lầm chỉ vì trông giống AI ngày càng nhiều
    Thật sự có vẻ sẽ có cả diễn viên lồng tiếng mất việc chỉ vì giọng họ giống giọng AI

    • Tôi cũng từng đăng video Factorio, và một vài người xem để lại bình luận rằng “giọng AI nghe khó chịu thật”
      Trong khi thực ra tôi tự nói, thậm chí cuối video còn lộ mặt, vậy mà họ vẫn nói thế
      Giọng AI thiếu cảm xúc và phát âm gượng gạo nên nhận ra rất nhanh
      Dạo này có nhiều video hướng dẫn kiểu “rỗng nội dung” chỉ đơn giản là đọc nguyên xi kịch bản do AI viết
      Nên giờ tôi chỉ xem video của những creator mà tôi tin tưởng
      Link video của tôi

    • Nếu ảnh khuôn mặt người thật bị dùng trái phép trong tạo ảnh AI, thì Pierce Brosnan chắc nên là người được bồi thường đầu tiên

  • Trong nhóm tôi cũng có một đồng nghiệp nói chuyện như ChatGPT
    Trên WhatsApp và Zoom, cách nói của anh ấy quá máy móc, nên tôi hỏi Meta AI thì nó trả lời rằng “trông như văn bản do AI viết”
    Nhưng anh ấy nói thực ra không dùng AI, và giờ nghĩ lại thì tôi thấy điều đó cũng có thể đúng

    • Nhưng giao việc nhận diện AI cho AI thì vô lý. Chẳng khác nào tự hỏi chính nó

    • Tôi cũng từng có trải nghiệm kiểu “ChatGPT viết giống tôi”
      Tôi hay dùng danh sách và định dạng, và thích kiểu viết thân thiện với người khó đọc chữ
      Nhìn lại ghi chú tôi viết năm 2019 cũng đã có cảm giác giống ChatGPT rồi
      Tôi còn cố tình thêm lỗi chính tả hoặc trộn vào văn phong phi chuẩn nữa

    • Nói lạnh lùng thì nếu bài viết của bạn không phân biệt được với đầu ra mặc định của ChatGPT thì đó là bài viết tệ
      Dù thật sự không dùng AI thì kiểu văn đó vẫn cần cải thiện
      Trong giáo dục, chỉ nên đánh giá cao những ai viết tốt hơn AI

    • Chỉ trích đồng nghiệp vì “cố tỏ ra thông minh như ChatGPT” thì cũng hơi buồn cười

  • Cuộc tranh luận về em-dash khá thú vị
    Trước đây tôi chỉ thấy nó khi Word tự động thay thế, chưa từng tự gõ bao giờ
    Đây là lần đầu tôi biết trên Windows phải nhấn Alt+0151
    Vì thế với tôi, em-dash vẫn là một ký hiệu xa lạ
    Giờ thì tôi hiểu rằng mọi người viết trong những môi trường khác nhau

    • Thật ra trên HN đã có người thích dùng em-dash từ trước cả thời ChatGPT
      Bảng xếp hạng người dùng em-dash trên HN

    • Tôi bật Typo mode trong emacs để tự động dùng en/em dash và dấu ngoặc kép thông minh

    • Tôi đã phân tích dataset của HN, và ngay cả sau khi AI lan rộng thì lượng dùng em-dash cũng không tăng
      Tuy nhiên, cấu trúc câu ngoặc chen dày đặc quá mức đúng là đặc trưng của AI hoặc văn viết non tay

    • Đã có lần trong ứng dụng Ghi chú trên macOS, -- tự động bị đổi thành làm lệnh terminal chạy lỗi

  • Tôi rất ấn tượng với trình độ tiếng Anh của OP
    Phần lớn người không phải bản ngữ học tiếng Anh văn chương ở trường nên quen với văn phong trang trọng
    Tôi cũng được dạy như vậy ở Pháp, nhưng sau khi làm trong ngành IT thì đã chuyển sang kiểu tiếng Anh trực diện của Mỹ
    Bài này không phải do ChatGPT viết. Nó không có trang trí thừa thãi và mật độ thông tin rất cao
    Với văn bản AI thì tôi thường bỏ qua hơn nửa, nhưng bài này là kiểu không muốn bỏ sót dù chỉ một từ

  • Đây giống như một kiểu lời nguyền của những người viết tốt
    Vì ChatGPT được thiết kế để bắt chước “văn viết hay”, nên người viết càng tốt càng dễ bị hiểu lầm là AI
    Tôi còn thấy cả những bài đầy lỗi ngữ pháp cũng bị chê là giống ChatGPT

    • Có thông tin công khai rằng ChatGPT được huấn luyện bằng tiếng Anh thương mại châu Phi
      Bài liên quan
      Nếu định nghĩa “viết hay” là văn phong dài dòng, an toàn và né tránh chỉ trích thì điều đó đúng

    • Thực ra LLM vẫn không viết hay hơn con người
      Nó vẫn hay sai cả ngữ pháp cơ bản như a/an, và vẫn dùng những kiểu diễn đạt lược bỏ ý nghĩa như because traffic
      Nhìn vào đó thì khả năng tinh chỉnh nghĩa một cách tỉ mỉ của con người vẫn vượt trội

    • Bài của OP không có cảm giác nhân tạo đặc trưng của LLM
      Cách dùng em-dash cũng tự nhiên, và mang theo cảm xúc cá nhân

    • Tôi ghét văn phong kiểu ChatGPT
      Nó gây mệt như câu chữ marketing, chỉ còn lại sự hoa mỹ rỗng tuếch
      Kiểu văn đó làm người đọc kiệt sức và cũng truyền đạt thông tin kém
      Thật ngạc nhiên khi ở Kenya lại dạy kiểu văn như vậy

  • Câu “Tôi không viết như ChatGPT, ChatGPT viết như tôi” thật ấn tượng
    Rốt cuộc chúng ta đang dần tiến tới số phận sẽ nói và viết giống ChatGPT
    Trẻ con giao bài tập về nhà, người lớn giao CV và tư vấn cho AI, rồi ngay cả khi trò chuyện cũng sẽ dùng kiểu nói như “đúng vậy, để tôi tóm lại thành ba lý do nhé”

    • (emoji ngôi sao) “Đúng vậy, Jim!”
      (emoji dấu check) Hãy thêm nhiều emoji hơn nữa — con người rất thích emoji
      (emoji dấu X đỏ) Hãy tránh những từ tiêu cực như “bullshit”
      (emoji ngón cái) Chúng ta sắp vượt qua cả học từ phản hồi của con người rồi đấy (cười)
 
yinn27 2025-12-16

Bài viết này thú vị đấy.