- Văn phong tiếng Anh trang trọng được hình thành trong hệ thống giáo dục Kenya liên tục bị cho là trông giống văn bản do AI tạo ra
- Quá trình rèn luyện mang tính cấu trúc trong dạy viết tiếng Anh nhấn mạnh sự cân bằng câu chữ, mạch lập luận và cách dùng từ nối, từ đó tạo ra kết quả tương tự lối viết của AI
- Văn phong này là di sản của nền giáo dục tiếng Anh kiểu Anh thời thuộc địa, và đã được duy trì như một biểu tượng của địa vị xã hội và học thức
- Bài viết chỉ ra vấn đề thiên lệch của công cụ phát hiện AI và mô hình ngôn ngữ khi đánh giá bài viết của người không phải bản ngữ là “phi con người”
- Tác giả nhấn mạnh rằng điều bộc lộ qua lối viết không phải là máy móc mà là sản phẩm của lịch sử, giáo dục và bản sắc ngôn ngữ
Hiểu lầm giữa AI và lối viết của con người
- Bài viết bắt đầu từ trải nghiệm tác giả nhận được phản hồi rằng bản đề xuất của mình “trông như do ChatGPT viết”
- Tác giả bị đánh giá là “thiếu chất người” chỉ vì văn phong có cấu trúc và logic
- Nhiều cây bút khác cũng gặp phản ứng tương tự, và điều này gắn liền với định kiến đối với người viết không phải bản ngữ
- Tác giả giải thích rằng lý do văn phong của mình giống AI là vì AI đã học từ chính phương thức giáo dục của họ
Sự hình thành của giáo dục tiếng Anh kiểu Kenya
- Bài thi viết tiếng Anh trong KCPE (Kỳ thi Chứng chỉ Giáo dục Tiểu học Kenya) là cốt lõi của quá trình rèn luyện viết
- Để đạt điểm cao trong bài thi 40 điểm, học sinh phải nắm được vốn từ phong phú và cấu trúc câu phức
- Các quy tắc viết có thể tóm gọn thành ba điều
- Mở đầu bằng tục ngữ hoặc một câu mạnh, dùng từ vựng đa dạng, duy trì cấu trúc hoàn chỉnh
- Giáo viên đóng vai trò như “thuật toán nguyên bản” dùng bút đỏ để sửa ngữ pháp và cấu trúc
- Việc rèn luyện này nhấn mạnh cách tổ chức câu chữ logic và cân đối, và tiếp tục kéo dài ở bậc trung học lẫn đại học
Di sản thuộc địa và thứ bậc ngôn ngữ
- Giáo dục tiếng Anh ở Kenya bắt nguồn từ hệ thống ngôn ngữ của Đế quốc Anh
- Đề cao tính chuẩn xác ngữ pháp và sự trang trọng dựa trên chuẩn ‘Queen’s English’
- Ngay cả sau độc lập, ngôn ngữ này vẫn được duy trì như ngôn ngữ chính thức và biểu tượng của địa vị xã hội
- Việc sử dụng tiếng Anh trau chuốt trở thành tiêu chí phân biệt trình độ học vấn và tầng lớp
- Kết quả là kho văn phong trang trọng khổng lồ mà AI học được mang hình thức tương tự sản phẩm của nền giáo dục tiếng Anh kiểu Kenya
Thiên lệch và giới hạn của công cụ phát hiện AI
- Công cụ phát hiện AI phán đoán dựa trên ‘perplexity (mức độ dễ đoán)’ và ‘burstiness (mức độ đa dạng độ dài câu)’
- Cấu trúc câu dễ đoán và nhịp điệu đều đặn bị xem là phi con người
- Nhưng giáo dục kiểu Kenya lại chính là nơi coi văn phong dễ đoán và cân đối như một lý tưởng
- Kết quả nghiên cứu cho thấy các công cụ này có khả năng cao phân loại nhầm bài viết của người không phải bản ngữ là nội dung do AI tạo ra
- Điều đó phơi bày thiên lệch kỹ thuật loại trừ sự đa dạng ngôn ngữ
Định nghĩa lại tính con người và ngôn ngữ
- Bài viết của các tác giả Kenya là kết quả của giáo dục, lịch sử và văn hóa chứ không phải của máy móc
- Tác giả phê phán thực tế rằng tiêu chuẩn của “lối viết mang tính con người” đang bị giới hạn vào kiểu diễn đạt không trang trọng và đậm chất Mỹ
- Các cây bút ở Nairobi, Lagos, Mumbai và nhiều nơi khác cũng chia sẻ truyền thống viết đề cao độ chính xác và tính logic
- Nhận định rằng một bài viết “trông giống AI” thực chất là góc nhìn không nhận ra những hình thức khác của tính người
- Kết luận của bài viết khép lại bằng một lời khẳng định: đây chính là lối viết của người Kenya, và nó đã tồn tại từ rất lâu
2 bình luận
Ý kiến trên Hacker News
Thế hệ chúng tôi đã học những luật bất thành văn của việc viết được truyền từ giáo viên sang học trò
Câu đầu tiên luôn phải mở bằng một câu tục ngữ hoặc một câu thật mạnh, và thay vì từ ngữ bình thường thì phải dùng những cách diễn đạt như
strode purposefullyNhưng rồi khi học viết ở đại học, tôi dần bị đẩy sang phía câu đơn giản và cách diễn đạt ngắn gọn
Giờ tôi cảm thấy văn phong kiểu Hemingway là lý tưởng. Văn phong hoa mỹ của ChatGPT ngược lại chỉ gây mệt mỏi
Tôi công nhận năng lực của tác giả, nhưng cá nhân tôi thích lối viết đơn giản và rõ ràng hơn
Nỗi ám ảnh phải viết câu ngắn đã phá hỏng văn xuôi tiếng Anh
Với đa số mọi người thì sự đơn giản là có ích, nhưng xu hướng xem câu dài, dấu chấm phẩy hay từ vựng tinh tế là “văn dở” mới là vấn đề
Thái độ đó cản trở sự phát triển của cả người đọc lẫn người viết
Dù vậy, những cách nói như
proceeded tothì vẫn là rác. Bắt học sinh phải cố dùng từ ngữ “trông thông minh” là kiểu giáo dục tệ hại nhấtVợ tôi là nhà văn, và cô ấy bảo trong fanfic hay tiểu thuyết ngôn tình, từ
strodexuất hiện nhiều một cách bất thường. Việc ai cứ hễ đi bộ là lại “sải bước đầy tự tin” đúng là một dấu hiệu rất nghiệp dưTrong phong cách viết có ẩn chứa tín hiệu giai cấp
Như bài viết nói, thứ tiếng Anh chúng ta học là “Queen’s English” của thời đế quốc, tức là ngôn ngữ của quyền lực
Việc học vẻ đẹp hình thức của câu chữ không chỉ để vượt qua kỳ thi mà còn là hành động chứng minh mình là “người văn minh”
Mốt viết lách cũng giống chu kỳ thời trang trong xã hội. Khi văn phong cầu kỳ trở nên đại chúng, tầng lớp thượng lưu lại phân biệt mình bằng lối viết đơn giản
Văn phong tiết chế kiểu Hemingway giống như “chiếc quần jeans rách giá 1000 đô”, kiểu chỉ người dư dả mới cố tình tỏ ra giản dị được
Tôi từng làm ở một trong Big Three, và văn phong của ChatGPT giống hệt văn phong báo cáo tự đánh giá mà tôi học trong công ty
Chìa khóa để thăng tiến là gói ghém “câu chuyện” cho hay chứ không phải thành tích thực tế
Có phải bạn là người Mỹ không? Ngay cả trong thế giới nói tiếng Anh thì cũng có khác biệt văn hóa giữa Anh và Mỹ khá lớn
Người Mỹ ít màu mè và thẳng thắn hơn, trong khi tiếng Anh kiểu Anh vẫn có xu hướng hoa mỹ và trang trí hơn
Theo cảm nhận của tôi thì vốn từ của người Anh đang giảm dần qua từng thế hệ
Viết lách có hai mục đích
(1) Viết để truyền đạt ý tưởng — càng đơn giản càng tốt. Như các bài luận của Paul Graham, thông tin đi vào đầu gần như không ma sát
(2) Viết để tự biểu đạt — văn phong hoa mỹ và giàu tính nghệ thuật sẽ phù hợp hơn
Như David Foster Wallace nói, cái đầu là kiểu viết giao tiếp như trò chuyện, còn cái sau là kiểu nhật ký hét lên rằng “đây là tôi!”
Điều thú vị là một phần đáng kể dữ liệu huấn luyện của LLM đã được tuyển chọn ở Kenya
Nếu dữ liệu được tạo ở Nhật, có khi ChatGPT đã dùng những đuôi câu kiểu Nhật như “Don’t you agree?”
Bài liên quan
Ảnh hưởng của tác giả sách giáo khoa người Ấn Độ Malkiat Singh là rất lớn
Sách của ông được dùng làm giáo trình chuẩn ở Kenya, và khi các học trò của ông trở thành người tuyển chọn dữ liệu cho LLM, văn phong đó cũng thấm vào AI trên toàn thế giới
Wiki về Malkiat Singh
(Ngắn gọn) Có vẻ đây là chuyện không tránh khỏi
Có lẽ 樣 đang chuẩn bị cho meme “ChatGPT (Japan)” đây XD
Nhưng gán nhãn dữ liệu là chuyện khác với dữ liệu huấn luyện để sinh văn bản của LLM. Có rất nhiều hiểu lầm ở điểm này
Tôi đã đọc style guide của City News Bureau ở Chicago năm 1897, và có rất nhiều quy tắc thú vị
Ví dụ như đừng nhầm
nightvớievening, và đừng dùngverymột cách không cần thiếtNhững quy tắc chi li như vậy cho thấy cảm quan ngôn ngữ của thời đó
veryTrong mắt tôi, văn phong của bài này trông hoàn toàn khác ChatGPT
Nhiều người xem việc dùng em-dash (—) là dấu vết của AI, nhưng đó là tín hiệu khá yếu
Ngược lại, ChatGPT thường tạo ra giọng điệu cường điệu và một thứ “sự hùng vĩ rỗng tuếch”
Nếu so trực tiếp các đoạn văn thì bản AI hoa mỹ hơn nhưng lại kém chân thành hơn
Bài này có sức cuốn hút. Phần lớn đầu ra của GPT chỉ qua một đoạn là tôi đã mất tập trung
Đọc xong có cảm giác chẳng đọng lại thông tin gì
Khác biệt giữa LLM và con người nằm ở khả năng dùng rất nhiều từ mà chẳng nói gì cả
Nếu đưa cho GPT một câu vốn đã được viết tốt rồi và bảo nó “cải thiện”, đương nhiên nó chỉ có thể làm câu đó dài dòng hơn
Bản gốc có trang trí về mặt cấu trúc nhưng ý nghĩa vẫn sống động. Văn bản do AI viết thì mật độ thông tin thấp và gây chán
Đi săn em-dash một cách mù quáng là hành vi của những người không hiểu ngữ pháp
Nghệ sĩ hay YouTuber cũng đang gặp cùng một vấn đề
Hiện tượng bị hiểu lầm chỉ vì trông giống AI ngày càng nhiều
Thật sự có vẻ sẽ có cả diễn viên lồng tiếng mất việc chỉ vì giọng họ giống giọng AI
Tôi cũng từng đăng video Factorio, và một vài người xem để lại bình luận rằng “giọng AI nghe khó chịu thật”
Trong khi thực ra tôi tự nói, thậm chí cuối video còn lộ mặt, vậy mà họ vẫn nói thế
Giọng AI thiếu cảm xúc và phát âm gượng gạo nên nhận ra rất nhanh
Dạo này có nhiều video hướng dẫn kiểu “rỗng nội dung” chỉ đơn giản là đọc nguyên xi kịch bản do AI viết
Nên giờ tôi chỉ xem video của những creator mà tôi tin tưởng
Link video của tôi
Nếu ảnh khuôn mặt người thật bị dùng trái phép trong tạo ảnh AI, thì Pierce Brosnan chắc nên là người được bồi thường đầu tiên
Trong nhóm tôi cũng có một đồng nghiệp nói chuyện như ChatGPT
Trên WhatsApp và Zoom, cách nói của anh ấy quá máy móc, nên tôi hỏi Meta AI thì nó trả lời rằng “trông như văn bản do AI viết”
Nhưng anh ấy nói thực ra không dùng AI, và giờ nghĩ lại thì tôi thấy điều đó cũng có thể đúng
Nhưng giao việc nhận diện AI cho AI thì vô lý. Chẳng khác nào tự hỏi chính nó
Tôi cũng từng có trải nghiệm kiểu “ChatGPT viết giống tôi”
Tôi hay dùng danh sách và định dạng, và thích kiểu viết thân thiện với người khó đọc chữ
Nhìn lại ghi chú tôi viết năm 2019 cũng đã có cảm giác giống ChatGPT rồi
Tôi còn cố tình thêm lỗi chính tả hoặc trộn vào văn phong phi chuẩn nữa
Nói lạnh lùng thì nếu bài viết của bạn không phân biệt được với đầu ra mặc định của ChatGPT thì đó là bài viết tệ
Dù thật sự không dùng AI thì kiểu văn đó vẫn cần cải thiện
Trong giáo dục, chỉ nên đánh giá cao những ai viết tốt hơn AI
Chỉ trích đồng nghiệp vì “cố tỏ ra thông minh như ChatGPT” thì cũng hơi buồn cười
Cuộc tranh luận về em-dash khá thú vị
Trước đây tôi chỉ thấy nó khi Word tự động thay thế, chưa từng tự gõ bao giờ
Đây là lần đầu tôi biết trên Windows phải nhấn Alt+0151
Vì thế với tôi, em-dash vẫn là một ký hiệu xa lạ
Giờ thì tôi hiểu rằng mọi người viết trong những môi trường khác nhau
Thật ra trên HN đã có người thích dùng em-dash từ trước cả thời ChatGPT
Bảng xếp hạng người dùng em-dash trên HN
Tôi bật Typo mode trong emacs để tự động dùng en/em dash và dấu ngoặc kép thông minh
Tôi đã phân tích dataset của HN, và ngay cả sau khi AI lan rộng thì lượng dùng em-dash cũng không tăng
Tuy nhiên, cấu trúc câu ngoặc chen dày đặc quá mức đúng là đặc trưng của AI hoặc văn viết non tay
Đã có lần trong ứng dụng Ghi chú trên macOS,
--tự động bị đổi thành—làm lệnh terminal chạy lỗiTôi rất ấn tượng với trình độ tiếng Anh của OP
Phần lớn người không phải bản ngữ học tiếng Anh văn chương ở trường nên quen với văn phong trang trọng
Tôi cũng được dạy như vậy ở Pháp, nhưng sau khi làm trong ngành IT thì đã chuyển sang kiểu tiếng Anh trực diện của Mỹ
Bài này không phải do ChatGPT viết. Nó không có trang trí thừa thãi và mật độ thông tin rất cao
Với văn bản AI thì tôi thường bỏ qua hơn nửa, nhưng bài này là kiểu không muốn bỏ sót dù chỉ một từ
Đây giống như một kiểu lời nguyền của những người viết tốt
Vì ChatGPT được thiết kế để bắt chước “văn viết hay”, nên người viết càng tốt càng dễ bị hiểu lầm là AI
Tôi còn thấy cả những bài đầy lỗi ngữ pháp cũng bị chê là giống ChatGPT
Có thông tin công khai rằng ChatGPT được huấn luyện bằng tiếng Anh thương mại châu Phi
Bài liên quan
Nếu định nghĩa “viết hay” là văn phong dài dòng, an toàn và né tránh chỉ trích thì điều đó đúng
Thực ra LLM vẫn không viết hay hơn con người
Nó vẫn hay sai cả ngữ pháp cơ bản như
a/an, và vẫn dùng những kiểu diễn đạt lược bỏ ý nghĩa nhưbecause trafficNhìn vào đó thì khả năng tinh chỉnh nghĩa một cách tỉ mỉ của con người vẫn vượt trội
Bài của OP không có cảm giác nhân tạo đặc trưng của LLM
Cách dùng em-dash cũng tự nhiên, và mang theo cảm xúc cá nhân
Tôi ghét văn phong kiểu ChatGPT
Nó gây mệt như câu chữ marketing, chỉ còn lại sự hoa mỹ rỗng tuếch
Kiểu văn đó làm người đọc kiệt sức và cũng truyền đạt thông tin kém
Thật ngạc nhiên khi ở Kenya lại dạy kiểu văn như vậy
Câu “Tôi không viết như ChatGPT, ChatGPT viết như tôi” thật ấn tượng
Rốt cuộc chúng ta đang dần tiến tới số phận sẽ nói và viết giống ChatGPT
Trẻ con giao bài tập về nhà, người lớn giao CV và tư vấn cho AI, rồi ngay cả khi trò chuyện cũng sẽ dùng kiểu nói như “đúng vậy, để tôi tóm lại thành ba lý do nhé”
(emoji dấu check) Hãy thêm nhiều emoji hơn nữa — con người rất thích emoji
(emoji dấu X đỏ) Hãy tránh những từ tiêu cực như “bullshit”
(emoji ngón cái) Chúng ta sắp vượt qua cả học từ phản hồi của con người rồi đấy (cười)
Bài viết này thú vị đấy.