Viết lách trong thời đại LLM
(sh-reya.com)- Gần đây, khi viết bằng LLM ngày càng phổ biến, các kiểu viết thiếu tự nhiên cũng xuất hiện ngày càng rõ rệt
- Câu tóm tắt nghèo nàn, lạm dụng bullet point, nhịp câu đơn điệu là những vấn đề tiêu biểu của lối viết bằng LLM
- Mật độ thông tin thấp hoặc cách diễn đạt mơ hồ xuất hiện thường xuyên, khiến bài viết có xu hướng thiếu insight thực chất
- Ngược lại, lặp lại có chủ đích, cụm từ dẫn dắt rõ ràng, cấu trúc song song thường bị hiểu nhầm là phong cách LLM, nhưng thực ra lại là công cụ viết hiệu quả
- Tác giả nhấn mạnh rằng dù có thể dùng LLM để thiết kế outline, tạo bản nháp và rewrite theo từng phần, thì việc phán đoán cuối cùng và xây dựng nội dung có chiều sâu vẫn là phần việc của con người
Common Patterns of Bad Writing I See from LLM Tools
- Trong vài năm gần đây, khi viết và review nhiều bài blog và bài báo kỹ thuật, tác giả thường xuyên cảm thấy các bài viết do LLM tạo ra luôn có gì đó hơi “gượng gạo và kém cuốn hút”
- Đồng thời, tác giả cũng trải nghiệm rằng việc dùng LLM cho viết bản nháp, tóm tắt tài liệu phức tạp, sắp xếp những ý nghĩ rời rạc mang lại ích lợi rất lớn
- Bài viết này chia sẻ các mẫu viết tệ mà LLM hay tạo ra, những thói quen viết thường bị hiểu nhầm là “phong cách LLM” nhưng thực ra hoàn toàn ổn, cùng với quy tắc viết và prompt mà tác giả thực sự sử dụng
Empty “summary” sentences that pretend to conclude a thought
- Ở cuối đoạn, thường xuất hiện các câu tóm kết trông như kết luận nhưng thực chất không mang ý nghĩa gì, chẳng hạn như “By following these steps, we achieve better performance.”, “By internalizing these principles, you can cut through the noise.”
- “Làm theo quy trình này sẽ giúp đạt hiệu năng tốt hơn”
- “Thấm nhuần các nguyên tắc này sẽ giúp bạn vượt qua sự nhiễu loạn”
- Những câu như vậy không đem lại cho người đọc insight mới hay điểm nào đáng suy nghĩ
- Ngay cả tác giả cũng chưa tìm ra cách chắc chắn để khiến LLM viết được những câu thực sự có thông điệp thực chất
Overuse of bullet points and outlines
- LLM có xu hướng lạm dụng bullet point (danh sách) và outline quá mức
- Khi các mục có tính song song và độc lập, danh sách rất hữu ích; nhưng ở những phần mà các ý tưởng liên kết với nhau hoặc ngữ cảnh quan trọng, viết thành đoạn văn sẽ phù hợp hơn
Flat sentence rhythm
-
Khi mọi câu đều lặp lại với độ dài và cấu trúc tương tự nhau, bài viết trở nên nhàm chán và người đọc cũng khó theo dõi hơn
-
Cần điều chỉnh đa dạng độ dài và nhịp câu để có thể nhấn mạnh, kéo sự chú ý và kiểm soát tốc độ đọc
-
Bad example:
"We recently launched a conversational AI feature that lets users ask questions in plain English and get responses based on their past activity and current session. The system searches a database of help articles, ranks the most relevant ones using a custom scoring function, and passes the top result into a language model to generate the final answer. We spent weeks optimizing each step to keep latency under 300 milliseconds, including caching, pruning irrelevant articles, and tuning prompt templates."
"Chúng tôi gần đây đã ra mắt một tính năng AI hội thoại cho phép người dùng đặt câu hỏi bằng ngôn ngữ tự nhiên và nhận câu trả lời dựa trên hoạt động trước đó cùng phiên hiện tại. Hệ thống tìm kiếm trong cơ sở dữ liệu bài viết trợ giúp, chọn ra mục liên quan nhất bằng thuật toán chấm điểm tuỳ chỉnh, rồi đưa kết quả đó vào mô hình ngôn ngữ để tạo câu trả lời cuối cùng. Chúng tôi đã dành nhiều tuần để tối ưu từng bước nhằm giữ độ trễ dưới 300 mili giây, bao gồm caching, loại bỏ các bài viết không liên quan và tối ưu prompt template." -
Good example:
"We just launched a new conversational AI feature. It answers user questions in plain language, using context from the current session. The system searches help articles, scores them with a custom ranking function, feeds the top result into a fine-tuned language model, and runs in under 300ms using caching, pruning, and prompt tuning techniques."
"Chúng tôi vừa ra mắt một tính năng AI hội thoại mới. Tính năng này trả lời câu hỏi của người dùng bằng ngôn ngữ tự nhiên, sử dụng ngữ cảnh từ phiên hiện tại. Hệ thống tìm kiếm các bài viết trợ giúp, chấm điểm chúng bằng hàm xếp hạng tuỳ chỉnh, đưa kết quả hàng đầu vào một mô hình ngôn ngữ đã fine-tune, và vận hành dưới 300ms nhờ caching, pruning và prompt tuning."
-
Not the right subject
- Khi chọn chủ ngữ không phù hợp, trọng tâm của câu sẽ bị mờ đi
- Bad example:
"Readers are better guided when the subject matches the main idea of the sentence."
"Người đọc được dẫn dắt tốt hơn khi chủ ngữ khớp với ý chính của câu" - Good example:
"Choosing the right subject keeps the writing clear and focused."
"Việc chọn đúng chủ ngữ giúp bài viết rõ ràng và tập trung hơn"
- Bad example:
- Việc chọn đúng chủ ngữ rất quan trọng với tính nhất quán và độ tập trung của bài viết
Low information density
- Dưới đây là một ví dụ về văn bản do LLM tạo ra từ Gemini 2.5 Pro:
"As someone who writes, reviews, and deconstructs complex information for a living, I’ve developed a strong allergy to bad writing. And lately, a lot of that bad writing has a specific, synthetic flavor—the unmistakable scent of an LLM. This post is a guide to navigating the new world of writing, with or without LLM assistance. First, I’ll cover the true pitfalls of LLM-generated text—the red flags that make it feel sterile and unconvincing."
"Là người làm công việc viết, review và phân tích thông tin phức tạp, tôi đã trở nên rất dị ứng với lối viết tệ. Gần đây, nhiều kiểu viết tệ đó lại mang một mùi vị nhân tạo rất đặc trưng—dấu hiệu không thể nhầm lẫn của LLM. Bài viết này là hướng dẫn để điều hướng thế giới viết lách mới, dù có hay không có sự hỗ trợ của LLM. Trước tiên, tôi sẽ nói về những cạm bẫy thực sự của văn bản do LLM tạo ra—các dấu hiệu cảnh báo khiến nó trở nên khô cứng và thiếu sức thuyết phục." - Cấu trúc câu và ngữ pháp có thể hoàn hảo, nhưng lại không có insight thực chất, thông tin cụ thể hay sự phát triển của lập luận
Vagueness
- Văn bản do LLM viết có xu hướng né tránh sự cụ thể
- Nó không định nghĩa rõ ý tưởng, đưa ra nhận định không có bằng chứng, hoặc viết mơ hồ không rõ đang nói về ai
“Some experts say prompt engineering is becoming less important. The ability to simply prompt LLMs can have a major impact on productivity.”
“Một số chuyên gia cho rằng prompt engineering đang trở nên kém quan trọng hơn. Khả năng đơn giản là viết prompt cho LLM có thể tạo ra tác động lớn đến năng suất.”
→ Thiếu cơ sở cụ thể và đối tượng rõ ràng như ai nói, trong ngữ cảnh nào, tác động tới ai
Overuse of demonstrative pronouns
- Việc lạm dụng đại từ chỉ định như "this", "that", "these", "those" xuất hiện rất nhiều
- Nếu danh từ mà chúng trỏ tới không rõ ràng, người đọc rất dễ bỏ lỡ ý nghĩa
“This creates friction in production.”
“Điều này tạo ra ma sát trong môi trường production”
Ở đây, "this/điều này" không nói rõ đang ám chỉ điều gì
Fluency without understanding
- Thường xuất hiện những câu bề ngoài trôi chảy nhưng thực tế khả năng giải thích rất kém
“LLMs use attention mechanisms to generate contextually appropriate responses.”
“LLM sử dụng attention mechanisms để tạo ra các phản hồi phù hợp với ngữ cảnh”
→ Nếu người đọc không biết attention là gì thì câu này thực ra không truyền tải được thông tin nào - LLM cũng thường bịa ra các thuật ngữ không tồn tại
“We used GPT-4 for summarization, but it hallucinated details, so we added retrieval grounding.”
“Chúng tôi dùng GPT-4 để tóm tắt, nhưng nó hallucinate ra các chi tiết, nên chúng tôi bổ sung retrieval grounding”
→ “retrieval grounding” là một thuật ngữ không thực sự tồn tại - LLM không phân biệt được kiến thức nền của người đọc và nhu cầu giải thích, nên thường bỏ qua những phần khó
Writing Patterns People Flag as “LLM-Like,” But Are Actually Fine
- Cũng có những mẫu viết mà mọi người quá cảnh giác vì cho là phong cách LLM, nhưng thực tế lại là các kiểu viết hiệu quả và phổ biến
- Điều quan trọng không phải là viết sao cho không giống mô hình, mà là viết với sự rõ ràng, chủ đích và khả năng kiểm soát
Intentional repetition
- Lặp lại có chủ đích rất hiệu quả khi cần làm rõ hoặc nhấn mạnh các ý tưởng phức tạp
"Vector databases store embeddings, or mathematical representations that capture semantic meaning in hundreds of dimensions. In other words, vector databases help find results that are “close” in meaning, not just exact text matches."
“Vector database lưu trữ embedding, tức các biểu diễn toán học nắm bắt ý nghĩa ngữ nghĩa trong hàng trăm chiều. Nói cách khác, vector database giúp tìm ra các kết quả ‘gần nhau’ về mặt ý nghĩa, chứ không chỉ khớp chính xác về văn bản”
Signposting phrases
- Các cụm từ dẫn dắt như "essentially", "in short", "the point is..." sẽ hữu ích nếu phía sau thực sự có thông tin
Ví dụ:
"Essentially, instead of classifying the document as a whole, we classify each section independently."
“Về bản chất, thay vì phân loại toàn bộ tài liệu, chúng tôi phân loại từng phần một cách độc lập”
Parallel structure
- Cấu trúc song song giúp tổ chức ý tưởng có hệ thống và làm cho dòng chảy câu văn mượt hơn
"The system scales across inputs, stays responsive under load, and returns consistent results even with noisy prompts."
“Hệ thống có thể scale trên nhiều đầu vào, vẫn phản hồi tốt dưới tải, và trả về kết quả nhất quán ngay cả khi prompt bị nhiễu”
Section headings that echo a structure
- Các section heading có cấu trúc dễ đoán như “Why X fails”, “What to do instead”, “How to know if it worked” hoàn toàn hiệu quả nếu nội dung đủ rõ ràng
Declarative openings
- Bắt đầu section bằng câu trần thuật dứt khoát thực ra còn giúp tăng độ tập trung của bài viết, miễn là phía sau có bằng chứng hoặc giải thích hỗ trợ
Ví dụ:
"LLM evaluations are hard to get right. Many rely on user-defined gold labels or vague accuracy metrics, which do not work for subjective or multi-step tasks."
“Đánh giá LLM là việc khó làm cho đúng. Nhiều cách đánh giá dựa vào gold label do người dùng tự định nghĩa hoặc các thước đo độ chính xác mơ hồ, vốn không phù hợp với các tác vụ mang tính chủ quan hoặc nhiều bước”
Em dashes
- Dấu gạch ngang dài (—) hữu ích cho việc bổ sung giải thích, thay đổi nhịp câu hoặc chuyển ý nhanh trong một câu
- Dùng đúng cách sẽ giúp tạo dòng chảy hội thoại tự nhiên và điểm nhấn
How I Write with LLMs
- Tác giả xem việc giữ được đà viết (momentum) là điều quan trọng nhất trong quá trình viết
- Quy trình làm bài blog hoặc bài báo thực tế thường như sau
- Lập kế hoạch outline (viết ra giấy hoặc hình dung trong đầu)
- Tạo bản nháp
- Đọc lại phần đã viết và phản biện một cách có phê phán
- Chỉnh sửa
- Quy trình này có thể lặp lại ở nhiều phạm vi khác nhau như cấp độ câu hoặc cấp độ section
- Mỗi người sẽ mắc kẹt ở các khâu khác nhau trong giai đoạn lên kế hoạch, viết nháp hay chỉnh sửa
- Tác giả tạo outline khá nhanh, nhưng thường bị kẹt ở cách diễn đạt (phrasing)
- Tác giả tích cực dùng LLM như một công cụ để vượt qua chỗ bị kẹt hoặc tăng tốc việc dựng bản nháp
Narrate the story to the model
- Khi bắt đầu bản nháp, tác giả viết câu chuyện một cách thô như đang giải thích cấu trúc cho đồng nghiệp, rồi dán vào LLM và yêu cầu tạo outline chi tiết
- Việc này được lặp lại cho đến khi cấu trúc trở nên rõ ràng
Write the paragraph myself, even if it’s rough
- Khi outline đã hoàn tất, tác giả cố gắng tự viết từng đoạn, dù còn thô cũng không sao
- Khi khó viết trọn một câu, tác giả sẽ yêu cầu LLM kiểu như “finish it”, rồi chọn phiên bản tốt nhất trong số các cách hoàn thiện mà mô hình đề xuất, chỉnh nhẹ nếu cần và dùng tiếp
“In the last couple of years, I’ve written and reviewed several technical papers and blog posts. Something always feels slightly off, enough to make the writing quietly uninviting. At the same time, I feel like I get tremendous value from using LLMs to write…” “finish it”
“Trong vài năm qua, tôi đã viết và review nhiều bài báo kỹ thuật và bài blog. Luôn có điều gì đó hơi lệch, đủ để khiến bài viết âm thầm trở nên kém hấp dẫn. Đồng thời, tôi cảm thấy mình nhận được giá trị rất lớn từ việc dùng LLM để viết…” “finish it”
→ Mô hình sẽ đưa ra nhiều gợi ý, và tác giả chọn cái tốt nhất rồi sửa nhẹ để dùng
Use scoped rewrite strategies during revision
- Khi đoạn văn hoặc câu chữ còn gượng, thay vì nói “make it better”, tác giả đưa cho LLM những yêu cầu hoặc pattern cụ thể (như cấu trúc tu từ)
- Một số chiến lược ví dụ:
- Đặt chủ ngữ và động từ càng gần nhau càng tốt, ngay từ đầu câu
- Dùng cấu trúc SWBST (ai muốn gì, nhưng gặp trở ngại nào, đã phản ứng ra sao, và kết quả thế nào)
- Ví dụ:
"We used GPT-4 for summarization. We wanted fluent answers, but it hallucinated facts. So we added a retrieval step. Then we re-ranked outputs based on citation accuracy."
“Chúng tôi dùng GPT-4 để tóm tắt. Chúng tôi muốn có câu trả lời trôi chảy, nhưng nó lại hallucinate thông tin sai. Vì vậy, chúng tôi thêm một bước retrieval. Sau đó, chúng tôi xếp hạng lại đầu ra dựa trên độ chính xác của trích dẫn” - Cấu trúc SWBST rất hiệu quả để truyền đạt ngắn gọn động cơ, vấn đề, cách ứng phó và kết quả ngay cả trong các bài viết kỹ thuật
- Ví dụ:
Parting Thoughts
- Giờ đây, đã là thời đại mà những bài viết ở mức trung bình (chất lượng trung bình) có thể được tạo ra dễ dàng bằng LLM
- Nhưng việc viết gì, chọn góc nhìn và cấu trúc nào, và nên đào sâu ở đâu vẫn là phần việc của con người
- Một bài viết thực sự tốt phải có đóng góp thực chất tương xứng với độ dài, và phải xứng đáng với thời gian người đọc bỏ ra
- Đó là tiêu chuẩn mà tác giả theo đuổi
1 bình luận
Tôi nghĩ GeekNews hay ở chỗ mật độ thông tin cao theo nghĩa đó.
Cách kết câu kiểu ngắn gọn, lược bỏ chủ ngữ đúng là giống như tối ưu hóa mật độ thật.