Viết lách trong thời đại LLM

(sh-reya.com)

35 điểm bởi GN⁺ 2025-07-10 | 1 bình luận | Chia sẻ qua WhatsApp

Gần đây, khi viết bằng LLM ngày càng phổ biến, các kiểu viết thiếu tự nhiên cũng xuất hiện ngày càng rõ rệt
Câu tóm tắt nghèo nàn, lạm dụng bullet point, nhịp câu đơn điệu là những vấn đề tiêu biểu của lối viết bằng LLM
Mật độ thông tin thấp hoặc cách diễn đạt mơ hồ xuất hiện thường xuyên, khiến bài viết có xu hướng thiếu insight thực chất
Ngược lại, lặp lại có chủ đích, cụm từ dẫn dắt rõ ràng, cấu trúc song song thường bị hiểu nhầm là phong cách LLM, nhưng thực ra lại là công cụ viết hiệu quả
Tác giả nhấn mạnh rằng dù có thể dùng LLM để thiết kế outline, tạo bản nháp và rewrite theo từng phần, thì việc phán đoán cuối cùng và xây dựng nội dung có chiều sâu vẫn là phần việc của con người

Common Patterns of Bad Writing I See from LLM Tools

Trong vài năm gần đây, khi viết và review nhiều bài blog và bài báo kỹ thuật, tác giả thường xuyên cảm thấy các bài viết do LLM tạo ra luôn có gì đó hơi “gượng gạo và kém cuốn hút”
Đồng thời, tác giả cũng trải nghiệm rằng việc dùng LLM cho viết bản nháp, tóm tắt tài liệu phức tạp, sắp xếp những ý nghĩ rời rạc mang lại ích lợi rất lớn
Bài viết này chia sẻ các mẫu viết tệ mà LLM hay tạo ra, những thói quen viết thường bị hiểu nhầm là “phong cách LLM” nhưng thực ra hoàn toàn ổn, cùng với quy tắc viết và prompt mà tác giả thực sự sử dụng

Empty “summary” sentences that pretend to conclude a thought

Ở cuối đoạn, thường xuất hiện các câu tóm kết trông như kết luận nhưng thực chất không mang ý nghĩa gì, chẳng hạn như “By following these steps, we achieve better performance.”, “By internalizing these principles, you can cut through the noise.”
- “Làm theo quy trình này sẽ giúp đạt hiệu năng tốt hơn”
- “Thấm nhuần các nguyên tắc này sẽ giúp bạn vượt qua sự nhiễu loạn”
Những câu như vậy không đem lại cho người đọc insight mới hay điểm nào đáng suy nghĩ
Ngay cả tác giả cũng chưa tìm ra cách chắc chắn để khiến LLM viết được những câu thực sự có thông điệp thực chất

Overuse of bullet points and outlines

LLM có xu hướng lạm dụng bullet point (danh sách) và outline quá mức
Khi các mục có tính song song và độc lập, danh sách rất hữu ích; nhưng ở những phần mà các ý tưởng liên kết với nhau hoặc ngữ cảnh quan trọng, viết thành đoạn văn sẽ phù hợp hơn

Flat sentence rhythm

Khi mọi câu đều lặp lại với độ dài và cấu trúc tương tự nhau, bài viết trở nên nhàm chán và người đọc cũng khó theo dõi hơn
Cần điều chỉnh đa dạng độ dài và nhịp câu để có thể nhấn mạnh, kéo sự chú ý và kiểm soát tốc độ đọc
Quảng cáo
- Bad example:
  "We recently launched a conversational AI feature that lets users ask questions in plain English and get responses based on their past activity and current session. The system searches a database of help articles, ranks the most relevant ones using a custom scoring function, and passes the top result into a language model to generate the final answer. We spent weeks optimizing each step to keep latency under 300 milliseconds, including caching, pruning irrelevant articles, and tuning prompt templates."
  "Chúng tôi gần đây đã ra mắt một tính năng AI hội thoại cho phép người dùng đặt câu hỏi bằng ngôn ngữ tự nhiên và nhận câu trả lời dựa trên hoạt động trước đó cùng phiên hiện tại. Hệ thống tìm kiếm trong cơ sở dữ liệu bài viết trợ giúp, chọn ra mục liên quan nhất bằng thuật toán chấm điểm tuỳ chỉnh, rồi đưa kết quả đó vào mô hình ngôn ngữ để tạo câu trả lời cuối cùng. Chúng tôi đã dành nhiều tuần để tối ưu từng bước nhằm giữ độ trễ dưới 300 mili giây, bao gồm caching, loại bỏ các bài viết không liên quan và tối ưu prompt template."
- Good example:
  "We just launched a new conversational AI feature. It answers user questions in plain language, using context from the current session. The system searches help articles, scores them with a custom ranking function, feeds the top result into a fine-tuned language model, and runs in under 300ms using caching, pruning, and prompt tuning techniques."
  "Chúng tôi vừa ra mắt một tính năng AI hội thoại mới. Tính năng này trả lời câu hỏi của người dùng bằng ngôn ngữ tự nhiên, sử dụng ngữ cảnh từ phiên hiện tại. Hệ thống tìm kiếm các bài viết trợ giúp, chấm điểm chúng bằng hàm xếp hạng tuỳ chỉnh, đưa kết quả hàng đầu vào một mô hình ngôn ngữ đã fine-tune, và vận hành dưới 300ms nhờ caching, pruning và prompt tuning."

Not the right subject

Khi chọn chủ ngữ không phù hợp, trọng tâm của câu sẽ bị mờ đi
- Bad example:
  "Readers are better guided when the subject matches the main idea of the sentence."
  "Người đọc được dẫn dắt tốt hơn khi chủ ngữ khớp với ý chính của câu"
- Good example:
  "Choosing the right subject keeps the writing clear and focused."
  "Việc chọn đúng chủ ngữ giúp bài viết rõ ràng và tập trung hơn"
Việc chọn đúng chủ ngữ rất quan trọng với tính nhất quán và độ tập trung của bài viết

Low information density

Dưới đây là một ví dụ về văn bản do LLM tạo ra từ Gemini 2.5 Pro:

"As someone who writes, reviews, and deconstructs complex information for a living, I’ve developed a strong allergy to bad writing. And lately, a lot of that bad writing has a specific, synthetic flavor—the unmistakable scent of an LLM. This post is a guide to navigating the new world of writing, with or without LLM assistance. First, I’ll cover the true pitfalls of LLM-generated text—the red flags that make it feel sterile and unconvincing."
"Là người làm công việc viết, review và phân tích thông tin phức tạp, tôi đã trở nên rất dị ứng với lối viết tệ. Gần đây, nhiều kiểu viết tệ đó lại mang một mùi vị nhân tạo rất đặc trưng—dấu hiệu không thể nhầm lẫn của LLM. Bài viết này là hướng dẫn để điều hướng thế giới viết lách mới, dù có hay không có sự hỗ trợ của LLM. Trước tiên, tôi sẽ nói về những cạm bẫy thực sự của văn bản do LLM tạo ra—các dấu hiệu cảnh báo khiến nó trở nên khô cứng và thiếu sức thuyết phục."
Quảng cáo
Cấu trúc câu và ngữ pháp có thể hoàn hảo, nhưng lại không có insight thực chất, thông tin cụ thể hay sự phát triển của lập luận

Vagueness

Văn bản do LLM viết có xu hướng né tránh sự cụ thể
Nó không định nghĩa rõ ý tưởng, đưa ra nhận định không có bằng chứng, hoặc viết mơ hồ không rõ đang nói về ai
“Some experts say prompt engineering is becoming less important. The ability to simply prompt LLMs can have a major impact on productivity.”
“Một số chuyên gia cho rằng prompt engineering đang trở nên kém quan trọng hơn. Khả năng đơn giản là viết prompt cho LLM có thể tạo ra tác động lớn đến năng suất.”
→ Thiếu cơ sở cụ thể và đối tượng rõ ràng như ai nói, trong ngữ cảnh nào, tác động tới ai

Overuse of demonstrative pronouns

Việc lạm dụng đại từ chỉ định như "this", "that", "these", "those" xuất hiện rất nhiều
Nếu danh từ mà chúng trỏ tới không rõ ràng, người đọc rất dễ bỏ lỡ ý nghĩa
“This creates friction in production.”
“Điều này tạo ra ma sát trong môi trường production”
Ở đây, "this/điều này" không nói rõ đang ám chỉ điều gì

Fluency without understanding

Thường xuất hiện những câu bề ngoài trôi chảy nhưng thực tế khả năng giải thích rất kém
“LLMs use attention mechanisms to generate contextually appropriate responses.”
“LLM sử dụng attention mechanisms để tạo ra các phản hồi phù hợp với ngữ cảnh”
→ Nếu người đọc không biết attention là gì thì câu này thực ra không truyền tải được thông tin nào
LLM cũng thường bịa ra các thuật ngữ không tồn tại
“We used GPT-4 for summarization, but it hallucinated details, so we added retrieval grounding.”
“Chúng tôi dùng GPT-4 để tóm tắt, nhưng nó hallucinate ra các chi tiết, nên chúng tôi bổ sung retrieval grounding”
→ “retrieval grounding” là một thuật ngữ không thực sự tồn tại
LLM không phân biệt được kiến thức nền của người đọc và nhu cầu giải thích, nên thường bỏ qua những phần khó

Writing Patterns People Flag as “LLM-Like,” But Are Actually Fine

Cũng có những mẫu viết mà mọi người quá cảnh giác vì cho là phong cách LLM, nhưng thực tế lại là các kiểu viết hiệu quả và phổ biến
Điều quan trọng không phải là viết sao cho không giống mô hình, mà là viết với sự rõ ràng, chủ đích và khả năng kiểm soát

Intentional repetition

Lặp lại có chủ đích rất hiệu quả khi cần làm rõ hoặc nhấn mạnh các ý tưởng phức tạp
"Vector databases store embeddings, or mathematical representations that capture semantic meaning in hundreds of dimensions. In other words, vector databases help find results that are “close” in meaning, not just exact text matches."
“Vector database lưu trữ embedding, tức các biểu diễn toán học nắm bắt ý nghĩa ngữ nghĩa trong hàng trăm chiều. Nói cách khác, vector database giúp tìm ra các kết quả ‘gần nhau’ về mặt ý nghĩa, chứ không chỉ khớp chính xác về văn bản”

Signposting phrases

Các cụm từ dẫn dắt như "essentially", "in short", "the point is..." sẽ hữu ích nếu phía sau thực sự có thông tin
Ví dụ:
"Essentially, instead of classifying the document as a whole, we classify each section independently."
“Về bản chất, thay vì phân loại toàn bộ tài liệu, chúng tôi phân loại từng phần một cách độc lập”

Parallel structure

Cấu trúc song song giúp tổ chức ý tưởng có hệ thống và làm cho dòng chảy câu văn mượt hơn
"The system scales across inputs, stays responsive under load, and returns consistent results even with noisy prompts."
“Hệ thống có thể scale trên nhiều đầu vào, vẫn phản hồi tốt dưới tải, và trả về kết quả nhất quán ngay cả khi prompt bị nhiễu”

Section headings that echo a structure

Các section heading có cấu trúc dễ đoán như “Why X fails”, “What to do instead”, “How to know if it worked” hoàn toàn hiệu quả nếu nội dung đủ rõ ràng

Declarative openings

Bắt đầu section bằng câu trần thuật dứt khoát thực ra còn giúp tăng độ tập trung của bài viết, miễn là phía sau có bằng chứng hoặc giải thích hỗ trợ
Ví dụ:
"LLM evaluations are hard to get right. Many rely on user-defined gold labels or vague accuracy metrics, which do not work for subjective or multi-step tasks."
“Đánh giá LLM là việc khó làm cho đúng. Nhiều cách đánh giá dựa vào gold label do người dùng tự định nghĩa hoặc các thước đo độ chính xác mơ hồ, vốn không phù hợp với các tác vụ mang tính chủ quan hoặc nhiều bước”

Em dashes

Dấu gạch ngang dài (—) hữu ích cho việc bổ sung giải thích, thay đổi nhịp câu hoặc chuyển ý nhanh trong một câu
Dùng đúng cách sẽ giúp tạo dòng chảy hội thoại tự nhiên và điểm nhấn

How I Write with LLMs

Tác giả xem việc giữ được đà viết (momentum) là điều quan trọng nhất trong quá trình viết
Quy trình làm bài blog hoặc bài báo thực tế thường như sau
- Lập kế hoạch outline (viết ra giấy hoặc hình dung trong đầu)
- Tạo bản nháp
- Đọc lại phần đã viết và phản biện một cách có phê phán
- Chỉnh sửa
Quy trình này có thể lặp lại ở nhiều phạm vi khác nhau như cấp độ câu hoặc cấp độ section
Mỗi người sẽ mắc kẹt ở các khâu khác nhau trong giai đoạn lên kế hoạch, viết nháp hay chỉnh sửa
- Tác giả tạo outline khá nhanh, nhưng thường bị kẹt ở cách diễn đạt (phrasing)
- Tác giả tích cực dùng LLM như một công cụ để vượt qua chỗ bị kẹt hoặc tăng tốc việc dựng bản nháp
Quảng cáo

Narrate the story to the model

Khi bắt đầu bản nháp, tác giả viết câu chuyện một cách thô như đang giải thích cấu trúc cho đồng nghiệp, rồi dán vào LLM và yêu cầu tạo outline chi tiết
Việc này được lặp lại cho đến khi cấu trúc trở nên rõ ràng

Write the paragraph myself, even if it’s rough

Khi outline đã hoàn tất, tác giả cố gắng tự viết từng đoạn, dù còn thô cũng không sao
Khi khó viết trọn một câu, tác giả sẽ yêu cầu LLM kiểu như “finish it”, rồi chọn phiên bản tốt nhất trong số các cách hoàn thiện mà mô hình đề xuất, chỉnh nhẹ nếu cần và dùng tiếp
“In the last couple of years, I’ve written and reviewed several technical papers and blog posts. Something always feels slightly off, enough to make the writing quietly uninviting. At the same time, I feel like I get tremendous value from using LLMs to write…” “finish it”
“Trong vài năm qua, tôi đã viết và review nhiều bài báo kỹ thuật và bài blog. Luôn có điều gì đó hơi lệch, đủ để khiến bài viết âm thầm trở nên kém hấp dẫn. Đồng thời, tôi cảm thấy mình nhận được giá trị rất lớn từ việc dùng LLM để viết…” “finish it”
→ Mô hình sẽ đưa ra nhiều gợi ý, và tác giả chọn cái tốt nhất rồi sửa nhẹ để dùng

Use scoped rewrite strategies during revision

Khi đoạn văn hoặc câu chữ còn gượng, thay vì nói “make it better”, tác giả đưa cho LLM những yêu cầu hoặc pattern cụ thể (như cấu trúc tu từ)
Một số chiến lược ví dụ:
- Đặt chủ ngữ và động từ càng gần nhau càng tốt, ngay từ đầu câu
- Dùng cấu trúc SWBST (ai muốn gì, nhưng gặp trở ngại nào, đã phản ứng ra sao, và kết quả thế nào)
  - Ví dụ:
    "We used GPT-4 for summarization. We wanted fluent answers, but it hallucinated facts. So we added a retrieval step. Then we re-ranked outputs based on citation accuracy."
    “Chúng tôi dùng GPT-4 để tóm tắt. Chúng tôi muốn có câu trả lời trôi chảy, nhưng nó lại hallucinate thông tin sai. Vì vậy, chúng tôi thêm một bước retrieval. Sau đó, chúng tôi xếp hạng lại đầu ra dựa trên độ chính xác của trích dẫn”
  - Cấu trúc SWBST rất hiệu quả để truyền đạt ngắn gọn động cơ, vấn đề, cách ứng phó và kết quả ngay cả trong các bài viết kỹ thuật

Parting Thoughts

Giờ đây, đã là thời đại mà những bài viết ở mức trung bình (chất lượng trung bình) có thể được tạo ra dễ dàng bằng LLM
Nhưng việc viết gì, chọn góc nhìn và cấu trúc nào, và nên đào sâu ở đâu vẫn là phần việc của con người
Một bài viết thực sự tốt phải có đóng góp thực chất tương xứng với độ dài, và phải xứng đáng với thời gian người đọc bỏ ra
Đó là tiêu chuẩn mà tác giả theo đuổi

1 bình luận

crawler 2025-07-10

Tôi nghĩ GeekNews hay ở chỗ mật độ thông tin cao theo nghĩa đó.
Cách kết câu kiểu ngắn gọn, lược bỏ chủ ngữ đúng là giống như tối ưu hóa mật độ thật.