3 điểm bởi GN⁺ 22 giờ trước | 1 bình luận | Chia sẻ qua WhatsApp
  • Dịch thuật tự do không phải là thao tác chuyển đổi đơn giản bằng cách đưa tài liệu vào AI, mà là công việc chuyên môn đòi hỏi hiểu ngữ cảnh, bản địa hóa, tra cứu thuật ngữ và kiểm tra tính nhất quán
  • ChatGPT có thể xuất ra một bản dịch tài liệu, nhưng có thể phát sinh vấn đề định dạng và chất lượng bản dịch cũng có thể đáng nghi
  • Có thể dùng AI như một công cụ cho các việc như kiểm tra chính tả, gợi ý sửa câu, rà soát style guide và trích xuất thuật ngữ chuyên môn, nhưng mọi kết quả đều phải được kiểm tra lại
  • AI có thể bịa ra chữ viết tắt và tên tổ chức, bỏ sót cả câu, phớt lờ thuật ngữ được cung cấp và bỏ lỡ ý chính, nên vẫn cần được huấn luyện/coaching liên tục
  • Chỉ vì AI tồn tại mà thù lao của những chuyên gia như dịch giả, nhà văn hay biên tập viên không nên bị hạ thấp; điều đó cũng phơi bày nghịch lý khi người ta cho rằng AI đủ tốt cho công việc của người khác nhưng lại thấy nó không đủ ổn định cho chính công việc của mình

Câu hỏi bắt đầu từ phòng gym

  • Mỗi tối thứ Ba đều học liên tiếp boxing và lớp “body sculpt”, nhưng có hôm từ 4 giờ chiều nhận ba yêu cầu dịch và cả ba đều hạn vào sáng hôm sau nên phải hủy lớp thứ hai
  • Khi có người hỏi vì sao rời lớp, câu trả lời là tôi là dịch giả tự do và có ba deadline vào sáng hôm sau
  • Người kia hỏi: “Chẳng phải chỉ cần tải tài liệu lên ChatGPT là được sao?”, và sau đó là câu trả lời rằng công việc dịch thuật không vận hành như vậy

Dịch thuật không phải là chuyển câu cho đúng ngữ pháp

  • Về mặt kỹ thuật, ChatGPT có thể nhả ra một tài liệu đã dịch, nhưng trước hết có thể phát sinh vấn đề định dạng
  • Vấn đề quan trọng hơn là chất lượng bản dịch có thể đáng nghi
  • Dịch thuật là công việc chuyển điều một con người muốn nói để một con người khác có thể hiểu được, chứ không chỉ dừng ở việc tạo ra những câu đúng ngữ pháp bằng một ngôn ngữ khác
  • Dịch giả thực hiện việc điều chỉnh, bản địa hóa và lựa chọn cách diễn đạt để thông điệp của văn bản gốc được truyền tải một cách tự nhiên và có ý nghĩa
  • Công việc dịch thuật cũng bao gồm việc tra cứu thuật ngữ chuyên môn và kiểm tra để thuật ngữ được dùng nhất quán trong toàn bộ tài liệu

AI không phải là thứ thay thế mà là công cụ

  • AI không thể làm thay công việc, nhưng có thể trở thành công cụ để tận dụng theo hướng có lợi
  • Khi bắt đầu làm dịch thuật cách đây 15 năm, tôi cũng từng đưa những câu khó vào Google Translate để tham khảo cách diễn đạt khác, và sau này cũng dùng DeepL theo cách tương tự
  • Chuyên gia nào cũng dùng công cụ; điều này cùng bản chất với việc kế toán dùng công thức Excel, quản lý tận dụng định dạng PowerPoint hay nhà hàng tra cứu công thức món ăn đang thịnh hành
  • Chính tài liệu này được viết trực tiếp, nhưng việc kiểm tra chính tả có thể dùng Antidote, và cũng có thể hỏi ý kiến Claude rồi áp dụng nếu có gợi ý hữu ích
  • Có thể chấp nhận những đề xuất thông minh như xóa bớt đoạn hoặc làm câu rõ nghĩa hơn, nhưng phán đoán cuối cùng vẫn do con người thực hiện

Các trường hợp sử dụng thực tế và giới hạn

  • Một khách hàng có nhiều style guide dày 500 trang, trong đó quy định cả định dạng trích dẫn và cách chèn chú thích cuối trang
  • Nếu đưa style guide vào ChatGPT để dùng cho bước rà soát cuối, nó có thể đánh dấu ở một mức độ nào đó những chỗ vi phạm quy tắc
  • Có thể dùng AI để trích xuất thuật ngữ chuyên môn từ tài liệu tham khảo và tạo glossary nội bộ; cách này nhanh hơn và bớt khó chịu hơn so với Ctrl+F
  • Mọi kết quả từ AI đều phải kiểm tra lại hai, ba lần, và việc dùng AI không phải là nút bấm ma thuật mà là một cách làm việc khác
  • AI có thể bịa ra chữ viết tắt và tên tổ chức, không dịch cả câu, phớt lờ thuật ngữ đã được cung cấp nếu không liên tục nhắc lại, và đôi khi hoàn toàn bỏ lỡ ý chính

Nghịch lý về thù lao và độ tin cậy

  • Chỉ vì AI tồn tại mà thù lao của dịch giả, nhà văn, biên tập viên và các chuyên gia khác không nên bị hạ thấp
  • Lập luận này cũng giống như việc không ai trả ít hơn cho thợ sửa mái nhà chỉ vì họ dùng búa thay vì làm bằng tay không
  • Người kia nói rằng “AI lúc nào cũng đang tốt lên”, nhưng khi được hỏi có dùng AI nhiều trong chính công việc của mình hay không, lại trả lời rằng nó chưa đủ đáng tin để sử dụng
  • Chức danh của người đó là Director General phụ trách nhân sự và dịch vụ doanh nghiệp, đồng thời đang tạm đảm nhiệm vị trí Workforce Planning and Resources Management
  • Khi AI được xem là đủ tốt cho việc của người khác nhưng lại không đủ đáng tin cho chính công việc của mình, giá trị của lao động chuyên môn rất dễ bị đánh giá thấp

1 bình luận

 
Ý kiến trên Hacker News
  • Cái kết thực sự là một điểm nhấn rất mạnh. Có vẻ đa số đồng ý với hai điều: AI là một phúc lành lớn cho những việc tôi không làm được, và nếu đó không phải lĩnh vực chuyên môn của tôi thì rất khó nhìn ra khuyết điểm trong kết quả, đồng thời cũng bớt phải trả tiền và chờ con người làm
    Ngược lại, họ cho rằng AI quá kém để thay thế tôi. Trình độ kỹ năng của tôi quá cao, nên khả năng nó đủ giỏi để thay thế 90% công việc tôi được trả tiền để làm gần như chỉ mang tính lý thuyết, cùng lắm cũng chỉ là một công cụ
    Vì thế tôi dùng AI cho các câu hỏi y tế, còn bác sĩ thì dùng AI để viết phần mềm, và cả hai cùng cười mỉm khi nhìn chất lượng mà bên kia nhận được

    • Một nhóm thứ ba thú vị đang xuất hiện. Họ thừa nhận vấn đề chất lượng, nhưng vẫn tin rằng có thể giải quyết bằng cách áp thêm AI vào đầu ra
      Ví dụ, họ khởi chạy vô số “agent” và gán cho chúng tính cách như giám đốc bảo mật hay phụ trách chất lượng. Về thực chất, đó là một cách quá phức tạp và khó đoán để mở các phiên LLM cho việc rà soát bảo mật hay kiểm tra chất lượng
      Cũng có những người biết rõ ứng dụng của mình đầy lỗi, nhưng lại nghĩ rằng cứ để AI sửa mỗi khi lỗi xuất hiện là được. Họ vẫn chưa gặp sự cố xâm phạm bảo mật hay lỗi mất dữ liệu, và chỉ hình dung Claude như thứ để sửa một div không căn giữa hoặc xử lý một mã lỗi thỉnh thoảng hiện ra
    • Diễn đạt rất hay. Ai cũng nghĩ rằng AI không làm được việc của mình, nên cuối cùng AI sẽ đi làm việc của người khác
      Tôi vẫn chưa biết phải khái quát hóa thế nào, nhưng có vẻ tồn tại một hệ quả kiểu Peter Principle hay hiệu ứng Gell-Mann liên quan đến AI. Đại loại như “AI tăng tiến đến mức độ bất tài của người dùng”, hoặc “mức độ tự tin vào đầu ra của AI tỷ lệ nghịch với khả năng kiểm chứng nó”
    • Liệu thực sự phần lớn mọi người dùng kỹ năng cốt lõi ở trình độ cao của mình trong 90% thời gian sao? Tôi tò mò người khác cảm thấy thế nào
      Tôi là một giáo sư, một nghề được xem là đòi hỏi cao về trí tuệ, và tôi nghiên cứu NLP/AI. Tôi không nghĩ AI sẽ thay thế công việc trí tuệ cốt lõi của tôi trong tương lai gần, nhưng tôi cũng không cho rằng phần việc cốt lõi đó chiếm nổi 10% thời gian của mình
      Phần lớn là viết báo cáo hành chính, viết và chỉnh sửa hồ sơ xin tài trợ nghiên cứu, chấm thi và chấm bài tập, thiết kế poster, lên lịch giảng dạy cho một năm cụ thể, làm hình cho slide, ra đề bài tập và đề thi, tham dự các cuộc họp điều phối giảng dạy. Những việc này có thể hoặc nên được tự động hóa
      Ngay cả việc dạy đi dạy lại cùng một môn nhiều lần, xét một cách khách quan, cũng có thể được tự động hóa. Chúng ta tiếp tục làm phần nhiều vì các yếu tố con người gắn với động lực, chứ không hẳn vì bài giảng do con người dạy vượt trội hơn về mặt trí tuệ
    • Có vẻ như nguyên tắc chung là thế. Nếu AI làm tốt hơn tôi thì tôi dùng, còn nếu không thì thôi
      Mỗi lần mô hình tiên tiến hơn được cải thiện, tôi lại thấy một làn sóng người hoài nghi AI đột nhiên biến thành tín đồ. Họ nói kiểu “Năm ngoái AI chưa code được, giờ thì tôi dùng nó cho mọi thứ!”
      Điều thú vị là rồi bạn nhận ra trình độ lập trình của người nói đó chính là mức Claude Opus 4.5 ở thời điểm chuyển đổi, hoặc tương đương trình độ tiên tiến nhất lúc bấy giờ
      Trong khi đó, những người còn lại vẫn tiếp tục dùng AI như một công cụ đơn thuần, giống người trong bài. Tôi tự hỏi sẽ mất bao lâu cho đến khi máy tính lập trình giỏi hơn tôi để tôi cũng chuyển phe
    • Tôi có cảm giác như chỉ mình tôi nghĩ AI thực sự làm tốt những việc tôi phải làm hơn tôi rất nhiều. Không phải vì thế hệ mô hình mới nhất; tôi đã thấy như vậy từ vài năm trước rồi
      Ở giai đoạn hiện tại, tôi không nghĩ ra nổi dù chỉ một việc nào mà mình có thể thực sự cạnh tranh sòng phẳng với AI. Tôi không biết là do tôi kém, hay do người khác quá tự tin. Có lẽ những người cảm thấy giống tôi chỉ là không nói to điều đó ra thôi
  • Nói hơi lạc sang chuyện dịch thuật một chút, tôi đã đọc The Master and Margarita qua hai bản dịch. Bản đầu tiên chán đến mức tôi buộc phải dừng trước khi hết chương 1, tôi thậm chí còn không tìm được tên dịch giả, nhưng đó là bản dịch toàn bộ các biệt danh kiểu Nga
    Cứ liên tục nói về một gã tên “homeless”, nên tôi tưởng đây đơn giản là một cuốn sách dở và bỏ mặc nó suốt nhiều năm
    Tôi không hiểu vì sao cuốn này lại nổi tiếng đến vậy
    Rồi tôi tình cờ gặp bản dịch của Diana Burgin và Katherine Tiernan O'Connor; tôi không biết tiếng Nga, nhưng thấy bản này gần như thuộc hàng tốt nhất có thể. Thật sự là một công trình khổng lồ
    Bạn cũng có thể thấy hiệu ứng tương tự trong bản dịch máy của We của Yevgeny Zamyatin. Nếu dịch chính quyền là “United State” thì rất dễ nhầm với “United States”, trong khi bản dịch dùng “One State” tốt hơn nhiều

    • Tôi vẫn còn nhớ rất rõ cú sốc hồi đầu tuổi 20 khi biết truyện tranh Astérix ban đầu được viết bằng tiếng Pháp rồi mới được dịch. Việc đặt tên ông thầy tu druide theo kiểu tiếng Anh như Getafix đúng là incroyable
  • Đây rõ ràng là bài do người thật viết mà lại đầy em dash. Không phải vì AI, mà vì con người đã dựa vào em dash thay vì gọt giũa để câu văn trôi tự nhiên hơn, gần như khiến tôi muốn khóc

    • Câu đầu tiên: “In my Ottawa life, every Tuesday evening, I take two gym classes back to back—boxing and the pompously named “body sculpt,” which makes me discover muscles I didn’t know I had.”
      Dấu em dash này thực sự khớp với nhịp điệu khi nói. Người ta sẽ nói kiểu “Tối thứ Ba nào tôi cũng học liền hai lớp, boxing với ‘body sculpt’. Cái tên nghe buồn cười nhỉ”
      Một phần dòng chảy của câu có hơi gượng, nhưng không phải vì em dash. Những người theo chủ nghĩa ngữ pháp có thể nói rằng không thể tách nó thành câu riêng mà không thêm từ, và vì đủ thứ lý do cũng không thể nối bằng dấu phẩy. Nên mới có em dash ở đó
      Viết lại câu chưa chắc đã tự nhiên hơn, mà có khi còn kém tự nhiên đi
    • Tôi ước gì nhiều người hơn từng được tiếp xúc, dù chỉ sơ qua, với dịch giả chuyên nghiệp. Đây là một nhóm rất nhỏ nhưng có ý nghĩa sâu sắc đối với nhân loại, và ít nhất đã như vậy suốt hàng nghìn năm. Sau này chắc vẫn sẽ thế
    • Khi viết câu, quy tắc đầu tiên tôi làm, trước hết hơn mọi thứ khác, là xem có thể loại bỏ em dash bằng cách sắp xếp lại các thành phần hay không
      Cập nhật: xin lỗi nếu điều đó không rõ ràng. Tôi không nhịn được
    • Em dash thực sự rất hay, và đặc biệt trong văn phong phi kỹ thuật ngoài nước Mỹ, đó là một lựa chọn văn phong tiêu chuẩn
    • Tiếng Anh không phải tiếng mẹ đẻ của tôi. Và tôi thích em dash. Nếu đó là tội lớn nhất của tôi thì đành chịu vậy
  • Nếu vào năm 2024 mà nói ChatGPT có thể hỗ trợ toán ở trình độ cao học thì hẳn đã bị cười nhạo, nhưng năm nay các mô hình AI đang giải được những bài toán Erdos trước đây chưa từng được giải chỉ với các prompt đơn giản
    Có vẻ thật ngớ ngẩn khi tưởng tượng rằng tồn tại một rào cản nền tảng nào đó giữa trí thông minh con người và AI khiến AI tuyệt đối không thể làm được nhiều việc mà con người có thể làm. Những thứ thường được nêu ra như suy luận ý định, nắm bắt cảm xúc, phản ánh các giá trị văn hóa — con người làm được còn AI thì không — nếu được cung cấp đủ ngữ cảnh thì hiện nay AI cũng làm được
    Quan trọng hơn, những việc đó không phải là phép màu chỉ diễn ra bên trong hộp sọ con người mà là sản phẩm của xử lý thông tin. Chỉ là loại xử lý thông tin mà trước đây rất khó khiến máy tính làm tốt, và cho đến nay AI dường như vẫn tiếp tục tiến bộ
    Tôi hoàn toàn đồng ý rằng giá trị đặc biệt của con người không gắn với năng lực thực hiện các tác vụ hữu ích. Nhưng việc phủ nhận năng lực của các mô hình AI có vẻ là một sai lầm phổ biến mà nhiều người mắc phải, và đáng tiếc là thực tế bắt kịp họ trước khi họ kịp chuẩn bị về mặt cảm xúc

  • Cũng đáng lưu ý rằng trong câu “nếu được cung cấp đủ ngữ cảnh”, có thể thay từ “ngữ cảnh” bằng “đô la”. Có vẻ khá nhiều thành tựu ấn tượng kiểu này xuất phát từ đó
    Như mọi khi, vì các đột phá gần đây đều trông như thuộc kiểu “suy nghĩ nhiều hơn”, nên chưa rõ liệu mô hình có tiếp tục vừa tốt hơn vừa rẻ hơn hay không. Với dịch thuật, xét đến kỳ vọng về đơn giá đầu ra, tôi khá nghi ngờ việc một LLM “suy nghĩ nhiều hơn” có thực sự hữu ích hay không

  • Đồng ý, nhưng cũng nên nhớ rằng bộ não, đặc biệt là não người, cực kỳ lớn, và mỗi token mang nhiều ý nghĩa hơn rất nhiều so với từng cơn co cơ cực nhỏ tách biệt
    Vì vậy, ngay cả “nhận thức” cực kỳ nguyên thủy cũng có thể trông như đang làm được nhiều hơn thực tế rất nhiều

  • Nếu “vào năm 2024 mà nói ChatGPT có thể hỗ trợ toán ở trình độ cao học thì hẳn đã bị cười nhạo, nhưng năm nay các mô hình AI đang giải được những bài toán Erdos trước đây chưa từng được giải chỉ với các prompt đơn giản”, thì tôi tò mò đấy, có bằng cao học toán không vậy?

  • Đúng vậy. Cứ như thể người ta nghĩ AI sẽ mãi chỉ dừng ở LLM, và sẽ không phát triển các world model bao gồm đánh giá trạng thái hiện tại, dự đoán trạng thái tiếp theo một cách động, suy luận nhân quả, tính thường tồn của vật thể và những thứ tương tự
    Tôi không làm trong ngành AI, nhưng chắc chắn tôi nghĩ đang có rất nhiều nghiên cứu và công việc được tiến hành theo hướng này

  • Thành thật mà nói, Fable đã khiến tôi khá sợ. Đó lại là một bước nhảy lớn nữa, không phải ở mảng code trực tiếp mà ở một khía cạnh khác
    Tôi từng khá thoải mái với trạng thái “phần triển khai thì cậu làm đi, còn việc meta và chỉnh hướng thì để tôi”, nhưng giờ thì có vẻ chẳng cần chỉnh hướng nữa, cũng chẳng cần việc meta. Đây là backlog, xong thì báo tôi, còn tôi có thể ra bãi cỏ nghịch chút cho đến khi cần review và tinh chỉnh à. Chắc cỡ ngày mai?
    Nó khiến tôi nhớ lại lần đầu tiên khoảng năm 2023 tôi thấy các coding agent loay hoay giải issue và đã nghĩ “to chuyện rồi đây”. Cũng tương tự như khi các GPT đời đầu bắt đầu tạo ra những câu đùa thực sự tạm ổn
    Nếu viết phiên bản hiện đại của kiểu kinh điển “làm greentext đi” thì sẽ là: tôi là kỹ sư phần mềm cấp cao, chịu trách nhiệm để ticket thực sự được triển khai, thỉnh thoảng cũng mở IDE và tự viết code, một ngày nọ mở IDE ra thì ticket đã được đóng rồi, agent xử lý suốt đêm, không cần chỉnh hướng, không cần ghi chú review, không còn việc gì để làm, distress.jpg, hỏi quản lý tôi nên làm gì thì được bảo “hãy tập trung vào kiến trúc cấp cao”, hỏi “kiến trúc cấp cao nào cơ?”, thì được đáp “ai mà biết, anh là kỹ sư cấp cao mà”, rage.jpg, nghỉ việc, trở thành prompt engineer, chỉ cần nói đơn giản là muốn làm gì, đến ngày đầu tiên ngồi xuống để viết prompt thì AI đã viết sẵn rồi

  • Tôi không nghi ngờ gì việc tác giả dịch tốt hơn AI, nhưng bản dịch AI đã trở nên quá tốt đến mức không biết công việc dịch thuật còn lại được bao nhiêu nữa, hay cuối cùng sẽ chủ yếu xoay quanh khâu hiệu đính
    Ví dụ, gần đây tôi đã đọc bản The Three Musketeers do Lawrence Ellsworth dịch và thấy rất thú vị. Tôi không nói hay đọc được tiếng Pháp, nhưng theo tôi hiểu thì bản dịch của Ellsworth được xem là một trong những bản chuyển ngữ chính xác hơn của tác phẩm đó
    Vì tò mò, tôi đã đưa bản gốc tiếng Pháp của The Three Musketeers vào Claude Fable và yêu cầu nó dịch chính xác, đồng thời giữ được giọng điệu vui nhộn của nguyên tác và không kiểm duyệt gì cả. Tôi chưa đọc hết toàn bộ, nhưng đã so sánh vài chương giữa bản dịch của Ellsworth và bản dịch của Fable
    Thành thật mà nói, chúng giống nhau đến mức đáng kinh ngạc. Theo tôi thấy thì hầu như không có khác biệt thực chất nào giữa bản dịch của Ellsworth và bản dịch của Fable. Tôi nghĩ câu văn của bản Ellsworth có phần nhỉnh hơn một chút, nhưng câu văn phía Fable cũng hoàn toàn đọc được
    Nhắc lại là tôi không biết tiếng Pháp nên không thể chắc chắn, nhưng tôi không nghĩ trải nghiệm khi đọc bản Fable sẽ khác đáng kể so với bản Ellsworth
    Tuy vậy, điều này rất có thể mang tính tự củng cố ở một mức độ nào đó. Fable đã được huấn luyện trên bản dịch của Ellsworth nên có thể đã sao chép nó khá trực tiếp. Có một cái bẫy ở đây vì tôi không biết ngôn ngữ nào ngoài tiếng Anh. Để so sánh độ chính xác của bản dịch thì phải so với một bản dịch khác, nhưng nếu đã có bản dịch khác thì rất có thể nó ảnh hưởng đến kết quả, còn nếu không có bản dịch thì lại không có cách nào để hiệu đính
    Dù vậy, tôi vẫn định tiếp tục đọc các phần tiếp theo bằng bản dịch của Ellsworth. Nó cho tôi cảm giác như một bản chuẩn hơn, và tôi cũng thấy câu văn của nó nhỉnh hơn một chút

    • Đây không phải là một bài kiểm tra tốt. Dữ liệu huấn luyện của Claude gần như chắc chắn có chứa nhiều bản dịch của The Three Musketeers
    • Nếu vừa nói “bản dịch AI đã trở nên quá tốt” lại vừa nói “tôi không biết ngôn ngữ nào ngoài tiếng Anh” thì hoàn toàn không có tư cách để đưa ra phán đoán đó
      Hơn nữa, chính người đó cũng thừa nhận bài kiểm tra của mình có khiếm khuyết nghiêm trọng đến mức gần như vô dụng, vậy mà vẫn phát biểu rất to tát về chất lượng
    • Rất có khả năng bản dịch của Ellsworth nằm trong kho ngữ liệu. Về cơ bản, bạn đã yêu cầu Claude ói lại nó
      Các LLM ghi nhớ tất cả những cuốn sách nổi tiếng. Nếu dẫn dắt đúng cách, có thể khiến chúng đọc lại gần như từng từ một
    • Với tư cách là người thường xuyên đọc tác phẩm dịch và đôi khi cũng đọc dịch máy, tôi thấy dịch máy không ổn lắm. Như chính bạn cũng thừa nhận, kết quả ở đây bị thiên lệch rất mạnh
      Dịch thuật là việc khó. Nếu bạn thường xuyên đọc các bản dịch từ một ngôn ngữ cụ thể, sẽ có một thứ “mùi” rất đặc trưng của dịch máy; khó diễn tả nhưng nó hiện diện rõ ràng. Bản dịch tốt ở một đẳng cấp cao hơn hẳn dịch máy
      Có thể các LLM mới nhất giỏi dịch hơn, nhưng nhìn chung ở thời điểm hiện tại thì phần lớn vẫn khá tệ. Có thể ổn với các đoạn rất ngắn, nhưng tuyệt đối không phải cho nội dung dài
    • Điểm mấu chốt là toàn bộ bản dịch đã nằm trong tập huấn luyện của ChatGPT. Hồi tưởng là một bài toán trong học máy đã được giải quyết khá tốt
      Một cuốn tiểu thuyết Pháp xuất bản hôm qua sẽ được dịch tốt đến đâu? Có thể cả nguyên tác lẫn bản dịch đều chưa có trong tập huấn luyện, hoặc thậm chí bản dịch còn chưa tồn tại
      Cuối tuần này tôi đã nhờ ChatGPT dịch một bức thư viết bằng tiếng Slovenia, và dù nó nắm được ý chính tổng thể, nó bỏ lỡ khá nhiều sắc thái. Chỉ với lựa chọn từ đồng nghĩa cũng có thể truyền tải rất nhiều thông tin qua những dụng ý giọng điệu nhỏ, và nó bỏ sót hoàn toàn những điều đó
  • Đây là một góc nhìn thú vị. Theo như tôi nghe thì dịch thuật vừa là (a) một trong những nghề đầu tiên mất việc vì AI, vừa là (b) lĩnh vực mà những người hoài nghi LLM và nghệ thuật do AI tạo ra thường nêu như một ví dụ AI “chấp nhận được”

    • Là một trong những người như vậy, tôi nghĩ ở đây có sắc thái. Khi dịch cho chính mình, AI rất tuyệt
      Nhưng khi dịch cho người khác, cần nhiều sự cẩn trọng và phán đoán của con người hơn. Đặc biệt là trong những trường hợp như tài liệu hướng dẫn sử dụng, nơi diễn đạt tệ có thể khiến ai đó bị thương
    • Dịch giả cũng có nhiều loại. Dịch tài liệu pháp lý/kinh doanh hoàn toàn khác với dịch phim/sách/trò chơi
      Ít nhất với trường hợp nguyên bản là tiếng Anh, tôi có thể tự tin nói rằng LLM làm tốt hơn mức trung bình của các bản dịch tiểu thuyết xuất bản theo lối truyền thống ở nước tôi. Mỗi lần xem phim có phụ đề là tôi luôn thấy những câu dịch sai rất rõ
    • Ngay cả trước thời LLM, các dịch giả đã bắt đầu mất việc từ khoảng 10 năm trước vì dịch máy như DeepL. Họ vẫn nhận được đề nghị, nhưng thù lao giảm xuống, nên ngay từ khi đó việc mưu sinh bằng nghề dịch đã khó hơn nhiều
    • Ví dụ, dịch để đọc một trang web thì đủ chấp nhận được, nhưng chưa đạt đến mức bạn muốn xuất bản một cách chuyên nghiệp
      Về mặt khái niệm, nó khá giống việc lỗi chính tả và lỗi ngữ pháp không phải vấn đề lớn trong tin nhắn hay email nhanh, nhưng lại trông rất tệ nếu xuất hiện trong các ấn phẩm như nội dung quảng cáo, CV hay nhãn thuốc
    • Không phải mọi bản dịch đều giống nhau. Dịch văn học thường bản thân nó đã là một tác phẩm nghệ thuật, và tự động hóa việc đó cũng giống như tự động hóa bài tập về nhà hay việc nâng tạ trong phòng gym: hoàn toàn bỏ lỡ cốt lõi của vấn đề
      Tôi không rõ trình độ hiện đại hiện nay đến đâu, nhưng tôi có thể tin rằng việc dịch hướng dẫn dùng máy nướng bánh mì hay các câu chữ thông thường sẽ sớm được tự động hóa
  • Tôi vừa mới biết bài viết của mình đang được thảo luận ở đây nên tất nhiên tôi phải ghé vào
    Mọi người đã dành thời gian đọc bài của tôi, nên tôi cũng định đọc kỹ cả chuỗi này. Tôi thực sự thích đọc và cũng tò mò mọi người nghĩ gì về AI
    Giai thoại trong bài là có thật. Tôi chỉ đổi chức danh mà thôi
    Quan điểm của tôi về AI đã đi từ “chuyện này chắc chắn không ảnh hưởng đến mình đâu” sang “AI thật ngu ngốc”, rồi nhận ra thực ra người ngu là tôi vì không biết phải viết prompt thế nào. Bây giờ tôi đang ở giai đoạn làm sao để nó hữu ích cho mình
    Dù vậy, tôi vẫn mong nhà tuyển dụng, khách hàng và cả thế giới nói chung hiểu rằng đây không phải là một nút bấm ma thuật
    Việc nó có thể bất ổn đến mức nào thật sự khiến người ta phát điên. Tất nhiên, nó có thể dịch theo nghĩa cho bạn biết đại khái người ta đang nói gì. Nhưng điều đó không có nghĩa là đó là một bản dịch tốt. Tôi có thể nêu ra cả triệu ví dụ

    • Nhìn vào sự thay đổi quan điểm của bạn cho đến nay, bạn có nghĩ rằng trong vòng một năm tới mình có thể bước sang giai đoạn kiểu “ôi chết, cái này làm tốt như mình mà lại còn nhanh hơn rất nhiều” không?
      Điều đó đã xảy ra với tôi trong lập trình thuần túy. Đó từng là điều mà tôi nghĩ tuyệt đối không thể xảy ra
      Sự bất ổn có vẻ cũng có thể chỉ là một giai đoạn sơ khai tạm thời thôi
  • Vì tò mò nên vài phút trước khi đọc chuỗi này, tôi đã dán một bài báo tiếng Pháp mà mình đang đọc vào ChatGPT và nhờ nó dịch sang tiếng Anh. Về mặt chức năng thì rõ ràng là dùng được, và tôi cũng sẽ không ngần ngại dùng nó để dịch các bài báo bằng ngôn ngữ mà tôi không biết
    Nhưng nó không đạt mức chuyên gia. Có vài chỗ nó dịch sai ngữ pháp tiếng Pháp, và câu văn cũng mang tính hành chính. Nó không hề cố gắng làm cho bài viết trôi chảy như thể vốn được viết bằng tiếng Anh, mà chỉ chuyển từng câu theo nghĩa đen
    Nếu hỏi tôi có đọc một bài viết được viết theo kiểu đó không, thì với bài ngắn tôi sẽ đọc. Tiểu thuyết thì tuyệt đối không

    • Vấn đề là rất nhiều công việc chuyên môn lại được giao trong những tình huống mà bên đặt hàng hoàn toàn có thể hài lòng với công việc không chuyên
      Dịch thuật mang tính nghệ thuật sẽ luôn có chỗ đứng, nhưng dịch gấp cũng có chỗ đứng của nó
  • Tôi không nghĩ LLM có thể thay thế các dịch giả của những ngôn ngữ ít người dùng
    Tôi biết một người dịch giữa hai ngôn ngữ Đông Âu, và có những công việc cần đến từ điển chuyên ngành. Trong những trường hợp như vậy, dùng LLM rất khó để tin cậy, và sẽ tốn nhiều công sức hơn để kiểm tra rồi sửa lại so với làm đúng ngay từ đầu
    Hơn nữa, tôi cũng rất nghi ngờ chuyện các công ty công nghệ Mỹ có đang huấn luyện LLM cho một ngôn ngữ chỉ có “vỏn vẹn” 6 triệu người dùng hay không
    Ngay cả ở mảng giải trí, ai lớn lên ở Đông Âu với phim lậu được lồng/đọc bằng giọng mũi đơn điệu hoặc game dịch máy thì đều biết chúng làm giảm trải nghiệm đến mức nào. Tất nhiên có thể nói rằng “AI có thể làm tốt hơn”, nhưng liệu nó có thể giữ được tính nhất quán và nắm bắt được sắc thái văn hóa, thành ngữ các kiểu không?

    • Với ngôn ngữ chỉ dùng trong khẩu ngữ thì lại càng như vậy
  • “Khi mặc đồ tập gym, nhìn chung chúng ta đều trông khá giống nhau”
    Tôi không biết có phải não tôi hoạt động khác tác giả không, nhưng câu này làm tôi ngạc nhiên. Đồ tập gym không ảnh hưởng gì đến nhận thức của tôi. Khuôn mặt, cơ thể và dáng điệu mới quan trọng, còn quần áo thì hầu như không lọt vào mắt. Với tôi điều này vô lý đến mức đáng ngờ
    Điều buồn theo góc nhìn lấy con người làm trung tâm không phải là không nhận ra ai đó, mà có lẽ là việc cho rằng điều đó không đáng vì có lẽ sẽ không bao giờ gặp lại. Đó là trạng thái không có cộng đồng. Cộng đồng và các mối quan hệ giữa người với người vẫn là những thứ chúng ta trân trọng

    • Tôi là người đã viết bài đó. Tôi là người thật
      Và tôi thực sự rất tệ trong việc nhận ra những người mà mình không tương tác. Cứ tưởng tượng có 50 người mặc legging đen đứng trước gương là được