ChatGPT là một tệp JPEG mờ của web

xguru · 2023-02-14T13:46:32+09:00

Bài viết của Ted Chiang, người được đánh giá là một trong những tác giả SF xuất sắc nhất hiện nay Câu chuyện cho rằng ChatGPT lưu trữ thông tin bằng cách nén, nên giống như việc nhìn vào một tệp JPEG mờ chứ không phải bản gốc Năm 2013, người ta phát hiện máy photocopy Xerox khi sao chép bản vẽ đã biến một số thành một số khác Sự cố xảy ra do trong quá trình số hóa để sao chép, cơ chế nén mất dữ liệu JBIG2 chỉ lưu một chữ số giống nhau rồi tái sử dụng nó Dù khó có thể nói trường hợp này rõ ràng tương tự với ChatGPT của OpenAI, nhưng khi lưu trữ thông tin từ web thì một kịch bản tương tự có thể xảy ra Hãy tưởng tượng bạn bị mất quyền truy cập Internet Bạn muốn nén toàn bộ văn bản trên web để tạo một bản sao Nhưng vì chỉ có dung lượng bằng 1% quy mô cần lưu, bạn sẽ phải nén và có lẽ phải dùng thuật toán mất dữ liệu Giờ đây bạn có thể tìm kiếm mọi thứ, nhưng vì văn bản bị nén quá nhiều nên không thể tra ra các trích dẫn chính xác Hãy xem ChatGPT như một tệp JPEG mờ của toàn bộ văn bản trên web Giống như JPEG, nó giữ lại rất nhiều thông tin từ web, nhưng không giữ nguyên chuỗi bit hoàn toàn giống hệt Mọi thứ bạn nhận được chỉ là xấp xỉ Nhưng vì sự xấp xỉ này được trình bày dưới dạng văn bản có ngữ pháp xuất sắc do ChatGPT tạo ra, nên thường được chấp nhận Cách nén mất dữ liệu này không phải là toàn bộ cách để hiểu năng lực của ChatGPT Nhưng cũng là một cách để hiểu các "ảo giác" mà ChatGPT tạo ra, hay những câu trả lời vô nghĩa về sự thật Những ảo giác này cũng đủ thuyết phục, giống như các con số sai mà máy Xerox tạo ra, đến mức muốn nhận ra chúng là giả thì phải đối chiếu với bản gốc Các mô hình ngôn ngữ lớn xác định các tính quy luật thống kê trong văn bản Những cụm như "nguồn cung thấp" thường xuất hiện gần với câu "giá tăng" Một chatbot đã thấy rất nhiều mối quan hệ như vậy sẽ trả lời bằng việc giá tăng khi được hỏi về tác động của tình trạng thiếu cung Việc LLM (mô hình ngôn ngữ lớn) thu thập vô số tương quan giữa các thuật ngữ kinh tế có thật sự cho phép nói rằng nó hiểu lý thuyết kinh tế hay không? Các mô hình như ChatGPT không thực hiện nén không mất dữ liệu. Nghĩa là chúng không tái tạo chính xác văn bản gốc Khi GPT-3 thực hiện phép cộng trừ với một cặp số, nếu là số có 2 chữ số thì gần như luôn đúng, nhưng nếu là số có 5 chữ số thì độ chính xác giảm mạnh xuống còn 10% Bởi trên web không có nhiều trang chứa các văn bản như "245 + 821" Dù đã tổng hợp một lượng thông tin khổng lồ, nó vẫn không suy ra được "nguyên lý của số học" Hãy tưởng tượng ChatGPT là một thuật toán không mất dữ liệu Khi đó nó sẽ trả lời câu hỏi bằng cách trích nguyên văn một phần từ các trang web liên quan Có lẽ khi ấy chúng ta sẽ chỉ nghĩ phần mềm này là một cải tiến nhỏ so với công cụ tìm kiếm hiện có và sẽ bớt ấn tượng hơn Việc ChatGPT diễn đạt lại thay vì trích nguyên văn tài liệu từ web khiến nó trông như một học sinh đang diễn đạt suy nghĩ bằng lời của mình thay vì lặp lại nguyên xi những gì đã đọc Điều đó tạo ra ảo giác rằng ChatGPT hiểu tài liệu Đã có rất nhiều cách sử dụng cho LLM được đề xuất, và nếu nghĩ nó là một tệp JPEG mờ thì có thể đánh giá điều gì phù hợp hoặc không phù hợp Liệu mô hình ngôn ngữ lớn có thể thay thế tìm kiếm hiện tại không? Để có thể tin tưởng LLM, ta cần biết rằng chúng không bị nhồi nhét tuyên truyền hay thuyết âm mưu (tức là không được huấn luyện trên dữ liệu kỳ quặc) Ta cần biết rằng tệp JPEG đó đang chụp đúng phần của web Nhưng ngay cả khi LLM chỉ chứa thông tin ta muốn, vẫn còn vấn đề về độ mờ Nếu có một kiểu độ mờ có thể chấp nhận được, thì đó là việc diễn giải lại thông tin bằng từ ngữ khác Và cũng có kiểu độ mờ hoàn toàn không thể chấp nhận khi tìm kiếm sự thật, như việc bịa đặt trắng trợn Chưa rõ về mặt kỹ thuật có thể loại bỏ độ mờ không thể chấp nhận mà vẫn giữ lại độ mờ có thể chấp nhận hay không, nhưng có lẽ chúng ta sẽ sớm biết Ngay cả nếu có thể hạn chế để LLM không giả mạo, liệu ta có nên dùng nó để tạo nội dung web không? Điều đó chỉ có ý nghĩa khi mục tiêu của ta đơn thuần là đóng gói lại thông tin vốn đã có trên web Một số công ty tồn tại chính để làm việc đó, thứ mà ta gọi là các content farm Có lẽ độ mờ của LLM sẽ hữu ích cho họ như một cách để tránh vi phạm bản quyền Nhưng nói chung, tôi muốn nói rằng điều gì tốt cho content farm thì không tốt cho những người đang tìm kiếm thông tin Việc các bản đóng gói lại này gia tăng đã khiến chuyện tìm kiếm thứ gì đó trên mạng hiện nay trở nên khó hơn Càng nhiều văn bản do LLM tạo ra được đăng lên web, web sẽ càng trở thành một phiên bản mờ hơn của chính nó Chúng ta gần như không có thông tin về GPT-4, nhưng nếu dự đoán thì có lẽ những người ở OpenAI đã cố gắng loại trừ tài liệu do ChatGPT hoặc các LLM khác tạo ra khi thu thập văn bản cần thiết cho nó Nếu điều đó là thật, ta sẽ có thêm cơ sở để kiểm chứng phép so sánh giữa LLM và nén mất dữ liệu Khi nén lặp đi lặp lại một tệp JPEG, ngày càng nhiều thông tin bị mất và xuất hiện nhiều nhiễu nén hơn Giống như ngày xưa photocopy lại bản photocopy, chất lượng chỉ ngày càng tệ đi Liệu LLM có thể giúp con người tạo ra sáng tác nguyên bản không? Theo tôi, bắt đầu từ một bản sao mờ thay vì bản gốc không phải là cách tốt để tạo ra thứ nguyên bản Nếu bạn là một nhà văn, trước khi viết được thứ gì độc đáo, bạn sẽ viết rất nhiều thứ không độc đáo Thời gian và công sức dành cho những công việc không độc đáo đó không hề bị lãng phí Ngược lại, chính điều đó cho phép bạn cuối cùng tạo ra thứ gì đó nguyên bản Thời gian dành để chọn đúng từ và sắp xếp lại câu chữ cho mạch lạc sẽ dạy cho bạn cách văn xuôi truyền tải ý nghĩa Việc yêu cầu học sinh viết bài luận không chỉ là cách kiểm tra mức độ hiểu tài liệu Mà còn là để cho họ trải nghiệm việc diễn đạt suy nghĩ của mình một cách rõ ràng Trong tương lai, có thể sẽ có khả năng xây dựng AI có thể viết hay dựa hoàn toàn trên chính trải nghiệm của nó về thế giới Đó sẽ là một thời khắc quan trọng, nhưng ngày đạt được điều đó vẫn nằm ngoài phạm vi dự đoán của chúng ta Nếu phải lưu một bản sao trên máy chủ có không gian hạn chế mà không có quyền truy cập Internet, thì mô hình ngôn ngữ lớn như ChatGPT có thể là một giải pháp tốt "Nhưng chúng ta chưa mất quyền truy cập Internet. Khi bản gốc vẫn còn đó, tại sao lại phải dùng một tệp JPEG mờ"?

(newyorker.com)

41 điểm bởi xguru 2023-02-14 | 26 bình luận | Chia sẻ qua WhatsApp

Bài viết của Ted Chiang, người được đánh giá là một trong những tác giả SF xuất sắc nhất hiện nay
Câu chuyện cho rằng ChatGPT lưu trữ thông tin bằng cách nén, nên giống như việc nhìn vào một tệp JPEG mờ chứ không phải bản gốc
Năm 2013, người ta phát hiện máy photocopy Xerox khi sao chép bản vẽ đã biến một số thành một số khác
Sự cố xảy ra do trong quá trình số hóa để sao chép, cơ chế nén mất dữ liệu JBIG2 chỉ lưu một chữ số giống nhau rồi tái sử dụng nó
Dù khó có thể nói trường hợp này rõ ràng tương tự với ChatGPT của OpenAI, nhưng khi lưu trữ thông tin từ web thì một kịch bản tương tự có thể xảy ra
Hãy tưởng tượng bạn bị mất quyền truy cập Internet
- Bạn muốn nén toàn bộ văn bản trên web để tạo một bản sao
- Nhưng vì chỉ có dung lượng bằng 1% quy mô cần lưu, bạn sẽ phải nén và có lẽ phải dùng thuật toán mất dữ liệu
- Giờ đây bạn có thể tìm kiếm mọi thứ, nhưng vì văn bản bị nén quá nhiều nên không thể tra ra các trích dẫn chính xác
Hãy xem ChatGPT như một tệp JPEG mờ của toàn bộ văn bản trên web
Giống như JPEG, nó giữ lại rất nhiều thông tin từ web, nhưng không giữ nguyên chuỗi bit hoàn toàn giống hệt
Mọi thứ bạn nhận được chỉ là xấp xỉ
Nhưng vì sự xấp xỉ này được trình bày dưới dạng văn bản có ngữ pháp xuất sắc do ChatGPT tạo ra, nên thường được chấp nhận
Cách nén mất dữ liệu này không phải là toàn bộ cách để hiểu năng lực của ChatGPT
Nhưng cũng là một cách để hiểu các "ảo giác" mà ChatGPT tạo ra, hay những câu trả lời vô nghĩa về sự thật
Những ảo giác này cũng đủ thuyết phục, giống như các con số sai mà máy Xerox tạo ra, đến mức muốn nhận ra chúng là giả thì phải đối chiếu với bản gốc
Các mô hình ngôn ngữ lớn xác định các tính quy luật thống kê trong văn bản
Những cụm như "nguồn cung thấp" thường xuất hiện gần với câu "giá tăng"
Một chatbot đã thấy rất nhiều mối quan hệ như vậy sẽ trả lời bằng việc giá tăng khi được hỏi về tác động của tình trạng thiếu cung
Việc LLM (mô hình ngôn ngữ lớn) thu thập vô số tương quan giữa các thuật ngữ kinh tế có thật sự cho phép nói rằng nó hiểu lý thuyết kinh tế hay không?
Các mô hình như ChatGPT không thực hiện nén không mất dữ liệu. Nghĩa là chúng không tái tạo chính xác văn bản gốc
Khi GPT-3 thực hiện phép cộng trừ với một cặp số, nếu là số có 2 chữ số thì gần như luôn đúng, nhưng nếu là số có 5 chữ số thì độ chính xác giảm mạnh xuống còn 10%
Bởi trên web không có nhiều trang chứa các văn bản như "245 + 821"
Dù đã tổng hợp một lượng thông tin khổng lồ, nó vẫn không suy ra được "nguyên lý của số học"
Hãy tưởng tượng ChatGPT là một thuật toán không mất dữ liệu
Khi đó nó sẽ trả lời câu hỏi bằng cách trích nguyên văn một phần từ các trang web liên quan
Có lẽ khi ấy chúng ta sẽ chỉ nghĩ phần mềm này là một cải tiến nhỏ so với công cụ tìm kiếm hiện có và sẽ bớt ấn tượng hơn
Việc ChatGPT diễn đạt lại thay vì trích nguyên văn tài liệu từ web khiến nó trông như một học sinh đang diễn đạt suy nghĩ bằng lời của mình thay vì lặp lại nguyên xi những gì đã đọc
Điều đó tạo ra ảo giác rằng ChatGPT hiểu tài liệu
Đã có rất nhiều cách sử dụng cho LLM được đề xuất, và nếu nghĩ nó là một tệp JPEG mờ thì có thể đánh giá điều gì phù hợp hoặc không phù hợp
Liệu mô hình ngôn ngữ lớn có thể thay thế tìm kiếm hiện tại không?
- Để có thể tin tưởng LLM, ta cần biết rằng chúng không bị nhồi nhét tuyên truyền hay thuyết âm mưu (tức là không được huấn luyện trên dữ liệu kỳ quặc)
- Ta cần biết rằng tệp JPEG đó đang chụp đúng phần của web
- Nhưng ngay cả khi LLM chỉ chứa thông tin ta muốn, vẫn còn vấn đề về độ mờ
- Nếu có một kiểu độ mờ có thể chấp nhận được, thì đó là việc diễn giải lại thông tin bằng từ ngữ khác
- Và cũng có kiểu độ mờ hoàn toàn không thể chấp nhận khi tìm kiếm sự thật, như việc bịa đặt trắng trợn
- Chưa rõ về mặt kỹ thuật có thể loại bỏ độ mờ không thể chấp nhận mà vẫn giữ lại độ mờ có thể chấp nhận hay không, nhưng có lẽ chúng ta sẽ sớm biết
Ngay cả nếu có thể hạn chế để LLM không giả mạo, liệu ta có nên dùng nó để tạo nội dung web không?
- Điều đó chỉ có ý nghĩa khi mục tiêu của ta đơn thuần là đóng gói lại thông tin vốn đã có trên web
- Một số công ty tồn tại chính để làm việc đó, thứ mà ta gọi là các content farm
- Có lẽ độ mờ của LLM sẽ hữu ích cho họ như một cách để tránh vi phạm bản quyền
- Nhưng nói chung, tôi muốn nói rằng điều gì tốt cho content farm thì không tốt cho những người đang tìm kiếm thông tin
- Việc các bản đóng gói lại này gia tăng đã khiến chuyện tìm kiếm thứ gì đó trên mạng hiện nay trở nên khó hơn
Quảng cáo
Càng nhiều văn bản do LLM tạo ra được đăng lên web, web sẽ càng trở thành một phiên bản mờ hơn của chính nó
Chúng ta gần như không có thông tin về GPT-4, nhưng nếu dự đoán thì có lẽ những người ở OpenAI đã cố gắng loại trừ tài liệu do ChatGPT hoặc các LLM khác tạo ra khi thu thập văn bản cần thiết cho nó
Nếu điều đó là thật, ta sẽ có thêm cơ sở để kiểm chứng phép so sánh giữa LLM và nén mất dữ liệu
Khi nén lặp đi lặp lại một tệp JPEG, ngày càng nhiều thông tin bị mất và xuất hiện nhiều nhiễu nén hơn
Giống như ngày xưa photocopy lại bản photocopy, chất lượng chỉ ngày càng tệ đi
Liệu LLM có thể giúp con người tạo ra sáng tác nguyên bản không?
- Theo tôi, bắt đầu từ một bản sao mờ thay vì bản gốc không phải là cách tốt để tạo ra thứ nguyên bản
- Nếu bạn là một nhà văn, trước khi viết được thứ gì độc đáo, bạn sẽ viết rất nhiều thứ không độc đáo
- Thời gian và công sức dành cho những công việc không độc đáo đó không hề bị lãng phí
- Ngược lại, chính điều đó cho phép bạn cuối cùng tạo ra thứ gì đó nguyên bản
- Thời gian dành để chọn đúng từ và sắp xếp lại câu chữ cho mạch lạc sẽ dạy cho bạn cách văn xuôi truyền tải ý nghĩa
- Việc yêu cầu học sinh viết bài luận không chỉ là cách kiểm tra mức độ hiểu tài liệu
- Mà còn là để cho họ trải nghiệm việc diễn đạt suy nghĩ của mình một cách rõ ràng
Trong tương lai, có thể sẽ có khả năng xây dựng AI có thể viết hay dựa hoàn toàn trên chính trải nghiệm của nó về thế giới
Đó sẽ là một thời khắc quan trọng, nhưng ngày đạt được điều đó vẫn nằm ngoài phạm vi dự đoán của chúng ta
Nếu phải lưu một bản sao trên máy chủ có không gian hạn chế mà không có quyền truy cập Internet, thì mô hình ngôn ngữ lớn như ChatGPT có thể là một giải pháp tốt
"Nhưng chúng ta chưa mất quyền truy cập Internet. Khi bản gốc vẫn còn đó, tại sao lại phải dùng một tệp JPEG mờ"?

26 bình luận

bleu28 2023-02-26

Tôi đã thử hỏi lặp lại các phép cộng trừ với số có từ 5 chữ số trở lên, và nó vẫn liên tục đưa ra đáp án chính xác.
Vậy thì độ chính xác giảm đi ở chỗ nào?

flaps3 2023-02-20

Điều Ted Chiang bỏ qua là Google Search, vốn được dùng làm phương thức chính để khám phá internet cho đến nay, trong vài năm gần đây đã bị ảnh hưởng bởi làn sóng sản xuất hàng loạt nội dung web chất lượng thấp, khiến chất lượng suy giảm đáng kể.
Ngay cả nếu ChatGPT là một bản JPEG mờ, thì nếu lựa chọn thay thế chỉ là Google Search đầy nhiễu, việc dùng ChatGPT như phương tiện tốt nhất để có được thông tin ngay lúc này có thể là một lựa chọn hợp lý.
Người ta nói rằng “chúng ta chưa mất quyền truy cập internet”, nhưng chính tiền đề này là sai. Xét đến quy mô khổng lồ của web, tôi cho rằng mất khả năng khám phá gần như đồng nghĩa với việc mất quyền truy cập. Nếu tôi không thể tìm được thông tin mình muốn, thì việc có quyền truy cập còn có ý nghĩa gì?
Nói cách khác, chúng ta đang tiến gần đến một tình huống gần như không còn “bản gốc”, và đó chính là lý do mà hiện nay mọi người cảm nhận được vì sao “phải dùng một bản JPEG mờ”.

laeyoung 2023-02-16

Tôi nghĩ bình luận mà lightgreenmaesil để lại bên dưới cho thấy sự khác biệt giữa góc nhìn của Ted Chiang và những người đứng ở phía ngược lại.

"Trước hết, dung lượng cũng lớn hơn và thời gian để xem cũng lâu hơn. Với ảnh thì có thể khó cảm nhận rõ về thời gian, nhưng nếu hình dung đó là một cuốn sách và một trang tóm tắt những ý chính của cuốn sách ấy thì sẽ thấy rõ hơn."

Nhìn vào độ phổ biến hay lượt xem của những video kiểu tóm tắt phim trong 15 phút hoặc tóm tắt sách trên YouTube, đúng là mọi người thích những thứ như vậy. Shorts cũng thế. Nhưng nếu nghĩ xem những bản tóm tắt đó có thể truyền tải trọn vẹn bản gốc hay không, thì có lẽ câu trả lời đúng là không. Ai từng xúc động khi xem hay đọc bản gốc sẽ cảm nhận rất rõ những gì bị lược mất trong bản tóm tắt.

Từ lập trường của một tiểu thuyết gia như Ted Chiang, cảm giác khi nhìn ChatGPT hay các LLM làm việc chắc sẽ giống như nhìn những bài viết tóm tắt tiểu thuyết của mình chỉ còn 1–2 trang. Và khi thấy có người nói, hoặc thực sự tin, rằng trong mấy trang ngắn ấy đã chứa trọn cả cuốn tiểu thuyết, hẳn ông sẽ tự hỏi liệu như vậy có đúng không.

Tương tự, liệu các đạo diễn phim hay diễn viên có thích những người chỉ xem bản tóm tắt phim 15 phút thay vì bản gốc không? Họ có xem những người đó là người đã thực sự xem tác phẩm của mình không? Đi xa hơn nữa, nếu gần như mọi người đều bắt đầu nhận thức bản tóm tắt 15 phút là “giống phim” hơn cả bộ phim thật thì sẽ ra sao? Và nếu vì thế mà người ta không còn có thể làm phim nữa, thì những bản tóm tắt 15 phút ấy sẽ lấy phim nào để xem rồi tóm tắt?

Đây là thời đại mà cả video lẫn văn bản đều được ưa chuộng theo kiểu nhanh, nén gọn và tóm lược, nhưng thú vị là chỉ âm nhạc dường như vẫn được giữ nguyên. Không có ai nghe nhạc theo kiểu tóm tắt, hay nghe ở tốc độ 2x, hay cứ mỗi đoạn chán lại tua qua 10 giây một.

Vậy thì, nếu theo đúng tinh thần thời đại bây giờ mà tôi nghe Ditto của NewJeans ở tốc độ 2x, chỉ nghe thử 1 phút, thì tôi có thể trở thành fan của NewJeans không? Một người như tôi, chỉ nghe bản nén và bản tóm lược, có thể nói là mình đã nghe bài hát đó chưa? Hay là không? Hoặc thật ra điều đó chẳng quan trọng?

fudiso 2023-02-15

Bản thân Ted Chiang khi giải thích mô hình ngôn ngữ cũng đã dùng phép so sánh JPEG như một dạng nén mất dữ liệu, nên dù có bản gốc thì thông tin đã nén vẫn cần thiết.
Và ngay cả khi mô hình ngôn ngữ học lại từ chính kết quả do nó tạo ra, cũng gần như không có mất mát thông tin. (Hầu như không có cập nhật nào đối với các tham số nội bộ của mô hình. Vì đó là thông tin vốn đã biết nên việc học không mang lại hiệu quả.)

stdcarrot 2023-02-15

Có vẻ như bản dịch cho câu hỏi cuối cùng có khác biệt về sắc thái so với nguyên văn, nên chỉ nhìn bản dịch thì có lẽ đã xuất hiện nhiều bình luận khác với ý định của tác giả.

So just how much use is a blurry jpeg, when you still have the original?
Khi vẫn còn giữ bản gốc, một tệp JPEG mờ thì hữu ích đến mức nào?

Theo tôi, đây có vẻ là một câu hỏi tìm kiếm tính hữu dụng của JPEG khi đang sở hữu tệp RAW,
nhưng nếu hiểu là "có lý do gì để dùng nó không" thì dễ bị nhìn thành kiểu "đã có RAW rồi thì dùng thứ như JPEG làm gì".

Tất nhiên, trong thực tế, JPEG phổ biến hơn RAW cũng có lý do của nó, nên tôi nghĩ đây là một câu hỏi có bao hàm cả góc nhìn đó.

pseudojo 2023-02-15

Đôi khi ngay cả tài liệu chính thức của mã nguồn mở hay tài liệu chính thức của AWS cũng không đủ đáng tin, đến mức phải tự chạy thử để kiểm tra hoặc thậm chí xem cả mã nguồn, thì với ChatGPT còn phải nói nữa... Có cảm giác rằng càng nhiều thông tin, lượng đối chiếu chéo mà con người phải làm lại càng tăng lên một cách không cần thiết.

daumkakao 2023-02-15

Chẳng phải bạn cũng không phân biệt được giữa JPEG và bản gốc sao?

laeyoung 2023-02-16

Điều này khác nhau tùy theo đặc tính của hình ảnh và tỷ lệ nén. Với người chụp ảnh, họ thường thích giữ bản gốc riêng với JPEG. Vì khi chỉnh sửa và hậu kỳ về sau, phạm vi có thể can thiệp được giữa việc làm trên file JPEG và làm trên bản gốc khác nhau khá nhiều.

https://www.keptlight.com/does-size-matter/

botplaysdice 2023-02-15

Chẳng phải ngay lúc này, phần lớn con người đang làm công việc tạo ra chính cái JPEG mờ đó để kiếm sống hay sao.

namjun 2023-02-15

ChatGPT thực sự rất ấn tượng, nhưng lại quá giống con người nên có cảm giác không phù hợp cho việc tìm kiếm và truyền đạt thông tin.

ahwjdekf 2023-02-15

Tôi rất đồng cảm với việc nó giống như đang xem một ảnh JPEG mờ chứ không phải bản gốc. Ví dụ, khi đọc sách dịch, nếu cách diễn giải của dịch giả được phản ánh quá nhiều, thì dù đôi lúc có cảm thấy bản dịch ở giữa hơi kỳ, nhưng nếu các từ vẫn tiếp nối một cách trơn tru và cảm giác đại khái mạch văn vẫn đúng, thì phần lớn tôi cứ thế lật sang trang tiếp theo (dù đọc xong rồi có thật sự hiểu hay không lại là một vấn đề khác). Nhưng cái bản dịch khiến ta thấy kỳ đó cũng có thể là một thứ vô lý đến mức khó tin, nên đây không phải là vấn đề có thể bỏ qua. Kiểu bản dịch như vậy với người này có thể là hoàn toàn không thể chấp nhận, còn với người khác thì có thể là mức có thể chấp nhận được.

norimsu 2023-02-15

Ừm. Chất lượng ảnh tệ thật.

tequila 2023-02-15

Có lẽ đây cũng là một kiểu cảnh báo. Bản thân tôi cũng dùng nó khá nhiều trong công việc, khi cần lời khuyên, hay khi cần gọt giũa câu chữ, nhưng rõ ràng cũng có những lúc nó đưa ra câu trả lời nghe rất thuyết phục nhưng lại sai. Cũng đúng là để người dùng nhận ra câu trả lời đó sai, họ cần có kiến thức về lĩnh vực ấy hoặc phải điều tra thêm. Đôi khi cũng có những lỗi mà phải nhìn thật kỹ vào chi tiết mới nhận ra được. (chẳng hạn khi tạo code, nó dùng những hàm không hề tồn tại thực sự)
Trước khi phát hiện ra những lỗi như vậy, thật ra tôi chưa từng nghĩ rằng AI này sẽ trả lời tôi theo kiểu đó. Tôi chỉ từng nghĩ đến việc nó hoàn toàn không thể trả lời, hoặc đưa ra câu trả lời lạc quẻ mà thôi.

Nhìn vào việc ngay cả ở những nơi như Stack Overflow, nơi có lẽ tập trung nhiều người hiểu công nghệ này hơn mặt bằng chung, cũng dần xuất hiện ma sát liên quan đến câu trả lời do AI tạo ra, thì có vẻ việc kiểm chứng hoàn hảo giữa người dùng với nhau đã không diễn ra như ta tưởng. Việc kiểm chứng dữ liệu do AI tạo ra cần có sự can thiệp của con người, và rõ ràng là một công việc đòi hỏi công sức lẫn tri thức. Nếu không phải vậy thì Microsoft hẳn đã không bỏ sót những lỗi nghe có vẻ hợp lý mà AI của họ tạo ra. Vì thế chúng ta biết rằng trước mắt vẫn phải sử dụng công nghệ này như một công cụ. Nhưng khi hỏi AI trên điện thoại về thời tiết hôm nay, tôi chưa từng giả định rằng câu trả lời ấy có thể sai vì bug hay những lỗi khác. Nếu những AI như ChatGPT dần phát triển thành AI đa dụng gắn chặt với đời sống thường ngày, liệu xác suất người dùng chấp nhận câu trả lời của nó mà không nghi ngờ nhiều có phải sẽ rất cao không?

Dạo gần đây ở trường học có rất nhiều trường hợp dùng ChatGPT và các công cụ tương tự để viết thuê bài luận. Không chỉ dừng ở mức chỉ ra lỗi, gợi ý chất liệu để viết, hay bồi thêm ý, mà đã có những trường hợp lên mặt báo khi người ta nộp nguyên câu trả lời của AI sau khi chỉ thay đổi chút ít từ ngữ, không hề tự mình suy nghĩ về vấn đề mà vẫn nhận điểm cao. Trong bối cảnh người học được yêu cầu trình bày suy nghĩ của bản thân dựa trên tài liệu mình trực tiếp khảo sát, việc giao cả phần suy nghĩ, cấu trúc và viết lách cho AI rõ ràng là một kiểu mô thức mới.

Ngay cả ngoài câu chuyện AI, cũng không hiếm trường hợp trên internet có vô số tài liệu sai lệch xuất hiện trong kết quả tìm kiếm. Và rất nhiều người tin đó là sự thật mà không kiểm tra thêm. Nếu bản thân tôi không đọc trong tâm thế xác minh từng chút một, có lẽ tôi cũng đã không ít lần vô tình tiếp nhận thông tin sai.
Người ta hay đùa là “phong hóa dữ liệu”, kiểu như khi một bức ảnh trên internet bị chia sẻ qua đủ loại trang dưới định dạng jpg, rồi liên tục bị resize và nén dung lượng, đến mức chất lượng hình ảnh bị phá nát. Thậm chí nền trắng tinh còn có khi ngả thành màu xanh lè.
Có lẽ điều người ta lo là một dạng suy thoái của thông tin. Chẳng phải vẫn có câu “tiền xấu đuổi tiền tốt” đó sao?
Các trang chia sẻ tranh ảnh giờ đã ngập tràn hình do AI tạo ra. Bản thân điều đó không hẳn là sai, nhưng nếu internet bị lấp đầy bởi những bài viết xấp xỉ do AI tạo ra, rồi các AI dựa trên đó lại tiếp tục tạo thêm bài viết, cứ lặp đi lặp lại như vậy, thì chẳng phải sự méo mó của thông tin sẽ dần tích lũy hay sao? Tôi vẫn hay nghĩ như vậy.

rousseau 2023-02-15

Tôi là một fan ruột đã đọc SF hơn 30 năm và xếp Story of Your Life vào hàng hay nhất trong số các tác phẩm SF mới tôi đọc trong gần 10 năm qua, nhưng từ góc nhìn của một người làm trong ngành đã làm lập trình viên hơn 20 năm, đây là điều mà tôi buộc phải phản bác.

Về cơ bản, phát biểu này xuất phát từ một góc nhìn có thể gọi là ngạo mạn. Đó là quan điểm cho rằng mọi người sẽ (vì kém hiểu biết) lầm tưởng rằng các nền tảng AI như ChatGPT đã chạm tới lĩnh vực sáng tạo, còn tôi thì biết là không phải vậy, nên tôi phải nói cho họ biết sự thật bằng những lời đúng đắn.

Sự thật thực sự là không chỉ người trong ngành mà đại đa số mọi người đều biết điều đó không phải như vậy. Từ sau AlphaGo, AI từ lâu đã trở thành chủ đề lớn của công chúng. Ai cũng biết ở mức độ nào đó cả năng lực lẫn giới hạn của AI. Giờ đây trong giới AI cờ vây, đầy rẫy những cao thủ có thể xem trình độ cỡ AlphaGo chỉ như trẻ mới biết đi, nhưng chẳng ai coi đó là điều gây sốc. Bởi vì mọi người đã được học hỏi rất nhiều về ý nghĩa của điều đó và nên tiếp nhận nó như thế nào.

Ngược lại, tôi cho rằng phát biểu đó của Ted Chiang là một sai lầm bắt nguồn từ sự thiếu hiểu biết và định kiến đối với công chúng. Công chúng đang phát cuồng vì ChatGPT không phải vì tin rằng nó sẽ thay thế hoạt động trí tuệ của chúng ta. Mọi người đều hiểu rất rõ rằng nó sẽ "hỗ trợ" cho hoạt động trí tuệ của chúng ta, và họ đang dùng nó theo đúng cách đó. Các ví dụ prompt đang được chuẩn hóa thành dạng cẩm nang và chia sẻ rộng rãi. Điều đó cho thấy mọi người nhận thức rất rõ đây là một công cụ.

Mọi người đón nhận AI vẽ tranh như thế nào? Họ có chà nó như chiếc đèn thần để nhờ nó thay mình sáng tạo không? Khoảng 90% ảnh AI mà tôi thấy dạo này là ảnh gợi dục. Nếu nói nó mờ thì đúng là bàn tay vẽ chưa tốt nên có hơi mờ, nhưng ngoài phần đó ra thì mọi thứ chỉ có gọn gàng và rõ ràng mà thôi.

Tôi còn nhiều điều muốn nói, nhưng vì quá nhiều nên xin chỉ nói một câu rồi dừng lại.

"Anh Kim. Có một điều tôi mạo muội muốn góp ý. Không có gì khác, chỉ là xin đừng dùng Excel function? quá nhiều. Nếu có sự tiện lợi thì mức độ rủi ro cũng tăng lên. Muốn mổ trâu thì có lưỡi dao tương xứng, còn bắt gà thì có cần dao không?...... Ý kiến của tôi là nhẩm tính có thể nhanh hơn, tất nhiên còn tùy từng người, máy tính có thể tốt thật đấy. Nhưng computer chẳng phải là con dao mổ trâu hay sao, nên tôi xin góp ý vậy."

lightgreenmaesil 2023-02-15

Câu hỏi cuối cùng đã sai. Đối tượng để so sánh không nên là một ảnh JPEG bị mờ, mà phải là việc tóm tắt một bức ảnh JPEG bằng lời. Ví dụ, đó sẽ là văn bản như “một con chó đang thè lưỡi” so với bức ảnh thực tế của nó. Đây cũng là một dạng nén mất dữ liệu. Phần lớn thông tin đã bị xóa đi và chỉ được nén lại thành vài byte văn bản. Nhưng vì có ảnh gốc nên kiểu nén mất dữ liệu này không có giá trị sao? Không phải vậy. Trước hết, dung lượng lớn hơn và cũng mất nhiều thời gian hơn để xem. Với ảnh thì cảm giác về thời gian có thể không rõ lắm, nhưng nếu nghĩ đến một cuốn sách và bản tóm tắt nội dung cốt lõi của cuốn sách đó trong một trang thì sẽ dễ hình dung hơn.

Vậy thì, nếu có một bài báo khoa học, có lý do gì để xem bản tóm tắt là dạng nén mất dữ liệu của bài đó không? Tất nhiên là có, và trong nhiều trường hợp còn rất hữu ích. Nếu có một cuốn sách, có lý do gì để dùng bản tóm tắt về một luận điểm cụ thể được nhắc đến trong một chương của cuốn sách đó không — tất nhiên là có. Xét theo một khía cạnh nào đó, việc con người đến trường, nghe hàng chục giờ bài giảng rồi tóm tắt, hệ thống lại thành ghi chú hay cheating sheet cũng là một kiểu nén mất dữ liệu khổng lồ từ video sang chữ. Bản thân việc học chính là nén mất dữ liệu. Chẳng lẽ điều đó vô dụng sao?

Người ta đã ví “nén” với việc nén ảnh, như thể đó là điều rất tầm thường và không có nhiều ý nghĩa, nhưng thực ra nén là một công việc cực kỳ bản chất và có ý nghĩa trong việc học của con người. Với ảnh, phương pháp nén phần nào đã được giải quyết khá nhiều, nhưng nén ngôn ngữ là một việc cực kỳ non-trivial và quan trọng.

cenoch 2023-02-15

Câu trả lời cho câu hỏi cuối cùng là

Dù thông tin chúng ta nhận được qua GPT có là một phiên bản JPEG đã suy giảm chất lượng,
thì thông tin chúng ta muốn phần lớn lại là một phiên bản cắt dán, và công sức cần bỏ ra để tạo nên bản cắt dán đó là khá lớn.

Nó thay ta làm công việc cắt dán ấy, và đôi khi độ hoàn thiện tổng thể còn tốt hơn sự khéo tay của chính tôi,
nên việc chấp nhận sự suy giảm chất lượng là hoàn toàn đáng giá.

Tôi có lẽ không ở vị thế để dám đánh giá trí tưởng tượng và sự thấu hiểu về công nghệ của Ted Chiang, nhưng
nhìn chung, tôi có ấn tượng rằng đây là kết quả của việc diễn giải quá mức một vài đặc điểm của công nghệ này,
và đã bỏ lỡ những đặc điểm thực sự quan trọng.

johtta88 2023-02-14

Có lẽ câu trả lời cho câu hỏi cuối cùng là “vì tiện” phải không?
Tôi không biết đây có phải là một phép so sánh phù hợp hay không, nhưng cũng giống như dạo này nhiều người cảm thấy rất hài lòng với những thứ đã được nén từ bản gốc, như kiểu cày phim/series liền mạch vậy.

regentag 2023-02-14

Đây có vẻ là một phép ví von rất xuất sắc, nhưng nếu không phải người trong ngành thì tuyệt đối sẽ không thể hiểu được.
Làm sao để có thể giải thích điều này cho những người không phải chuyên gia (bao gồm cả những người hay tỏ ra mình là chuyên gia) nhỉ.

yhkee0404 2023-02-14

Super Resolution có thể tốt hơn bản gốc

wedding 2023-02-15

Tất nhiên có thể tốt hơn, nhưng chẳng phải bài viết cũng chỉ ra rằng không phải lúc nào cũng tốt hơn sao?

yhkee0404 2023-02-15

Người ta nói là có thể tốt hơn, nhưng dĩ nhiên không phải lúc nào cũng tốt hơn. Tuy vậy, bài viết chỉ nói rằng độ phân giải bị mờ đi, còn khả năng ngược lại là trở nên rõ ràng hơn thì lại bị loại trừ. Chất lượng hình ảnh CCTV cũng đang được cải thiện, thậm chí còn tô màu cho ảnh đen trắng nữa, nhưng JPEG trong tiêu đề thì đâu có hỗ trợ những thứ đó.

seunghaekim 2023-02-15

Cải thiện chất lượng hình ảnh, tức là cải thiện chất lượng CCTV, ở một khía cạnh nào đó thì không hẳn là cải thiện. Nó mang lại cho con người "cảm giác" rằng hình ảnh đã được cải thiện. Việc tô màu cho ảnh đen trắng cũng vậy. Bằng cách "tạo ra" một hình ảnh đen trắng đã được tô màu, nó mang lại cho con người "cảm giác" của một hình ảnh màu. Vì vậy, cái gọi là "cải thiện" mà công nghệ nâng cao chất lượng hình ảnh hiện nay xử lý cần được xem là một vấn đề trong phạm vi rất hẹp. So sánh rằng JPEG không hỗ trợ những thứ như vậy khi nói về cải thiện chất lượng CCTV là một so sánh hết sức khập khiễng.

yhkee0404 2023-02-15

Cảm ơn bạn đã bình luận. Theo cùng logic đó, việc gọi là mờ cũng ở một khía cạnh nào đó không phải là suy giảm, mà là "tạo ra" cái đã bị suy giảm để mang lại "cảm giác", nên đây cũng là vấn đề chỉ nên được bàn trong một phạm vi rất hẹp; vì vậy việc đem năng lực toán học của ChatGPT so với suy giảm JPEG cũng là một so sánh rất không công bằng, đúng không? Khi nói về việc tăng chính lượng thông tin, có lẽ không cần phải lôi những chuyện như "cảm giác" của con người vào. Giống như khi nén ảnh màu sang đen trắng thì dung lượng giảm xuống, ngược lại nếu tô màu trở lại thì không chỉ dung lượng bit mà cả lượng thông tin tự thân cũng tăng lên, nên điều đó giống giải nén, hoặc khôi phục bản gốc, hơn là nén. Chỉ vì nó không phải chính bản gốc mà bảo nó bị mờ thì có vẻ là một so sánh còn thiếu công bằng hơn nhiều. Chỉ nhìn tiêu đề thôi thì người ta còn có thể hiểu lầm rằng DALL-E cũng chỉ tạo được ảnh dung lượng thấp, độ phân giải thấp và không làm được HD. Đúng như phần thân bài viết nói, khi JPEG bị nén lặp lại thì nói chung dung lượng giảm, chất lượng ảnh giảm và tất yếu sẽ bị mờ; nhưng với deep learning, dù có thể "mờ" trong các phép tính toán học với ít dữ liệu, ngược lại cũng có những phần nó lại làm tốt hơn, rõ ràng hơn và chính xác hơn, nên tôi mong điểm đó sẽ không bị bỏ qua.

seunghaekim 2023-02-15

Tôi không bỏ sót bất kỳ điểm nào trong những gì bạn nói cả. Có lẽ bạn đã rất tức giận vì bạn đang tạo ra bản gốc, còn tôi thì lại tạo ra "thứ không phải bản gốc mà chỉ mang lại cảm giác như bản gốc". Dù vậy hay không thì đó vẫn là một sự thật đơn giản, biết làm sao được.

yhkee0404 2023-02-15

Tôi đâu có bày tỏ cảm xúc như cực kỳ tức giận hay cực kỳ bất công như bạn nói? Chỉ là tôi lo rằng công chúng khi nhìn thấy tiêu đề bài viết này, vốn nói đó là lời của Ted Chiang, sẽ dễ bỏ qua điều đó. Có vẻ đa số cũng đồng ý, nên thật may là cá nhân bạn đã biết điều đó rồi. Tôi cũng đồng ý rằng rất khó tạo ra thứ mang tính analog bằng kỹ thuật số. Nhưng vì đây là câu chuyện về văn bản nên đó là chuyện khác.

xguru 2023-02-14

Vấn đề máy photocopy Xerox cũng là nội dung tôi từng thấy ở mục #33 của 52 điều tôi học được trong năm 2022.
Thật thú vị và tự nhiên tôi hiểu ra ngay khi nó được nối sang hướng này!

ChatGPT là một tệp JPEG mờ của web

Bài viết liên quan

26 bình luận