- Nghiên cứu phân tích thực nghiệm tác động của việc viết bài luận với sự hỗ trợ của mô hình ngôn ngữ lớn (LLM) đối với hoạt động não bộ và tải nhận thức của con người
- Người dùng LLM có mức độ sở hữu đối với bài viết thấp hơn, gặp khó khăn khi trích dẫn chính xác bài mình đã viết, và về dài hạn còn suy giảm hiệu suất ở mức ngôn ngữ, hành vi và thần kinh
- Những người tham gia được chia thành ba nhóm: LLM, công cụ tìm kiếm và chỉ dùng não (Brain-only) để thực hiện cùng một nhiệm vụ; một số người còn đổi chéo điều kiện để so sánh
- Kết quả EEG (đo sóng não) cho thấy nhóm Brain-only có mạng kết nối não mạnh và rộng nhất, trong khi người dùng LLM thể hiện mức kết nối yếu nhất
- Nghiên cứu cho thấy sự phụ thuộc vào AI có thể tạo ra cái giá nhận thức trong quá trình học tập, đồng thời đặt ra nhu cầu xem xét sâu hơn về tác động giáo dục
Tổng quan nghiên cứu
- Nghiên cứu khám phá tác động của việc dùng công cụ hỗ trợ AI khi viết bài luận lên hoạt động não bộ và hành vi
- Người tham gia được chia thành ba nhóm: LLM (ChatGPT, v.v.), công cụ tìm kiếm và Brain-only (không dùng công cụ)
- Mỗi nhóm thực hiện ba phiên trong cùng điều kiện, và ở phiên thứ tư thì một số người được đổi chéo điều kiện
- Người dùng LLM chuyển sang Brain-only (LLM-to-Brain)
- Người dùng Brain-only chuyển sang điều kiện LLM (Brain-to-LLM)
- Tổng cộng 54 người tham gia các phiên 1~3, trong đó 18 người hoàn thành đến phiên 4
Phương pháp thí nghiệm
- Đo tải nhận thức và mức độ kết nối não trong lúc viết bài luận thông qua EEG (điện não đồ)
- Các bài luận đã viết được đánh giá song song bằng phân tích xử lý ngôn ngữ tự nhiên (NLP) và chấm điểm từ giáo viên con người cùng bộ đánh giá AI
- Kết quả phân tích NER (nhận diện thực thể có tên), mẫu n-gram và ontology chủ đề cho thấy mức độ tương đồng cao trong từng nhóm
Kết quả chính
- Phân tích EEG xác nhận sự khác biệt rõ rệt giữa các nhóm
- Nhóm Brain-only cho thấy mạng kết nối não mạnh và rộng nhất
- Nhóm công cụ tìm kiếm có mức độ tham gia trung bình
- Nhóm LLM cho thấy mức kết nối yếu nhất
- Xác nhận xu hướng hoạt động nhận thức giảm xuống khi mức độ sử dụng công cụ bên ngoài tăng lên
- Ở phiên 4, những người chuyển từ LLM sang Brain-only cho thấy sự suy giảm kết nối ở dải alpha và beta, tức trạng thái giảm hoạt hóa nhận thức
- Ngược lại, những người chuyển từ Brain-only sang LLM cho thấy khả năng hồi tưởng trí nhớ được cải thiện cùng với sự hoạt hóa ở vùng chẩm-đỉnh và vùng vỏ não trước trán, tương tự người dùng công cụ tìm kiếm
Quan sát về hành vi và ngôn ngữ
- Mức độ sở hữu đối với bài luận (Self-reported ownership) thấp nhất ở nhóm LLM và cao nhất ở nhóm Brain-only
- Người dùng LLM gặp khó khăn khi trích dẫn chính xác chính bài viết của mình
- Kết quả theo dõi trong 4 tháng cho thấy người dùng LLM có hiệu suất thấp kéo dài ở cấp độ thần kinh, ngôn ngữ và hành vi
Kết luận và hàm ý
- LLM mang lại sự tiện lợi tức thì, nhưng đi kèm chi phí nhận thức dài hạn (cognitive cost)
- Nghiên cứu cảnh báo về tác động tiêu cực của sự phụ thuộc vào AI đối với năng lực học tập và tư duy
- Nhấn mạnh sự cần thiết phải cân bằng và xem xét lại cách sử dụng AI từ góc độ giáo dục và nhận thức
- MIT Media Lab cho rằng kết quả này đặt ra nhu cầu thiết kế lại cơ chế học tập trong kỷ nguyên AI
14 bình luận
Ở góc độ một người làm nghiên cứu, tôi nói về vấn đề này rất nhiều. Những công cụ trước đây thay thế chức năng của con người thì thường chỉ thay thế một chức năng cụ thể, chứ hiếm khi thay thế chính hoạt động nhận thức. Chức năng nhận thức được học hỏi về mặt chức năng trong quá trình chịu tải, và như vậy là chúng ta đang tự tước đi cơ hội đó của mình. Có thể nói rằng như thế sẽ giúp ta tập trung vào việc khác, nhưng nếu bản thân năng lực nhận thức không thể phát triển thì có thể chúng ta sẽ không được trao cả cơ hội để làm những việc khác. Tất nhiên, đây cũng có thể là hiện tượng xuất hiện trong giai đoạn quá độ, nhưng khi nhìn vào những bạn junior mà tôi phỏng vấn gần đây hay các đàn em ở trường, tôi cảm thấy vấn đề này nghiêm trọng hơn mình nghĩ. Đúng là công cụ dùng thế nào là tùy người dùng, nhưng ngay cả một chiếc smartphone nhỏ bé mà nhiều người còn không tự kiểm soát nổi, đến mức "smombie" vừa đi vừa nhìn điện thoại đang tràn lan, thì tôi không kỳ vọng rằng phần lớn mọi người sẽ sử dụng nó một cách có kiểm soát.
Bản thân tôi cũng cảnh giác với việc phụ thuộc vào LLM vì vấn đề này. Bản chất của hầu hết những gì con người tạo ra là "chủ đích". Phim ảnh, đồ ăn, công nghệ... Tôi cảm thấy phần triển khai chỉ quan trọng khoảng 15% thôi.
Nếu LLM giúp tiết kiệm thời gian, thì khoảng thời gian tiết kiệm được đó nên được dùng để nâng cao chất lượng
> Mỗi khi một phương tiện mới xuất hiện thì lại có những tranh cãi tương tự
> Socrates từng nói rằng việc viết lách sẽ làm hỏng trí nhớ, và vào thời Gutenberg người ta cũng lo rằng sự chiêm nghiệm sẽ biến mất
Tôi thấy ý kiến này khá thú vị. Tham khảo: xkcd.com/1601 xkcd.com/1227
Ý kiến trên Hacker News
Nếu dùng AI quá thường xuyên, có cảm giác mất dần cảm giác đắm mình vào việc giải quyết vấn đề
Khi triển khai thuật toán bố cục đồ thị dựa trên framework Sugiyama phức tạp, nhờ AI mà tôi nhanh chóng nắm được khái niệm, nhưng khi để nó viết mã trực tiếp thì ngược lại còn bị nghẽn hiểu biết
Sau đó tôi chuyển từ Copilot IDE sang ứng dụng Copilot 365, nhờ nó giải thích nguyên lý rồi tự mình debug nên lấy lại được cảm giác tập trung
Tôi nghĩ tốt hơn nhiều là đừng giao việc cho AI mà hãy dùng nó như một bách khoa toàn thư tương tác
Giờ tôi có thể tập trung hơn vào review code hay thiết kế kiến trúc, nhờ đó dành thời gian cho phần việc cốt lõi hơn
Dù dùng AI như bách khoa toàn thư thì khả năng tìm kiếm thông tin cũng sẽ giảm đi, nhưng sự đánh đổi để tiết kiệm thời gian và năng lượng là đáng giá
Ban đầu là “cứ hỏi LLM thôi”, rồi thành “trong lúc nghỉ một chút thì LLM làm thay mình”, rồi tiến tới “LLM theo được ý tưởng của mình và còn gợi ra cảm hứng mới”
Nhưng rồi cuối cùng deadline và công việc thực tế cũng ập tới
Mỗi khi có phương tiện mới xuất hiện, đều từng có tranh cãi tương tự
Socrates từng nói chữ viết phá hỏng trí nhớ, còn thời Gutenberg người ta lo rằng năng lực suy tư sẽ biến mất
Nghiên cứu lần này có độ tin cậy thấp vì mẫu nhỏ và thời gian ngắn, nhưng LLM có khả năng thay thế toàn bộ quá trình nhận thức chứ không chỉ như máy tính bỏ túi hay Google, nên khác biệt về mặt chất
Có thể không phải năng lực nhận thức biến mất mà là hình thái của nó thay đổi. Có lẽ phải 20 năm nữa mới biết kết quả
Những người không biết chữ từng có khả năng ghi nhớ khổng lồ, còn giờ chúng ta đã lười hơn vì dựa vào máy móc
Cũng có nghịch lý năng suất(https://en.wikipedia.org/wiki/Productivity_paradox): đã 30 năm kể từ khi Internet phổ biến nhưng năng suất không tăng đáng kể
LLM làm suy yếu cả ba giai đoạn này. Thay vào đó, nếu dùng nó như một gia sư cá nhân hóa để ra bài cho mình thì có thể giúp não phát triển
Nhưng doanh nghiệp sẽ không đi theo hướng đó, nên chúng ta phải đấu tranh để đưa nó theo hướng tốt hơn
Máy tính bỏ túi cũng vậy, nó đã làm suy yếu khả năng tính toán phức tạp
Nếu thay đổi là tích cực thì sẽ cần cách đánh giá việc học mới, còn nếu tiêu cực thì sẽ cần chính sách chặn LLM
Dù theo hướng nào thì việc thiết kế lại hệ thống giáo dục cũng là điều không tránh khỏi
Nếu người junior không thể trưởng thành qua những việc đơn giản thì rồi senior cũng sẽ biến mất
Từ góc nhìn của sinh viên, AI hỗ trợ học tập hại nhiều hơn lợi
Quá trình thử sai và tự phản tư biến mất, đến cả suy nghĩ cũng bị ủy quyền cho hệ thống tự động
Trước đây chỉ cần chặn Instagram, còn giờ là thời đại phải chặn cả chính việc suy nghĩ
Podcast Change, Technically của nhà tâm lý học Cat Hicks và nhà thần kinh học Ashley Juavinett bàn khá kỹ về các vấn đề của nghiên cứu này
ChatGPT có thể làm con người kém đi thật, nhưng không thể chứng minh điều đó bằng kiểu nghiên cứu như thế này
Ngược lại, tôi lại thấy nhờ AI mà triệu chứng ADHD của mình dịu đi
Tôi sắp xếp ý tưởng như với một cuốn sổ tay tương tác, và quá trình viết bài dài bằng LaTeX cũng vui hơn hẳn
Cảm giác như mình hoạt động được như một người không có ADHD
Khi tự code thì tôi vào guồng được, nhưng lúc chờ AI phản hồi lại bị xao nhãng
Tôi dùng ChatGPT để trao đổi về thiết kế, còn Copilot hỗ trợ phần code
Ngược lại tôi thấy tốc độ học và mức độ hiểu còn tăng lên
Tôi chưa từng đi khám ADHD, nhưng chắc chắn có cảm giác vấn đề về tập trung
Bạn tôi kể đồng nghiệp ngoài 20 của anh ấy giao cả việc tính tiền bữa trưa cho ChatGPT
Thật bất ngờ khi thấy thế hệ trẻ phụ thuộc vào AI ngay cả với phép tính đơn giản
Nó thậm chí còn gọi Google Sheets là Excel
Vốn dĩ con người đã không giỏi số học, nên chẳng cần thiết cứ phải làm bằng tay
Tính toán đơn giản không phải là giải quyết vấn đề
Giờ AI còn làm thay cả đọc và viết, nên con người có thể tập trung vào tư duy ở cấp độ cao hơn
Cũng như các druid từng chỉ trích việc ghi chép bằng chữ, sự mất mát trí nhớ luôn luôn tồn tại
Dù vậy chữ viết vẫn lan rộng, và chúng ta cũng chẳng biết mình thông minh hơn hay ngu đi
Tuy vậy nếu dùng như một gia sư cá nhân hóa thì nó vẫn có thể giúp não phát triển
Cuối cùng thì hướng đi của AI là do chúng ta quyết định
Vì không cần nhớ số điện thoại hay đường đi nữa
Nhưng nếu AI giúp tiết kiệm thời gian thì ta có thể dùng phần đó để đầu tư vào việc đọc tài liệu gốc
Cuối cùng thì tôn giáo cũng từng là nền kinh tế chú ý đầu tiên
Trớ trêu là chính vấn đề ông lo ngại lại đang được LLM giải quyết
Sự phụ thuộc vào GPS và sự phụ thuộc vào AI là những vấn đề tương tự
Có người không nhớ nổi đường, có người thì mù quáng làm theo
Điều đó giúp ghi nhớ cấu trúc đô thị
Với LLM cũng tương tự, tôi giữ tập trung bằng cách thi giải bài toán với chính AI trong lúc nó trả lời
Tôi lo rằng thế hệ trẻ giờ không có GPS thì không lái xe nổi
Với LLM cũng thế, nếu phụ thuộc quá mức thì sẽ thành thuê ngoài chính năng lực tư duy
Có người rất nhanh nắm được địa hình, có người cần nhiều thời gian hơn
Đây là thí nghiệm cho người tham gia viết một bài luận trong 20 phút
Trong môi trường như vậy, người ta sẽ chỉ theo đuổi hiệu quả ngắn hạn, nên khá xa với tác động nhận thức thực tế
Phải xem LLM ảnh hưởng thế nào trong những nhiệm vụ thật sự có ý nghĩa
Rốt cuộc thì đây chỉ là kết luận kiểu “người xem robot chơi tennis dùng cơ ít hơn người tự chơi”
Đây cũng chỉ ở mức nhìn vào cái búa rồi nói rằng “nó làm cho ngôi nhà trở nên ọp ẹp”.
Vấn đề không nằm ở công cụ, mà là ở cách sử dụng nó.
Ví dụ:
Dùng máy tính thì có thể làm giảm khả năng nhẩm tính
nhưng đổi lại bạn có thể làm được những phép toán phức tạp hơn
Dùng GPS thì có thể làm giảm khả năng ghi nhớ đường đi
nhưng bạn có thể xây dựng chiến lược không gian ở quy mô rộng hơn
ChatGPT cũng y như vậy.
Và có một điểm thú vị.
Khoảnh khắc bạn đọc những bài như thế này và lập tức đồng ý một cách không suy nghĩ rằng “đúng vậy, dùng AI sẽ khiến con người ngu đi”,
thì chính món nợ nhận thức mà người đó nói tới đã thực sự phát sinh rồi.
Công cụ vốn luôn trung lập.
Việc biến tư duy thành khoản nợ hay thành tài sản được quyết định bởi thái độ của người sử dụng.
Anh Kim. Tôi mạo muội muốn góp một lời khuyên. Không có gì khác, chỉ là đừng dùng AI GTP? quá nhiều. Nếu có sự tiện lợi thì rủi ro cũng tăng lên. Để mổ trâu thì có lưỡi dao tương xứng, còn bắt gà thì có cần đến dao không? Có khi cách đơn giản mới là đáp án đúng.
Có GitHub, có Google, có những cách đơn giản. Không cần gắn sao, cũng không tốn thời gian, sau này còn có cả cách code chay nữa.
Giả sử anh Kim là một vị tướng ngoài chiến trường. Chẳng phải điều đương nhiên là phải thắng trận sao? Chiến lược phù hợp với tình huống ư? Chỉ áp chế bằng lục quân thôi sao? Không phải vậy. Ý kiến của tôi là tìm bằng Google có thể nhanh hơn, tất nhiên còn tùy từng người, và GPT cũng có thể tốt. Tôi góp ý như vậy vì thấy AI chẳng phải là con dao để mổ trâu hay sao.
Phần đầu thì tôi thấy đồng cảm, nhưng ví dụ ở phần sau có vẻ không thật sự phù hợp.
Dụng cụ tập luyện = LLM thì không đúng, mà phải là dụng cụ hỗ trợ tập luyện = LLM. Tức là khi tập thể dục, nếu dùng dụng cụ hỗ trợ để giảm tải lên cơ thể thì có thể tăng mức tạ, nhưng như vậy hiệu quả tập luyện như tăng cơ hay giúp lưu thông máu trơn tru hơn của chính cơ thể sẽ bị giảm đi.
Việc đưa ra một ví dụ không phù hợp rồi viết rằng "phép so sánh và ẩn dụ được dùng để giúp dễ hiểu hơn" là mâu thuẫn. Nhìn vào bình luận của bạn thì có vẻ việc tiếp tục trả lời bình luận nữa là không còn ý nghĩa.
À vâng. Nếu bạn hiểu như vậy thì đúng.