Điểm trượt tăng vọt trong các lớp CS ở Berkeley giữa lúc việc dùng AI và năng lực toán học suy giảm
(dailycal.org)- Tỷ lệ trượt trong các lớp CS ở Berkeley đã tăng mạnh so với các học kỳ trước, với CS 10 mùa xuân 2026 là 35,3% và CS 61A là 10,6%, lệch khỏi hướng dẫn của EECS về tỷ lệ D·F 7% và GPA trung bình 2,8~3,3 cho các môn nhập môn
- Dan Garcia cho rằng LLM như Claude, ChatGPT và Google Gemini khiến gian lận học thuật tăng mạnh, là “primary driver” của tỷ lệ trượt bất thường; riêng CS 10 có gần 30 sinh viên bị phát hiện gian lận trong take-home exam
- Hai lớp được chấm theo thang điểm công khai mà không chấm cong, nên kết quả của sinh viên không phụ thuộc vào thành tích của bạn học; Garcia cho rằng chấm cong che giấu vấn đề
- EECS 127 của Gireeja Ranade cũng ghi nhận tỷ lệ F 16,8% trong bối cảnh sinh viên thiếu nền tảng toán học và thiếu nhân lực; dự án cuối kỳ trước đây bị bỏ do thiếu TA, còn mức tham gia giờ office hour cũng giảm
- Các lớp CS·EECS ở Berkeley trong thời đại AI đang được xem xét lại theo hướng dạy nhiều hơn và tìm thêm hỗ trợ bổ sung để sinh viên biết chịu đựng các bài toán khó và sự bối rối, từ đó rèn tư duy phản biện và phân tích
Tỷ lệ trượt tăng mạnh và lệch khỏi hướng dẫn chấm điểm
- Theo Berkeleytime, vào mùa xuân 2026, 35,3% sinh viên CS 10 và 10,6% sinh viên CS 61A nhận điểm F
- Vào mùa xuân 2025 và mùa xuân 2024, tỷ lệ F của cả hai lớp đều không vượt quá 10%
- Hướng dẫn chấm điểm của khoa EECS nêu tỷ lệ sinh viên nhận D và F ở các môn nhập môn như CS 10 và CS 61A là 7%
- Theo hướng dẫn, phạm vi GPA thông thường của các môn nhập môn là 2,8~3,3, nhưng điểm trung bình của hai lớp vào mùa xuân 2026 là C+, tương ứng GPA 2,3
Sự phụ thuộc vào LLM và vấn đề gian lận
- Dan Garcia giảng dạy cả CS 10 “The Beauty and Joy of Computing” và CS 61A “The Structure and Interpretation of Computer Programs” vào mùa xuân 2026
- Garcia xem việc gian lận học thuật gia tăng do sử dụng các mô hình ngôn ngữ lớn như Claude, ChatGPT và Google Gemini là “primary driver” của tỷ lệ trượt cao bất thường
- Một phần điểm trượt xuất phát từ việc bị phát hiện gian lận và bị chuyển sang quy trình kỷ luật; ở các trường hợp khác, sinh viên bị cho là đã phụ thuộc quá mức vào LLM rồi bước vào kỳ thi trong tình trạng chuẩn bị kém
- Trong CS 10 mùa xuân 2026, gần 30 sinh viên bị phát hiện gian lận trong take-home exam
Cách chấm điểm không chấm cong
- Hai lớp của Garcia được chấm theo ngưỡng điểm cho từng letter grade thay vì chấm cong
- Theo cách này, điểm của sinh viên không phụ thuộc vào kết quả của các sinh viên khác
- Garcia thích cách công khai tiêu chí cho từng letter grade và tạo nhiều cơ hội để sinh viên đạt tới ngưỡng đó
- Garcia phản đối mạnh mẽ cách làm như ở Harvard, nơi chỉ một số sinh viên nhất định có thể nhận A, và cho rằng chấm cong che giấu các vấn đề thực sự
Nền tảng toán học và khó khăn của EECS 127
- Ngoài việc phụ thuộc quá mức vào AI, Garcia cho rằng nhiều sinh viên chưa được chuẩn bị đầy đủ về toán học; Gireeja Ranade cũng chia sẻ cùng mối lo này
- EECS 127 “Optimization Models in Engineering” của Ranade vào mùa xuân 2026 ghi nhận tỷ lệ F 16,8%, cao hơn nhiều so với mức D·F “typical” 5% mà khoa EECS đưa ra cho các môn bậc trên
- Sinh viên EECS 127 được kỳ vọng đã hoàn thành đại số tuyến tính, giải tích vector và chứng minh toán học trước khi vào lớp, nhưng Ranade xác nhận trong office hour rằng nhiều sinh viên gặp khó với đại số tuyến tính
- Một sinh viên nói với Ranade rằng bài tập về nhà và kỳ thi của lớp đại số tuyến tính mà họ học tại UC Berkeley có “open-internet, open-AI policy”
- Garcia và Ranade nằm trong số hơn 1.300 giảng viên UC đã ký kiến nghị kêu gọi khôi phục điểm thi chuẩn hóa ACT và SAT trong tuyển sinh STEM của hệ thống UC
Thiếu nhân lực và sự sụt giảm tham gia của sinh viên
- EECS 127 trước đây có một dự án cuối kỳ với sự hướng dẫn của giáo sư và đội ngũ TA, và Ranade cho rằng phần lớn sinh viên thường đạt điểm cao ở phần này
- Năm 2026, do thiếu nhân lực, Ranade đã loại dự án cuối kỳ này khỏi lớp học
- Theo bài đăng trên X của trưởng khoa EECS Jelani Nelson, trường đã phải cắt giảm cả số lượng tuyển sinh CS bậc cử nhân lẫn số TA đại học của EECS vì mức lương theo giờ cao của TA EECS
- Office hour của Ranade trước đây từng chật kín người, nhưng trong học kỳ này mức tham gia rất thấp dù bà thường xuyên khuyến khích sinh viên đến
- Garcia cũng gặp tình trạng vắng mặt tương tự trong office hour suốt hai học kỳ qua, và lần đầu tiên trải qua những buổi office hour không có ai đến
Thiết kế lại lớp học và thái độ học tập
- Garcia dự định từ nay sẽ thông báo vào ngày đầu tiên của lớp về những gì đã xảy ra trong mùa xuân 2026, đồng thời tìm cách nhận diện các sinh viên cần hỗ trợ bổ sung
- Ranade cho rằng trong thời đại AI, giảng viên cần dạy sinh viên “nhiều hơn, không phải ít hơn”
- Ranade muốn sinh viên có được tư duy phản biện và tư duy phân tích cần thiết để trở thành người dẫn dắt trong một thế giới cạnh tranh
- Cả hai giảng viên đều cho rằng sinh viên cần trở nên thoải mái hơn với các bài toán khó
- Garcia trích câu nói của một đồng nghiệp, “Confusion is the sweat of learning”, và cho rằng nhiều sinh viên chưa đổ đủ “mồ hôi” đó
1 bình luận
Ý kiến Hacker News
Nếu hồi còn là sinh viên đã có LLM, có lẽ tôi cũng sẽ dùng nó để “làm xong bài tập thật nhanh” rồi thi cử thì hỏng hết, nên tôi phần nào đồng cảm với sinh viên bây giờ
Giờ tôi làm việc chủ yếu với các tiến sĩ, nhưng thấy ngay cả những người vốn luôn thuộc nhóm xuất sắc nhất cũng đang suy giảm năng lực tư duy rất nhanh. Nếu LLM không làm giúp 90%, nhiều người giờ không còn động não, viết code, suy nghĩ sâu hay viết lách được nữa, và ngay cả việc ngồi yên một mình suy nghĩ trong 30 phút vốn cần cho tư duy sáng tạo cũng trở nên khó khăn
Người trưởng thành thì không có kỳ thi, và nhờ LLM mà sản lượng công việc vẫn được giữ, nên sự suy giảm nhận thức có lẽ khó đo lường rõ, nhưng tôi nghĩ nó đã xảy ra ở khắp nơi quanh mình rồi. Tôi đã muốn phủ nhận điều đó, nhưng giờ nó quá rõ để có thể phớt lờ
Ngay cả các phép tính số học đơn giản và phần trăm mà trước đây từng nhẩm rất nhanh, giờ tôi cũng dựa vào máy tính và bảng tính, còn kiến thức tạp thì giao hết cho RAM Internet trong túi quần. Cảm giác “à, cái này trước đây mình biết mà, phải tra lại thôi” đã quá quen thuộc. Có khi tôi đã chạm đáy sự ngu đi của bản thân từ trước cả thời LLM rồi cũng nên
Tuy vậy, tình trạng giao tiếp ngày nay lại giống một gánh nặng tinh thần khổng lồ. Email, hộp thư thoại, chat, online, tin nhắn, cá nhân, công việc, nhà cửa, con cái, gia đình, bạn bè, Messages, Messenger, WhatsApp... phải xoay xở đồng thời vô số cuộc trò chuyện và luồng trao đổi. Dù vậy tôi vẫn là kiểu ít kết nối hơn hẳn người xung quanh. Tôi không đủ sức để theo hết nên đã cắt gần như toàn bộ tin tức và mọi môn thể thao
Não tôi được hình thành từ thời trước Internet, và tôi có cảm giác quá trình chuyển đổi từ analog sang digital đã chạm đến giới hạn. Ít nhất thì nó giống một phép chuyển đổi với mức thất thoát rất lớn
Tôi đang học một codebase mới ở công việc mới, và AI thực sự là con dao hai lưỡi. Một mặt, nó cực kỳ hữu ích khi hỏi về codebase; nhưng nếu không cẩn thận mà để nó áp luôn các chỉnh sửa trước cả khi mình điều tra, thì bạn sẽ chẳng học được codebase đó tử tế chút nào. Muốn giữ được sự hiểu biết, bạn vẫn phải tự viết code mới và dùng những cơ bắp tinh thần cần thiết
Đồng thời, codebase lớn này cũng cho thấy giới hạn của AI. Nếu cứ đẩy tính năng theo kiểu cảm tính mà không hiểu gì, thì chắc chắn sẽ tạo ra rất nhiều vấn đề. Ngay cả sửa bug có mục tiêu rõ ràng cũng có nhiều hệ quả ngoài ý muốn mà LLM không nhìn thấy. Đây không phải codebase tệ, nhưng quy mô của nó đủ lớn để ngay cả các mô hình tuyến đầu cũng chật vật. Vì thế tôi không nghĩ lập luận kiểu “vấn đề của AI có thể giải bằng nhiều AI hơn nên không cần hiểu codebase” là đúng ở thời điểm hiện tại
Chắc phải có biện pháp mạnh nào đó. Ở các lớp toán trung học vẫn còn khá nhiều quy định kiểu “cấm máy tính”, và hồi đó tôi ghét điều đó vì thấy các phép tính số học dài dòng cản trở việc học. Nên tôi hiểu vì sao học sinh có thể phản đối cách dạy chỉ dùng giấy bút, nhưng khi ngay bên cạnh đã có một cỗ máy làm bài tập chất lượng cao, thì tôi thật sự không biết còn có thể học được gì
Hãy cho sinh viên dùng công cụ AI họ muốn, nhưng hướng dẫn họ cách dùng một cách chuyên nghiệp; còn những kỹ năng và kiến thức thật sự cần nắm thì phải kiểm tra trực tiếp, ngoại tuyến và thường xuyên ngay từ sớm. Và thay vì cho điểm F vì gian lận, tôi nghĩ nên đình chỉ học
Vài năm trước tôi có đọc về một giáo viên trung học đăng bài giảng lên YouTube để học sinh tự xem, còn thời gian trên lớp thì dùng cho tương tác, hỏi đáp và kiểm tra
Sửa: Claude tìm nhanh hơn search. Đó là trường hợp của 2 giáo viên hóa trung học năm 2007, gọi là lớp học đảo ngược https://fltmag.com/the-flipped-classroom/
Tôi không đến mức gọi đó là “suy giảm nhận thức”, nhưng rõ ràng tôi đã lười hơn rất nhiều. Những việc từng là thường ngày khi mới bắt đầu học code giờ lại thấy nặng nề
Trái với điều tiêu đề bài viết ám chỉ, nguyên nhân thật sự có lẽ nằm trong một đoạn của bài. Đó là chỗ viết: “Garcia và Ranade, cùng với hơn 1.300 giảng viên UC, đã ký vào bản kiến nghị yêu cầu khôi phục điểm thi chuẩn hóa ACT và SAT trong tuyển sinh STEM của hệ thống UC. Bản kiến nghị và thư ngỏ nêu chi tiết những lo ngại tương tự về mức độ chuẩn bị toán học của sinh viên”
Trước và sau COVID, nhiều trường đại học hàng đầu đã thử bỏ yêu cầu thi đầu vào với lý do công bằng, nhưng gần như ở đâu cũng thất bại, và hiện khá nhiều trường đã quay lại. Yale từng nói rằng “trong các nghiên cứu trước và sau đại dịch, trong số mọi thành phần của hồ sơ ứng tuyển, điểm thi là chỉ báo đơn lẻ mạnh nhất dự đoán thành tích tương lai tại Yale, và điều này vẫn đúng sau khi đã kiểm soát thu nhập gia đình và biến nhân khẩu học, không chỉ với ACT/SAT mà cả các kỳ thi theo môn như AP và IB” https://archive.is/8zxfo
Link đó là bản lưu trữ vì trang gốc đã bị xóa. Yale từng thử chiến lược ‘test flexible’, cho phép chọn có nộp điểm hay không, nhưng rồi nhanh chóng bỏ và quay lại yêu cầu điểm thi
Prop 16 thất bại, và sau đó Cal bắt đầu bỏ qua điểm SAT/ACT
Thật khó không xem đây là một phương án thay thế để giảm tuyển những sinh viên gốc Á, nhóm có điểm SAT/ACT trung bình cao nhất. Không lâu sau, tôi nhận được email từ chính vị hiệu trưởng đó ca ngợi thay đổi này vì làm tăng đa dạng chủng tộc, và các số liệu trước-sau trong email cho thấy tỷ lệ sinh viên gốc Á giảm còn các nhóm khác đều tăng
Với tư cách là giảng viên CS, ngay hôm qua tôi đã thảo luận đồ án môn điện toán song song, và một trong ba nhóm rõ ràng đã đi theo kiểu ChatGPT. Họ thậm chí còn không hiểu những lựa chọn mà LLM đưa ra về kiến trúc và các khía cạnh tương tự
Cách phát hiện những sinh viên như vậy cũng tương tự như trước đây khi họ chép từ sinh viên khác. Kiểu như “đưa dây để tự treo mình”, cứ yêu cầu giải thích thì họ sẽ vô tình đi vào ngõ cụt
Khi nghi ngờ, tôi thấy nên kêu gọi sự trung thực kiểu như “nói thật nhé, trong đoạn code này bao nhiêu là của em và bao nhiêu là của ChatGPT?”, đồng thời cũng thể hiện sự cảm thông như có thể trong cùng tuần đó họ có nhiều hạn chót phải nộp. Dù vậy, không nên bỏ lỡ cơ hội truyền đạt bài học rằng vẫn phải làm theo cách đúng đắn
Hai nhóm còn lại cũng dùng LLM, nhưng họ dùng nó để hỗ trợ ở mức thiết kế và kiến trúc cấp cao. Dù có thể họ không tự tay viết 100% mã nguồn, rõ ràng họ vẫn là người chịu trách nhiệm và có thể giải thích lập luận cùng chiến lược mà họ dùng để giải quyết vấn đề
Tôi đã nhờ đồng nghiệp đếm thêm các trường hợp như vậy vì chúng tôi vẫn còn phải rà soát nhiều đồ án nữa, nhưng hiện tại là 1 trên 3, tức 33%
Nếu sao chép rồi dán mã từ thư viện để làm đồ án thì có được chấp nhận không? Nếu không, tôi muốn hiểu vì sao dùng mã do LLM tạo ra lại khác
Con người là một sinh vật kỳ lạ: mộng du bước vào mọi cuộc khủng hoảng, không thể đồng thuận về bất cứ điều gì, rồi đến khi chuyện xảy ra thì cũng không thể đồng thuận về nguyên nhân
Khi đã đến điểm mà ta không còn có thể làm “kỹ thuật” hay “khoa học” một cách đúng nghĩa nữa, 10 năm tiếp theo sẽ trôi qua trong tranh cãi rằng có thật AI là vấn đề hay không, nếu có thì có phải điều không thể tránh khỏi không, và rốt cuộc không ai hay tất cả mọi người phải chịu trách nhiệm. Lịch sử cứ lặp lại. Thế nhưng hôm nay, ngay tại đây, dù nhìn thấy một tương lai u ám, chúng ta vẫn lại bước thêm một bước về phía trước
Có phải chúng ta đang giả định rằng xã hội sẽ tự điều tiết. Ở mức nào đó thì đúng, nhưng chi phí của tự điều tiết thực sự rất cao và cũng rất đau đớn. Có phải ta đang cho rằng có thể chấp nhận cái giá đó miễn là chúng ta không phải là những người đầu tiên chịu khổ
Đây là tiến hóa văn hóa, và thị trường cũng vận hành như vậy. Chẳng lẽ bạn đã kỳ vọng vào kế hoạch hóa tập trung
Dữ liệu điểm số lấy từ https://berkeleytime.com/grades
Vì tôi lo rằng họ chỉ chọn những môn học ủng hộ câu chuyện mình muốn kể, nên tôi đã vẽ tỷ lệ F bằng đường màu đỏ cho tất cả các môn CS vẫn đang được mở, và hiển thị số lượng điểm được chấm trong học kỳ gần nhất mà môn đó được mở bằng cột màu xanh da trời, rồi sắp xếp theo thứ tự giảm dần
Có vẻ nỗi lo đó là đúng. Nhìn vài biểu đồ đầu tiên thì không thấy mức tăng lớn của tỷ lệ F trong vài học kỳ gần đây
https://x.com/rahimnathwani/status/2062431813143019525?s=61
Giảng viên có động cơ để không cho quá nhiều điểm thấp. Điểm thấp thường làm giảm đánh giá môn học, điều này có thể ảnh hưởng đến tăng lương và thăng tiến, và điểm thấp cũng kéo theo sự chú ý thêm từ phía hành chính, điều mà không giảng viên nào mong muốn
Tháng 1, vì con gái tôi gặp khó khăn với môn toán, tôi đã dùng Claude để tạo một công cụ sinh phiếu bài tập rất chuyên sâu. Tôi tạo bài để con bé luyện đi luyện lại những khái niệm mà nó thấy khó
Việc đó có hiệu quả, và nếu làm theo cách truyền thống thì hẳn sẽ khó hơn rất nhiều
Công cụ này tạo PDF kèm đáp án và bộ lời giải, đồng thời giải bài bằng nhiều kỹ thuật khác nhau, nên tôi có thể kiểm tra cách làm của con bé dễ hơn và lặp lại nhanh hơn
Đây là một công cụ mạnh. Cuối cùng thì vẫn quay lại chuyện ta dùng công cụ đó như thế nào. Dùng nó để trở nên tốt hơn, hay để chọn đường tắt
Nếu ai cũng làm theo cách “đúng đắn” thì sẽ không có vấn đề gì, nhưng các động lực xã hội thì phức tạp và mâu thuẫn, nên với nhiều người, đường tắt trước mắt trông hấp dẫn hơn nhiều
Đây vừa là vấn đề công nghệ vừa là vấn đề xã hội
Có vẻ là một tin riêng, nhưng “hơn 600 giảng viên University of California do các nhà toán học UC Berkeley dẫn dắt đang kêu gọi khôi phục yêu cầu thi chuẩn hóa đối với ứng viên STEM. Lý do là 6 năm tuyển sinh không cần thi đã không thể đánh giá mức độ sẵn sàng một cách đáng tin cậy, và các giảng viên ngày càng thường xuyên phải dạy toán cấp hai cho sinh viên năm nhất”
https://archive.ph/18spS
Và lợi ích khả dĩ ở đó là gì
Thực sự rất lo ngại về LLM
Tôi có một cậu con trai 15 tuổi và quản lý việc dùng điện thoại của cháu bằng Google Family Link. Phần lớn thì khá thoáng, chỉ ở mức nhận thông báo khi cài ứng dụng, nhưng Gemini thì bị cấm rất gắt
Tôi đã nói chuyện rất nhiều với cháu về những rủi ro này
Cháu nói bạn bè thường xuyên dùng LLM, và tôi nghi đó là lý do cho điểm thi của họ. Một số bạn của cháu chỉ đạt 20~40% trong các bài kiểm tra, trong khi con tôi học đề thi cũ và trả lời câu hỏi khi ôn tập nên đạt trên 80%
Rõ ràng các nhà cung cấp AI sẽ không quan tâm chuyện học sinh dùng LLM để giải bài tập về nhà, nên tôi lo cho tương lai
Thay vì chỉ xem AI là mối nguy, nên xem con anh có thể dùng nó thế nào để tăng tốc và củng cố việc học. Nguy hiểm thực sự lại là môi trường chính trị muốn xóa bỏ các bài thi chuẩn hóa để che giấu dữ liệu của những nhóm vốn thất bại theo cách truyền thống
“Hướng dẫn nói rằng GPA thông thường của các môn cấp dưới nên nằm trong khoảng 2.8~3.3. Theo Berkeleytime, điểm trung bình của hai lớp vào mùa xuân 2026 là C+, tương ứng GPA 2.3”
Với tư cách là một cựu sinh viên Cal, tôi thực sự mừng khi thấy họ vạch ra ranh giới với lạm phát điểm số. Tôi đã làm việc cực kỳ chăm chỉ để có được mức GPA mình nhận được, nên tôi sẽ rất ghét nếu Cal đi theo hướng như Yale, nơi họ phát A và A- tới 79%: https://yaledailynews.com/articles/professors-face-grading-dilemma-too-many-a-s-little-taste-for-limits
Dù vậy, điểm cao + tốt nghiệp đã lâu vẫn sẽ tiếp tục là một tín hiệu
Cố tình hạ chất lượng giảng dạy và giăng bẫy sinh viên trong các kỳ thi không làm tăng kết quả giáo dục của bất kỳ ai. Những người than phiền về lạm phát điểm số đã hoàn toàn quên mất vì sao giáo dục công tồn tại
Thật đáng tiếc. Gần đây tôi bắt đầu một hoạt động khá thú vị là trau dồi lại toán học, và khi giải bài thì tôi nhờ Gemini Live mode kiểm tra, đưa gợi ý, đôi khi đi từng bước cùng mình
Khá vui, như thể có một giáo sư cực kỳ kiên nhẫn đứng ngay bên cạnh. Đây gần như là trải nghiệm học toán tốt nhất tôi từng có, và cũng không cần phải gửi hối lộ hay quà cáp cho Gemini để giữ thiện cảm của nó
Ngược lại, nếu không tự suy nghĩ mà để LLM làm trọn vẹn toàn bộ công việc, thì điều đó nghe giống như gian lận với chính bản thân mình