- Ngôn ngữ đời thường được sử dụng trong thực tế không hề quy tắc mà khá lộn xộn
- Các nhà ngôn ngữ học từng cho rằng cần có một dạng "ngữ pháp" như chất kết dính để kiềm chế những đặc tính tùy tiện này
- Nhưng các mô hình ngôn ngữ AI quy mô lớn sử dụng ngôn ngữ dựa trên lượng dữ liệu ngôn ngữ khổng lồ, và đáng ngạc nhiên là phần lớn làm được điều đó mà hầu như không cần sự trợ giúp của ngữ pháp
- Đôi khi việc chọn từ trong câu được tạo ra có thể kỳ lạ hoặc vô nghĩa, nhưng đa số vẫn đúng ngữ pháp
- Về khả năng nghĩ ra từ tiếp theo, các mô hình AI này và não bộ con người hoạt động theo cách tương tự
- Có thể cho rằng đó là vì GPT-3 được huấn luyện bằng lượng kinh nghiệm ngôn ngữ tương đương 20.000 năm của con người, nhưng theo nghiên cứu, GPT-2 được huấn luyện với khoảng 100 triệu từ cũng có thể làm điều tương tự như cách não người nghĩ ra từ tiếp theo
(100 triệu từ tương đương với lượng từ mà một đứa trẻ trung bình nghe được trong 10 năm)
- Điều này cho thấy chỉ riêng việc tiếp xúc cũng đủ để học ngôn ngữ tốt đến mức có thể tạo ra những câu có ngữ pháp tốt, và có thể học theo cách tương tự với quá trình xử lý của não người
- Trong nhiều năm, nhiều nhà ngôn ngữ học tin rằng việc học ngôn ngữ là không thể nếu không có sẵn một khuôn mẫu ngữ pháp bẩm sinh
- Nhưng các mô hình AI mới cho thấy điều đó không đúng. Chúng chứng minh rằng khả năng tạo ra ngôn ngữ đúng ngữ pháp có thể được học từ trải nghiệm ngôn ngữ
- Nói cách khác, khi trẻ em học ngôn ngữ, trải nghiệm ngôn ngữ quan trọng hơn ngữ pháp
8 bình luận
AlphaGo chơi cờ vây giỏi không có nghĩa là cờ vây không có luật.
Đúng vậy, cách chính xác nhất để học một ngôn ngữ là có thật nhiều trải nghiệm. Nhưng như những gì AI cho thấy, tiền đề cơ bản là "một lượng trải nghiệm khổng lồ". Với AI thì đó là mức tiếp xúc suốt 10 năm. Con người có lẽ không đến mức đó, nhưng ở nước ngoài mà không phải người bản xứ thì rất khó tạo ra kiểu trải nghiệm ngôn ngữ như vậy.
Đúng vậy, nếu muốn học tiếng Anh nhanh nhất, chính xác nhất và hiệu quả nhất thì cứ đi du học vài năm rồi học là được. Nhưng đa số mọi người lại có hoàn cảnh gia đình không thể làm như vậy, dù là vì kinh tế hay lý do nào khác. Vì thế mới phải học ngữ pháp.
Tuy nhiên, tôi nghĩ trong giáo dục Hàn Quốc, việc quá nhấn mạnh ngữ pháp và không dùng nó như một công cụ để học ngôn ngữ, mà lại học ngữ pháp chỉ để giải bài ngữ pháp trong điểm số ở trường, là điều cần phải được sửa.
Tôi thì lại thấy chiến lược chỉ phơi nhiễm đơn thuần là một phương pháp kém hiệu quả, đến mức cần lượng phơi nhiễm tương đương 10 năm.
| Chỉ với việc tiếp xúc đơn thuần thôi cũng đã học ngôn ngữ đủ tốt để có thể tạo ra những câu có ngữ pháp khá ổn. Phần này đúng là y hệt cảm nhận của tôi khi xem các kết quả do GPT tạo ra.
Thú vị thật! Tôi nghĩ không chỉ ngôn ngữ mà kiến thức ở các lĩnh vực khác cũng có thể được áp dụng theo ngữ cảnh tương tự như trên. Thật đáng tiếc khi thực tế giáo dục ở nước ta, như ai cũng biết, vẫn chủ yếu diễn ra theo cách ghi nhớ hàng loạt kiến thức được chuẩn hóa giống nhau cho tất cả mọi người. Dưới góc độ hệ thống, việc cung cấp những trải nghiệm phù hợp với từng thành viên là điều khó và tốn kém, nhưng nhìn vào kết quả của AI được tạo ra bằng cách mô phỏng tế bào não như trên, tôi hy vọng chúng ta sẽ hướng đến một con đường tốt hơn.
Trên hết, tôi thấy quá thương cho những đứa trẻ đang phải học tập trong u uất bởi người lớn 😢 Trong khi bản chất của việc học vốn là niềm vui mà!
Thật ra tôi đã thắc mắc điều này từ hồi còn được học tiếng Anh lúc nhỏ. Khi chúng ta học chữ Hàn, có phải đã học ngữ pháp trước không?
Ngay cả bây giờ, khi nhìn nội dung ngữ pháp trong các khóa dạy tiếng Hàn cho người nước ngoài, tôi thấy khó hiểu và gượng gạo. Thế mà họ vẫn nói tiếng Hàn rất tốt.
Thú vị đấy. Có phải thời đại của Chomsky đang dần khép lại?
Theo tôi thì có vẻ ngược lại, thời đại của Chomsky đang đến. Với Chomsky, ngữ pháp không phải thứ được học mà đúng hơn là thứ bẩm sinh, chính xác hơn là được tạo ra từ một năng lực bẩm sinh. Và AI hiện nay, dưới góc nhìn của Chomsky, là kiểu học xa xỉ chỉ máy tính mới có thể làm. Chomsky chỉ ra rằng trẻ nhỏ không học ngôn ngữ bằng cách học hàng trăm nghìn từ. Lý thuyết của Chomsky nhằm giải thích năng lực của trẻ nhỏ học ngôn ngữ chỉ với 1-2 năm trải nghiệm ngôn ngữ, ít hơn rất nhiều so với machine learning; còn machine learning hiện nay thì theo kiểu, máy tính đâu phải con người, nên cần gì phải học ngôn ngữ như trẻ nhỏ, rồi cho nó học ngôn ngữ bằng dữ liệu của cả mười năm.