- Issen cung cấp gia sư ngôn ngữ AI được cá nhân hóa
- Người dùng có thể trải nghiệm học ngôn ngữ theo hình thức hội thoại tương tác
- Hệ thống AI thiết lập lộ trình học phù hợp với mục tiêu và điểm yếu của từng người dùng
- Khác với các ứng dụng học ngôn ngữ hiện có, dịch vụ này nổi bật với phản hồi theo thời gian thực và khả năng trò chuyện tự nhiên
- Được chú ý như một phương án nâng cao năng lực ngoại ngữ nhanh chóng và hiệu quả cho startup và nhân sự IT
Giới thiệu dịch vụ
- Issen là một startup được chọn vào khóa Y Combinator F24, cung cấp gia sư ngôn ngữ AI tùy chỉnh cho từng cá nhân
- Người dùng có thể sử dụng giao diện hội thoại để luyện tập tự nhiên nhiều ngoại ngữ như tiếng Anh
- Gia sư ngôn ngữ AI nhận diện điểm yếu của người dùng về phát âm, từ vựng và ngữ pháp, rồi ngay lập tức đưa ra câu hỏi và phản hồi phù hợp
- Khác với phương thức giáo dục dạng bài giảng truyền thống, dịch vụ kết hợp hội thoại hai chiều theo thời gian thực với lộ trình học thích ứng, giúp tăng tính chủ động của người học
Các đặc điểm chính
- AI chatbot hội thoại đề xuất kế hoạch học ngôn ngữ cá nhân hóa dựa trên mục tiêu và trình độ của người học
- Cung cấp hệ thống phản hồi tức thì như sửa ngữ pháp theo thời gian thực, gợi ý từ vựng và phản hồi phát âm
- Hỗ trợ các kịch bản hội thoại tùy chỉnh hữu ích cho đời sống thực tế và công việc kinh doanh, thay vì học dựa trên giáo trình
- Phân tích dữ liệu học tập và tiến độ để liên tục theo dõi mức độ đạt mục tiêu và việc cải thiện các điểm yếu
Điểm khác biệt và hiệu quả kỳ vọng
- Thay vì các bài tập khuôn mẫu hay học lặp lại mà các ứng dụng hiện có cung cấp, dịch vụ mang đến trải nghiệm hội thoại gần với môi trường sử dụng ngôn ngữ thực tế hơn
- Giúp người học ngôn ngữ nhanh chóng xác định phần còn thiếu của bản thân và luyện tập tập trung một cách hiệu quả
- Được xem là một giải pháp giúp startup và nhân sự IT toàn cầu nhanh chóng nâng cao năng lực ngôn ngữ khi mở rộng ra nước ngoài và làm việc trong nhiều môi trường công việc khác nhau
1 bình luận
Ý kiến Hacker News
Tôi muốn nói rằng mình đồng cảm với việc học ngôn ngữ cần có sự đổi mới
Tôi đã thử học tiếng Hy Lạp sơ cấp trên web app, và trải nghiệm tốt hơn chế độ giọng nói của ChatGPT hay Gemini
Nhưng sau khoảng 5 phút, tôi thấy bối rối vì gia sư AI không nắm được kế hoạch học riêng của tôi hay những chỗ tôi đang gặp khó
Ví dụ, nó hỏi về sở thích rồi ngay lập tức nói với tôi một câu tiếng Hy Lạp dài về việc đi bộ đường dài trên núi
Là người mới hoàn toàn, tôi không thể trả lời câu này, thậm chí lặp lại cũng khó
Tôi còn chẳng biết lúc đó mình phải làm gì
Nếu là giáo viên thật, họ hẳn đã lặp lại một phần câu, dịch hoặc giải thích thêm
Nhưng gia sư AI chỉ đứng chờ tôi nói gì đó, rồi lại chuyển sang nói về kỳ nghỉ ở bãi biển
Dù vậy, tôi vẫn thấy nó tốt hơn AI hiện có, nên định sẽ thử lại lần nữa
Không khác nhiều so với chế độ giọng nói nâng cao của ChatGPT, và tôi phải tự dẫn dắt cuộc trò chuyện nên nhìn chung có cảm giác khá ngẫu nhiên
Cứ quay quanh những chủ đề quen thuộc nên ý nghĩa luyện tập lại giảm đi
Tôi đã kỳ vọng một kế hoạch học có định hướng hơn để mở rộng sang lĩnh vực và kỹ năng mới một cách có hệ thống
Vì chương trình học đã được giảng viên con người thiết kế có hệ thống trong nhiều năm, nên logic hơn mọi thứ khác
Đặc biệt khóa tiếng Hy Lạp rất xuất sắc, không quảng cáo và hoàn toàn miễn phí
Tôi có thể tự tin giới thiệu đây là công cụ học ngôn ngữ tốt nhất tôi từng dùng
https://www.languagetransfer.org/
Khi nói dối rằng tiếng mẹ đẻ là tiếng Anh thì mọi thứ diễn ra bình thường
Nhưng nó lại gọi tôi là Anton thay vì tên tôi đã nhập
Sắc thái việc tôi nói lắp bắp hay đang gặp khó bị biến mất hoàn toàn trong quá trình chuyển thành văn bản
Các bài học có kịch bản rất tốt, nhưng chế độ hội thoại AI lại quên mất mức từ vựng và ngữ pháp đã học trong bài, rồi nói chuyện bằng thành ngữ
Cuối cùng tôi mất hứng và ngừng dùng
Tôi không thể dùng Duolingo vì nó game hóa quá mức, nên cảm ơn vì app này giảm bớt phần đó
Tôi tò mò không biết có thể chuyển đổi tự nhiên giữa tiếng mẹ đẻ và ngôn ngữ mục tiêu không, và trong lúc hội thoại có thể hỏi bằng tiếng Anh hay không
Đến mức còn có cả bài báo nghiên cứu về tối ưu hóa toàn cục
Các chỉ số học tập hay việc tạo nội dung thì dễ, nhưng chưa ai làm được vòng lặp thực sự khớp với từng người học
Ngay cả trên Duolingo, bấm "luyện tập" cũng không thấy tiến bộ gì, lần nào cũng chỉ ra mấy nội dung nhàm chán kiểu Bread and water
Tôi không thể hoàn toàn tin tưởng TTS trong học ngôn ngữ
Phát âm sai có thể bị nội hóa mà mình không hề biết
Trong khóa tiếng Nhật của Duolingo, tôi tưởng đó là bản ghi âm thật, nhưng lại nghe 'oyogu' được tổng hợp kỳ lạ như 'oyNHYAOgu'
Nếu là người mới bắt đầu, tôi lo họ sẽ bắt chước luôn những lỗi như vậy
Dĩ nhiên nếu dành nhiều thời gian đắm mình thì có thể sửa sai, nhưng học sai ngay từ đầu sẽ tốn nhiều công hơn
Đặc biệt với tiếng Nhật, nơi pitch accent rất quan trọng, nhiều tài liệu và nhiều người lại bỏ qua điều này
Ví dụ: 'ima' có thể mang nghĩa 'bây giờ' hoặc 'phòng khách' tùy theo cao độ của âm tiết thứ hai
Vấn đề này có thể còn lớn hơn ở các ngôn ngữ như tiếng Nhật, nơi có nhiều từ gốc Hán
Một số gia sư tiếng Nhật đang áp dụng giọng đó, và pitch accent gần như hoàn hảo
Thỉnh thoảng vẫn có lỗi với kanji hay đọc sai, nhưng khi furigana khác đi thì có thể nhận ra ngay
Tôi cũng đã dùng TTS từ nhiều nhà cung cấp khác nhau (11labs, OpenAI, play.ht, Azure, Google, Polly, v.v.) khi làm app học ngôn ngữ, nhưng cứ ba câu thì có một câu lỗi
Mất khoảng một tuần để sửa, và giờ thì không còn lỗi nữa
Hiện tượng này đặc biệt nặng với tiếng Nhật; còn với đa số ngôn ngữ thanh điệu thì ít nhất thanh điệu vẫn đúng
Tôi không đủ tư cách để đánh giá độ tự nhiên, nhưng chưa gặp kiểu lệch nhịp nghiêm trọng như tiếng Nhật
Nhưng TTS ở đa số ngôn ngữ vẫn còn thiếu chất lượng
Mỗi ngôn ngữ có cách nhấn âm khác nhau
Tiếng Tây Ban Nha quan trọng độ dài nguyên âm, tiếng Iceland quan trọng âm lượng, tiếng Anh là độ dài + âm lượng, còn tiếng Thụy Điển/tiếng Nhật thì cao độ quan trọng
Ngay cả tiếng Anh, nhấn sai trọng âm cũng có thể khiến không giao tiếp được
Tiếng Nhật còn đặc biệt hơn vì có nhiều từ đồng âm, và nghĩa thay đổi theo pitch
Việc lên xuống cao độ chính xác là rất cần thiết
App này thật sự cho trải nghiệm tuyệt vời nhất
Cuộc trò chuyện với một người Argentina diễn ra cực kỳ tự nhiên
Tôi đã sống hơn 18 năm ở Buenos Aires nên phát âm và ngữ điệu của mình cũng khá tốt
Nhưng ngữ pháp cơ bản còn nhiều lỗ hổng, và app này đã mài giũa những điểm đó rất chính xác
Tôi thấy hơi tiếc là trong UX trên iOS, khi mở modal cài đặt thì nút đóng (CTA) khá khó thấy
Màu trạng thái khi bấm nút cài đặt và màu trạng thái vô hiệu hóa gần như giống nhau
Giải pháp: thêm nút đóng X ở góc trên bên phải và đổi màu khi được bấm
Nếu muốn thêm feedback UX thì cứ liên hệ tôi qua visualsitemaps.com
Tôi đã thử học tiếng Việt, nhưng chất lượng bài học rất thấp và có cả thông tin sai
Khi một người đàn ông tự chỉ mình thì Anh mệt là đúng, nhưng giải thích rằng Em mệt là cách nói dành cho nữ là sai
'Anh' nghĩa là nam lớn tuổi hơn, còn 'Em' dùng cho người nhỏ tuổi hơn bất kể giới tính
Nhiều phụ nữ thích dùng Em vì muốn trông trẻ hơn tuổi thật, nhưng nam trẻ cũng có thể dùng Em
Một gia sư tốt sẽ giải thích ngữ cảnh dựa trên tuổi tác và quan hệ
Cũng có lỗi đọc câu tiếng Anh bằng giọng tiếng Việt
Nó đưa ra những câu quá khó so với trình độ của tôi hoặc khi tôi yêu cầu gì đó thì lại lệch trọng tâm
Dù tiếng Việt miền Nam phổ biến hơn trong đa số trường hợp, các gia sư lại đến từ miền Bắc
Nhận dạng giọng nói (STT) cũng quá dễ dãi với phát âm sai hoặc không phân biệt được tiếng Anh và tiếng Việt
Ví dụ: "Phai" bị nhận thành "bye"
Tôi đã kỳ vọng vì rẻ hơn nhiều và có thể học không cần xếp lịch, nhưng khó mà tin vào độ chính xác
Hiện tại tôi đang trả $20 mỗi buổi cho gia sư người Việt, tổng cộng $160 mỗi tháng
Cảm ơn vì đã nêu ra vấn đề
Rất cần một nền tảng học ngôn ngữ tốt
Tôi đồng ý rằng feedback này đánh đúng trọng tâm
Tôi đã tạo một công cụ giúp luyện các câu cơ bản và muốn nhận feedback https://envn.app
Tôi đã thử bằng tiếng Nhật nhưng thấy khá bức bối
Dù là người mới bắt đầu, gia sư vẫn chỉ nói tiếng Nhật, và dù tôi đã nhiều lần nói rằng mình không hiểu thì vẫn vậy
Ngay cả khi tôi xin chuyển dần từ tiếng Anh sang tiếng Nhật, nó chỉ nói một câu bằng tiếng Anh rồi lập tức quay lại tiếng Nhật
Có lẽ với người học trình độ trung cấp trở lên thì sẽ hữu ích như một công cụ luyện hội thoại, nhưng vẫn cần trải nghiệm tốt hơn cho người hoàn toàn mới bắt đầu
Vì model hỗ trợ multimodal, sẽ rất tốt nếu tận dụng mạnh cả tài liệu trực quan
Tôi cũng muốn đề xuất hiển thị ngay phần tiếng Nhật đã ghi lại dưới dạng romaji
Thành thật mà nói, hiện tại trọng tâm là người học từ trình độ B1 trở lên
Nếu người mới hoàn toàn cần học giai đoạn 0→1, thì có lẽ tài liệu truyền thống sẽ tốt hơn, đặc biệt là loại ít nhấn mạnh nghe và nói hơn
Chế độ hội thoại giọng nói rảnh tay trên app di động của ChatGPT khá dùng được
Chỉ là nếu không có chủ đề thì cuộc trò chuyện dễ đơn điệu và cứ quanh quẩn mấy chuyện cũ kỹ
Vì thế tôi thường copy toàn bộ bài báo và các link liên quan, rồi báo trước kiểu “hãy luyện ngôn ngữ về chủ đề này”
Nhờ vậy tôi có thể đi bộ một tiếng và luyện thực chiến bằng tiếng Tây Ban Nha
Khi muốn, tôi chỉ hỏi ChatGPT bằng tiếng mẹ đẻ còn phía đối thoại (chatbot) chỉ trả lời bằng ngôn ngữ mục tiêu, để tập trung rèn nghe hiểu
Tôi tò mò Issen đã cải thiện trải nghiệm này tới mức nào
Tốc độ tiến bộ của các mô hình giọng nói cũng rất nhanh
Tôi cảm thấy cần một trải nghiệm tổng thể chuyên cho học ngôn ngữ, gồm chương trình học cá nhân hóa, prompt, mô hình AI để nhận diện chính xác, flashcard/từ điển, v.v.
Có cung cấp chế độ rảnh tay, và cũng có thể tùy biến nhiều yếu tố như tiếng lóng, tốc độ nói, tỷ lệ dùng ngôn ngữ mục tiêu, v.v.
Tôi đã thử luyện bằng tiếng Nga, và bản thân việc luyện tập thì tốt, nhưng điểm còn thiếu chung của mọi app học ngôn ngữ là khả năng bắt lỗi và sửa lỗi phát âm của tôi
Chỉ cần nói gần đúng là nhận dạng tự động (STT) đã cho qua
Tôi mong sẽ đến lúc AI thực sự “nghe” cách tôi phát âm và chỉ ra chính xác từng chỗ sai không bỏ sót
Hiện tại nó chưa nhận ra cả vấn đề accent lẫn đuôi cách hay trọng âm trong từ
Nếu AI lặp lại cho tôi bằng ngữ điệu hoặc hình thức đúng thì tất nhiên vẫn giúp sửa, nhưng không mang lại sự tự tin như giáo viên thật
Một đề xuất sản phẩm: thêm tùy chọn tắt transcription (phụ đề)
Nhất là vì ở một số ngôn ngữ, nhìn thấy chữ viết lại gây cản trở hoặc trở thành đường tắt cho người mới bắt đầu
Cuối cùng, sẽ thú vị hơn nhiều nếu có cấu trúc hội thoại định hướng mục tiêu hơn thay vì những cuộc trò chuyện ngẫu nhiên và thiếu phương hướng kiểu “Điều gì ở AI khiến bạn thấy thú vị nhất?”
Ngay cả không cần game hóa, vẫn có thể dùng dạng tranh luận (“Hãy thuyết phục tôi về chủ đề này!”) hoặc gắn với trải nghiệm cụ thể (“Mục tiêu quan trọng nhất trong công việc của bạn năm nay là gì?”) để khơi ra ý kiến/trải nghiệm thực chất
Tôi nghĩ đây là sản phẩm đầu tiên tôi thấy mà mình thực sự có thể dùng, xin gửi lời khen
Khi mô hình voice-to-voice trưởng thành hơn thì sẽ thực sự rất đáng mong đợi
OpenAI/Gemini cũng đang có tiến triển lớn nên chúng tôi dự định sớm áp dụng
Tôi thắc mắc vì sao video lại bị khóa, chỉ xem được sau lần phát đầu tiên nếu đăng nhập
Tôi có thấy feedback nói app này nhắm đến trình độ B1 trở lên, nhưng video demo lại cho thấy từ A1 đến C1
Rất hiếm người dùng cần toàn bộ dải A1~C1, và mỗi cấp độ có thị trường rõ ràng riêng, nên cần phân tách
TTS tiếng Pháp nghe kém tự nhiên hơn giọng mặc định của ChatGPT
Nếu có các bài tập một chạm theo cấp độ người dùng, như đọc tin rồi thảo luận, sắc thái và suy luận, thì có lẽ sẽ rất được ưa chuộng
Đặc biệt, nhiều người dùng không nhận ra lời nói của họ thiếu tính liên kết, nên nếu có cấu trúc chỉ ra đây là năng lực cốt lõi của threshold proficiency thì sẽ giúp ích thực sự
App làm rất tốt, tôi đã giới thiệu cho khoảng hơn 10 người xung quanh
Có vài điều tôi tò mò:
Chúng tôi chủ yếu kiểm thử và tinh chỉnh trên các ngôn ngữ phổ biến nhất
Dựa trên feedback người dùng, chúng tôi thực sự đã loại bỏ các ngôn ngữ có quá nhiều vấn đề, và vẫn còn những ngôn ngữ chưa kịp kiểm tra hết
Loại giọng phụ thuộc vào chất lượng của các dịch vụ TTS (Openi, 11labs, minimax, v.v.)
Một số dịch vụ không có giọng nam hoặc chỉ giọng nữ là tốt
Chúng tôi dự định sẽ bổ sung thêm đa dạng giọng hơn về sau
Với Sesame, họ có thể đưa chính giọng thật của người dùng vào TTS để khớp với cảm giác và bầu không khí của người dùng, còn chúng tôi hiện vẫn chỉ dùng TTS gốc dựng sẵn
Sesame cũng có độ trễ cực thấp, nhưng điều này lại có thể là bất lợi trong học ngôn ngữ
Mục tiêu về sau là mang đến trải nghiệm dựa trên các mô hình speech-to-speech đã trưởng thành hơn