- Trình kiểm tra ngữ pháp mã nguồn mở. Một sản phẩm có thể dùng thay cho dịch vụ thương mại nổi tiếng Grammarly
- Bất kỳ ai cũng có thể sử dụng miễn phí, đồng thời mã nguồn và thuật toán được công khai minh bạch
- Cung cấp khả năng tự động phát hiện và sửa lỗi ngữ pháp, văn phong, chính tả trong văn bản tiếng Anh
- Phù hợp với nhiều nhóm người dùng như lập trình viên, nhà văn, sinh viên, đồng thời có khả năng tùy biến linh hoạt
- Có thể tự host máy chủ hoặc chạy cục bộ, nên có lợi thế về quyền riêng tư và bảo vệ dữ liệu
Giới thiệu về Harper
- Harper là trình kiểm tra ngữ pháp và văn phong mã nguồn mở cung cấp các tính năng tương tự Grammarly
- Được cung cấp hoàn toàn miễn phí, bất kỳ ai cũng có thể tự do xem và sử dụng mã nguồn
- Triển khai các tính năng hiệu đính văn bản tiếng Anh như kiểm tra chính tả, phát hiện lỗi ngữ pháp và gợi ý cải thiện văn phong
- Người dùng có thể cài đặt Harper trên máy chủ cục bộ hoặc hạ tầng riêng để tăng cường quyền riêng tư dữ liệu
- Có khả năng mở rộng và tùy biến cao, giúp chỉnh sửa thuật toán và bổ sung tính năng theo nhu cầu riêng một cách dễ dàng
Tính năng và ưu điểm chính
- Vì là dự án mã nguồn mở, có thể quản lý và cải tiến ý tưởng nội bộ mà không phụ thuộc vào dịch vụ bên ngoài
- Dù được tối ưu cho tiếng Anh, nó cũng hàm chứa khả năng mở rộng hỗ trợ đa ngôn ngữ trong tương lai
- Được cộng đồng hỗ trợ tích cực, nên phản hồi và cải tiến tính năng đang diễn ra sôi nổi
- Cung cấp mức linh hoạt cao thông qua mô hình chạy trên máy chủ hoặc cài đặt trực tiếp
Đối tượng sử dụng và ví dụ áp dụng
- Phù hợp với người dùng quan tâm đến nâng cao chất lượng viết tiếng Anh như kỹ sư phần mềm, người viết tài liệu kỹ thuật, sinh viên
- Có lợi cho các tổ chức muốn xây dựng quy trình hiệu đính tài liệu nội bộ mà không để lộ thông tin cá nhân cho dịch vụ bên ngoài
- Hiệu quả trong các môi trường cần tùy biến nâng cao như quy tắc tùy chỉnh và tích hợp workflow
2 bình luận
Ý kiến trên Hacker News
Với hầu hết tài liệu, Harper có thể đưa ra gợi ý trong vòng dưới 10ms; vì thế thấy lạ khi mọi người dễ chấp nhận các đơn vị như 10l hay 10kg nhưng lại có cảm giác khó chịu với 10ms
Việc các quy tắc ngữ pháp được hard-code trong một chương trình mã nguồn mở để người dùng có thể tự sửa vẫn được ưa thích hơn nhiều so với cách hard-code ngầm trong tinh chỉnh prompt hoặc dữ liệu huấn luyện của LLM Cấu hình LSP cho Neovim trông khá ổn tài liệu tích hợp Neovim Đây mới thực sự là kiểu công cụ của tương lai Có đề xuất rằng Automattic nên nhấn mạnh điểm này ngay trên trang chủ
Cá nhân thấy việc không dùng LLM là một lợi thế lớn Grammarly ngày càng thiếu ổn định sau khi thêm các tính năng AI; một giờ trước còn bảo bỏ dấu phẩy, lát sau lại bảo thêm vào, cho thấy sự thiếu nhất quán
Các mô hình LLM tổng quát thực sự hay lúng túng với dấu câu; đã trực tiếp thấy đây là một nhược điểm khá rõ, nên khá ngạc nhiên khi các dịch vụ như Grammarly vẫn để nguyên hiện tượng này
Trong khoảng một năm gần đây, kết quả dự đoán của Grammarly và gboard đã trở nên cực kỳ tệ
Tò mò không biết có công cụ tương tự nào được xây dựng trên LLM không LLM không phải lúc nào cũng vượt trội hơn, nhưng sẽ rất thú vị nếu được so sánh sự khác biệt giữa hai cách tiếp cận
Phản hồi đùa rằng việc các gợi ý về dấu câu thay đổi liên tục trông rất giống các giáo viên dạy tiếng Anh
LanguageTool (đối thủ của Grammarly) cũng là mã nguồn mở và có thể chạy cục bộ GitHub, image Docker Tôi chủ yếu chạy LanguageTool cục bộ bằng container Docker Chưa dùng Harper kỹ, nhưng đã biết đến nó từ lâu; thật vui khi có nhiều lựa chọn khác nhau Cũng mong website của Harper nêu rõ rằng trong số các công cụ cạnh tranh có công cụ cũng chạy được cục bộ
Trong câu “Me and Jennifer went to have seen the ducks cousin.”, hoàn toàn không phát hiện ra lỗi nào Có ý kiến cho rằng cần bổ sung nhiều quy tắc hơn nữa kiểu này thì mới có thể tiến gần đến trình độ của Grammarly
Ban đầu thấy khá ấn tượng, nhưng sau nhiều lần thử thì kết luận hiệu năng rất thất thường vì không bắt được cả những lỗi khá cơ bản
Tương tự, “My name John. What your name? What day today?” cũng không bị đánh dấu là lỗi ngữ pháp
Có người thắc mắc những câu thử nghiệm kiểu này thực sự nhằm diễn đạt điều gì
Có ý kiến rằng sẽ rất hữu ích nếu có website cho phép demo hoặc thử nghiệm trước khi tải xuống hay cài extension Extension Firefox dẫn tới trang này, nhưng nếu dán văn bản dài thì phần highlight không hoạt động đúng
Thắc mắc vì sao các công cụ học ngôn ngữ lại không tận dụng LLM Có người cho rằng hoàn toàn có thể giao 100% các vấn đề ngôn ngữ cho LLM Hỏi rằng chẳng lẽ chưa từng thấy ChatGPT mắc lỗi tiếng Anh sao
Khi Grammarly tăng cường tính năng AI, nó còn đưa ra những câu kỳ quặc như tách “wasn't” thành “was trulyn't” hình liên quan
Lỗi của LLM được chứng kiến khá thường xuyên, đôi lúc còn đưa ra các gợi ý rất kỳ quặc Dĩ nhiên phần lớn thời gian chúng hoạt động rất tốt, nhưng chưa bao giờ đạt đến mức thật sự “đáng tin”, thậm chí còn có xu hướng lặp lại chính lỗi sai của người dùng
Có ý kiến chỉ ra rằng bản chất của các công cụ học ngôn ngữ kiểu này thường là để né tránh việc “thực sự học” ngôn ngữ
Tò mò thị trường mục tiêu của Grammarly là ai Không rõ có phải họ nhắm đến các chuyên gia dùng tiếng Anh như ngôn ngữ thứ hai hay không
Giới thiệu rằng còn có một LSP server rất tốt có thể xử lý cả việc kiểm tra ngữ pháp trong comment của code tài liệu LSP
Vì đây là sản phẩm do Automattic tạo ra, có người ngần ngại dùng vì lo nếu thành công thì Matt sẽ phá hỏng nó để kiếm lợi
Có phản biện rằng vì là mã nguồn mở (FOSS), nên kể cả trong kịch bản xấu nhất, cộng đồng vẫn có thể fork phiên bản tốt cuối cùng và tiếp tục phát triển
Có lập trường dứt khoát rằng chính vì đây là sản phẩm của Automattic nên sẽ không dùng
A a, không phải 10l mà là 10L!