- Apple công bố tính năng mới trên iOS và macOS sử dụng mô hình ngôn ngữ transformer: đưa ra gợi ý văn bản dự đoán khi người dùng đang gõ
- Đây là một trong những mô hình dựa trên transformer đầu tiên được Apple công khai thừa nhận, và sẽ được tích hợp vào hệ điều hành
- Tương tự tính năng tự động hoàn thành của Gmail, nó có thể hoàn thành từng từ riêng lẻ và đôi khi đề xuất hơn hai từ cùng lúc
- Mô hình văn bản dự đoán được phát hiện trong AppleSpell, một ứng dụng nội bộ của macOS dùng để kiểm tra lỗi chính tả và ngữ pháp khi người dùng đang gõ
- Mô hình nằm trong
/System/Library/LinguisticData/RequiredAssets_en.bundle/AssetData/en.lm/unilm.bundle, nơi chứa nhiều tệp mô hình Espresso được sử dụng trong lúc gõ
- Từ vựng của mô hình văn bản dự đoán gồm 15.000 token, bao gồm token đặc biệt, từ viết tắt và biểu tượng cảm xúc
- Kiến trúc của mô hình văn bản dự đoán dường như dựa trên GPT-2, bao gồm embedding token, mã hóa vị trí, một chuỗi các khối decoder và tầng đầu ra
- Mô hình văn bản dự đoán của Apple có khoảng 34 triệu tham số và 512 hidden unit, nhỏ hơn nhiều so với phiên bản nhỏ nhất của GPT-2
- Nhờ kích thước nhỏ, mô hình có thể chạy nhanh và thường xuyên mà không tiêu tốn nhiều pin của thiết bị, từ đó cải thiện trải nghiệm người dùng
- Do bị giới hạn về kích thước, mô hình chưa đủ khả năng viết cả câu hay đoạn văn hoàn chỉnh, nhưng vẫn đủ tốt để đưa ra gợi ý cho người dùng khi có độ tin cậy cao về từ tiếp theo hoặc hai từ tiếp theo
- Tác giả cũng cung cấp một script trên GitHub cho những ai muốn tự mình thử trực tiếp tính năng văn bản dự đoán
1 bình luận
Ý kiến trên Hacker News
unilm.bundlelà mô hình dự đoán văn bản mới bằng cách quan sát log console của trình mô phỏng iOS.UnilmCtrlngụ ý một sự phụ thuộc nào đó vào mô hình CTRL của Socher, nhưng điều này chưa được xác nhận. Một số người dùng nói rằng họ sẽ tôn trọng Apple hơn nếu hãng đã làm việc lâu hơn trong lĩnh vực NLP.