Nghi vấn Microsoft đang cố tự sát
(antipope.org)Tính năng mới của Microsoft: CoPilot+ và Recall
Tóm tắt nội dung chính
-
Sự lan rộng của AI:
- Gần đây, tin tức công nghệ tập trung vào sự lan rộng của AI (trí tuệ nhân tạo).
- Nhiều công ty đang cho thấy động thái muốn bổ sung AI vào sản phẩm.
-
Giới thiệu CoPilot+:
- CoPilot+ là tiện ích bổ sung cho Windows của Microsoft dựa trên LLM (mô hình ngôn ngữ lớn).
- Nó tương tự Clippy trước đây, nhưng sử dụng AI để hỗ trợ công việc của người dùng.
- Tuy nhiên, do giới hạn của LLM, có khả năng không đưa ra được câu trả lời chính xác.
-
Bộ xử lý Windows ARM:
- Microsoft đang thúc đẩy Windows dựa trên ARM để không phụ thuộc vào Intel.
- PC CoPilot+ mới được trang bị bộ xử lý ARM mạnh mẽ và được thiết kế phù hợp cho các tác vụ AI.
-
Tính năng Recall:
- Recall là tính năng ghi lại mọi hoạt động mà người dùng thực hiện trên máy tính.
- Nó chụp ảnh màn hình, trích xuất văn bản thông qua OCR (nhận dạng ký tự quang học) và nhận dạng giọng nói, rồi lưu vào cơ sở dữ liệu.
- Dữ liệu được lưu không được mã hóa, nên có thể phát sinh vấn đề bảo mật.
-
Vấn đề quyền riêng tư:
- Tính năng Recall có thể xâm phạm nghiêm trọng quyền riêng tư của người dùng.
- Dữ liệu được lưu có thể bao gồm thông tin xác thực, mật khẩu của người dùng, v.v.
- Cơ sở dữ liệu có thể bị triệu tập trong thủ tục pháp lý, trở thành rủi ro lớn với doanh nghiệp và cá nhân.
-
Các vấn đề khác:
- Tính năng Recall có khả năng vi phạm các quy định về quyền riêng tư như GDPR và HIPAA.
- Microsoft dự định buộc đưa tính năng này vào bản cập nhật Windows 11.
Ý kiến của GN⁺
-
Xâm phạm quyền riêng tư:
- Tính năng Recall có thể xâm phạm nghiêm trọng quyền riêng tư của người dùng. Đặc biệt, đây là rủi ro lớn với doanh nghiệp hoặc cá nhân xử lý dữ liệu nhạy cảm.
-
Lỗ hổng bảo mật:
- Cơ sở dữ liệu không được mã hóa có thể dễ dàng bị lộ cho hacker hoặc người dùng có ác ý. Điều này có khả năng dẫn đến các sự cố bảo mật.
-
Vấn đề pháp lý:
- Tính năng Recall rất có thể vi phạm các quy định về quyền riêng tư như GDPR và HIPAA. Điều này có thể dẫn đến tranh chấp pháp lý.
-
Mức độ tin cậy của người dùng:
- Việc Microsoft đưa vào tính năng như vậy có thể làm tổn hại nghiêm trọng đến lòng tin của người dùng. Về lâu dài, điều này có thể ảnh hưởng tiêu cực đến hình ảnh doanh nghiệp.
-
Công nghệ thay thế:
- Các doanh nghiệp coi trọng quyền riêng tư của người dùng nên cân nhắc các phương án thay thế khác thay vì tính năng Recall. Ví dụ, việc áp dụng giải pháp bảo mật dựa trên mã nguồn mở là một lựa chọn tốt.
1 bình luận
Ý kiến trên Hacker News
Ngay cả khi bỏ qua các lo ngại về bảo mật và quyền riêng tư, Recall cũng không thật sự tạo cảm giác như một tính năng AI
Chẳng phải cấu trúc của nó là tạo OCR trên thiết bị cùng cơ sở dữ liệu SQLite rồi tìm kiếm trong đó sao? Ngay cả theo định nghĩa AI lỏng lẻo ngày nay thì cũng khó thấy liên quan. Có phải vì OCR dựa trên machine learning không? Nếu Recall có thành phần LLM nào đó mà tôi bỏ lỡ, tôi tò mò liệu có thể tạo một website tấn công prompt injection bằng cách lập chỉ mục các chỉ thị độc hại vào cơ sở dữ liệu SQLite rồi sau đó đưa chúng cho LLM xử lý không
Gặp phản ứng như vậy ngoài đời thấy thật lạ. OCR cũng từng được cho là không thể đạt chất lượng tốt, nên người ta dùng CAPTCHA để chặn bot đăng nhập diễn đàn. Ban đầu là văn bản, rồi ngày càng bị bóp méo đến mức con người cũng khó đọc, sau đó chuyển sang số nhà, “bấm vào tất cả ảnh có XYZ”, và cuối cùng gần như biến mất, thay bằng phân tích vị trí con trỏ chuột và các trang đã truy cập
Manh mối là trong demo này https://www.youtube.com/watch?v=aZbHd4suAnQ&t=1062s, khi tìm “blue pantsuit with sequin lace” thì nó tìm ra một mục mà phần văn bản mô tả là “peacock”. Có vẻ là tìm kiếm embedding trên embedding hình ảnh
Và một trong ba cơ sở dữ liệu SQLite mà Recall tạo ra có tên “SemanticImageStore”, nên có vẻ nó chạy một mô hình embedding hình ảnh kiểu CLIP ngay trên thiết bị. Trong cơ sở dữ liệu đó còn có cột “diskann”, có vẻ chỉ đến thư viện chỉ mục vector của Microsoft https://github.com/microsoft/DiskANN
Ví dụ nếu trong ảnh của một slide PowerPoint có một chiếc túi màu xanh, nó sẽ tìm ra
OCR chắc chắn từng được xem là AI trước khi chúng ta biết cách làm. Giờ hiểu rồi nên nó thành “chỉ là điện toán”, nhưng ngay cả theo các định nghĩa AI khác thì vẫn hợp lý khi xem nó là AI
Nếu Recall chưa hoàn toàn bất hợp pháp ở EU, thì Microsoft đang chạy đua không giới hạn từ lúc phát hành cho đến khi có đạo luật cấm trên toàn EU
Có vẻ không có kịch bản nào EU cho phép thứ này trong khối. Chỉ riêng lo ngại rất xác đáng rằng nó có thể bị vợ/chồng bạo hành lạm dụng cũng đã đủ lý do chính trị. Tôi nghĩ sẽ khó tìm được một nghị sĩ Nghị viện châu Âu nào phản đối một dự luật được đóng khung theo cách đó, và các nghị sĩ mới đắc cử cũng sẽ hoan nghênh một chiến thắng dễ dàng giữa nhiều việc phức tạp, khó khăn
Ngoài nhiều lỗi logic đã được chỉ ra, tôi muốn bổ sung thêm một điểm
Câu chuyện này giả định rằng tương lai của Microsoft là Windows. Tôi nghĩ từ thời Satya thì không còn như vậy nữa. Khi nhận ra điều đó, bất kể một lỗi triển khai của một tính năng Windows, tương lai trông vẫn khá sáng
Không phải Xbox, họ đang thua cuộc chiến đó, và nó cũng dựa trên Windows. Cũng không phải điện thoại, họ đã thua rồi, và cái đó cũng dựa trên Windows
Office cũng khó. Nhu cầu với bộ phần mềm văn phòng trả phí đang giảm, còn MS Office trên trình duyệt thì khá tệ
Có thể là Azure, nhưng tôi nghĩ lối vào lớn dẫn đến Azure nằm ở việc Microsoft thúc đẩy các doanh nghiệp chuyển ActiveDirectory và Exchange lên cloud. Nhưng sự kết thúc của Windows cũng là sự kết thúc của ActiveDirectory, và với email/lịch trên cloud thì có các lựa chọn thay thế. Nếu không phải đã ở đó vì Exchange, Azure có hấp dẫn với nhiều người không?
Tương lai có thể sáng, nhưng nếu không có Windows để nhìn vào thì làm sao biết được tương lai đó? ;p
Nhìn vào các động thái như WSL,
winget,sudo, rõ ràng Windows đang dần chuyển thành một lớp vỏ bắt chước Linux ở giao diện dòng lệnhMicrosoft năm 2000 là Windows 9x, 2000, Office. Năm 2004, người ta tải phần mềm chỉ dành cho Windows từ website, nhưng đến 2024 thì phần mềm chỉ dành cho Apple hoặc chỉ dành cho Linux cũng phổ biến
Xét cho cùng, “năm của desktop họ Linux” đã là MacOS hơn 10 năm nay rồi. So với các ma sát như đường dẫn tệp của Windows, Win32 API, nó gần như là thứ thuốc dẫn nhập để đi tới Linux hoàn chỉnh
Tôi không nói là sai, và thực ra cũng đồng ý rằng Windows đã bị đẩy xuống hàng thứ yếu trong Microsoft, nhưng đó là chuyện khá đáng sợ
Nhìn vào giấy phép Exchange Server mới, có thể nói khá an toàn rằng Microsoft muốn rút khỏi mảng phần mềm on-premises càng nhanh càng tốt. Chỉ có điều, liệu thế giới đã sẵn sàng chấp nhận điều đó chưa, và đó có phải điều chúng ta muốn không, thì vẫn là câu hỏi
Có nhiều anti-pattern đáng ngờ đến mức vô lý
Ngay cả nếu Microsoft hay một FAANG nào khác làm rò rỉ toàn bộ dữ liệu của chúng ta, tôi cũng không biết liệu họ có thật sự phải trả giá đắt hay không
Lần gần nhất có công ty nào thực sự “sụp đổ” vì vấn đề bảo mật dữ liệu là khi nào? Các vụ vi phạm bảo mật dữ liệu gần đây có Snowflake, AWS / Capital One
Điểm cốt lõi được chỉ ra ở đây là thứ không thu thập thì không thể bị rò rỉ. Recall là loại dữ liệu nhạy cảm hơn rất nhiều, và nhiều hơn rất nhiều so với những gì Microsoft từng thu thập trước đây
Điều này làm tôi nhớ đến hồi giữa thập niên 2010, khi một số hệ thống trên AWS mặc định ở trạng thái công khai, và vô số vụ “rò rỉ dữ liệu” xảy ra chỉ vì các công ty không đặt bucket dữ liệu của mình ở chế độ riêng tư
Ví dụ, nếu buộc phải trả 10.000 đô la cho mỗi người bị lộ địa chỉ, các công ty sẽ bắt đầu coi dữ liệu người tiêu dùng là rủi ro thay vì một tài sản chi phí thấp
Trông như máy chủ web bên kia mới là bên tự sát trước
Hoặc cũng có thể sự cố vừa được sửa xong
Báo cáo kết quả kinh doanh quý gần đây của Microsoft cho thấy doanh thu tăng 17%, và giá cổ phiếu đã tăng gần 25% trong năm qua
Rõ ràng Microsoft không hề tự sát. Nhìn xem tính năng này thu hút được bao nhiêu sự chú ý
Mọi hãng truyền thông công nghệ đều đang nói về Windows, và Windows đột nhiên lại trở nên có liên quan. Thế thì tự sát ở chỗ nào?
Những người tự sát là các khách hàng Microsoft bật tính năng này. Cần giáo dục người dùng về rủi ro của tính năng này và cách tắt nó
Có thể là một cái chết ngu ngốc, nhưng người nổ súng vẫn phạm tội giết người. Tôi thấy đây là một phép ví von khá phù hợp với tình huống hiện tại
Tìm trên HN cũng không thấy, nhưng tôi nhớ là trước đây từng thấy thứ gì đó giống Recall
Một công cụ chụp màn hình chạy OCR/phát hiện, rồi đưa vào cơ sở dữ liệu để có thể tìm kiếm. Nó là mã nguồn mở trên GitHub
Nói thêm là về vấn đề quyền riêng tư thì tôi khá phân vân, nhưng mặt khác có vẻ như họ đang đưa ARM trở lại Windows, nên tôi ủng hộ điều đó
Trong câu “chúng ta đã biết từ lâu rằng công nghệ mô hình ngôn ngữ sẽ thống trị tương lai của chúng ta”, từ chúng ta được định nghĩa là những người chỉ có thu nhập nếu có thêm đầu tư đổ vào công nghệ LLM
Với phần còn lại, LLM trông có vẻ thiếu sót đến tuyệt vọng nếu coi nó là lời giải tổng quát cho bất cứ thứ gì
Tôi không nhất thiết cho rằng Microsoft đang tự sát
Chỉ là tôi thấy họ quá phản ứng sau sự việc và không đủ chủ động. Nói cách khác, họ dường như đang mắc sai lầm khi tập trung quá nhiều vào việc dự đoán dòng chảy công nghệ, thay vì tự tạo con đường và tạo ra cơ hội cho mình
Tất nhiên, ở một số thị trường như công cụ dành cho nhà phát triển, hoặc có lẽ Azure, họ vẫn đang tự tạo con đường. Nhưng tôi thì biết gì chứ, chỉ là một lập trình viên ngốc nghếch thôi