- Apple đang điều chỉnh chiến lược silicon tự phát triển cho Mac, nhằm đẩy sớm bộ xử lý cao cấp nhất tiếp theo lên thế hệ M7 tập trung vào AI
- Trong khi hiện đang dùng dòng M5, bộ xử lý M6 cơ bản dành cho Mac phổ thông dự kiến có thể được công bố sớm nhất trong năm nay
- Khác với lộ trình thế hệ trước đây, Apple được cho là sẽ bỏ qua các phiên bản M6 cao cấp và chuyển thẳng dòng cao cấp lên M7
- Chip Mac cao cấp nhất tiếp theo dự kiến sẽ gồm các dòng M7 Pro, M7 Max, M7 Ultra
- Kế hoạch này hiện vẫn chưa được công bố, và thời điểm ra mắt cụ thể, các mẫu Mac áp dụng, số liệu hiệu năng cũng như giá bán chưa được xác nhận
Sự chuyển hướng trong chiến lược silicon cho Mac
- Apple muốn đẩy sớm thời điểm chuyển đổi bộ xử lý cao cấp nhất trong chiến lược silicon cho Mac
- Thay vì ra mắt M6 cao cấp theo lộ trình hiện có, hãng sẽ nối tiếp dòng cao cấp tiếp theo bằng thế hệ M7 tập trung vào AI
Phân tách vai trò của M6 và M7
- Hiện Apple đang sử dụng dòng M5
- Bộ xử lý M6 cơ bản dành cho Mac phổ thông dự kiến có thể được công bố sớm nhất trong năm nay
- Các phiên bản M6 cao cấp sẽ bị bỏ qua, còn dòng cao cấp nhất dự kiến sẽ tiếp nối bằng M7 Pro, M7 Max, M7 Ultra
Các chi tiết vẫn chưa được xác nhận
- Kế hoạch này hiện vẫn ở trạng thái chưa công bố
- Những người cung cấp thông tin yêu cầu ẩn danh vì kế hoạch chưa được công bố
- Dựa trên các nội dung đã được tiết lộ, thời điểm ra mắt cụ thể, các mẫu Mac áp dụng, số liệu hiệu năng và thông tin giá bán vẫn chưa được xác nhận
1 bình luận
Ý kiến trên Hacker News
Những giấc mơ kiểu RAM 768GB là điều vô lý từ góc nhìn của Apple
Nhìn việc họ ngừng bán M3 Ultra 256GB/512GB và tăng giá MacBook Pro 128GB từ 5.000 USD lên 7.000 USD, có thể xem như đã xác nhận trên thực tế rằng tình trạng thiếu RAM nghiêm trọng đến mức nào
768GB lớn gấp 64 lần mức 12GB được cho là sẽ có trong iPhone mới, nên để làm một chiếc Mac Studio 768GB, Apple cần biên lợi nhuận tương đương với việc từ bỏ 64 chiếc iPhone
Apple là công ty bán khăn lau sợi siêu mịn giá 100 USD, bánh xe giá 700 USD, vậy mà thay vì tăng giá bán cho nhóm khách hàng đang rất cần AI chạy cục bộ, họ lại đơn giản loại bỏ M3 Ultra 256GB/512GB; điều đó có vẻ cho thấy mức tăng giá cần thiết là không thể chịu nổi
Nếu giá trở thành mức thị trường mục tiêu không chịu nổi, họ sẽ giảm sản lượng hoặc khai tử sản phẩm hơn là cắt biên lợi nhuận; mô hình kinh doanh đơn giản đến đáng ngạc nhiên
Tức là chỉ bán cho khách hàng doanh nghiệp các cấu hình như 768GB với giá 20.000–25.000 USD, và loại khỏi các kênh phân phối tiêu dùng thông thường như cửa hàng hay Amazon
Tuy nhiên giờ đây có thể đó không còn là thị trường đủ lớn để Apple quan tâm
Nhưng nếu không có máy đầu bảng, Apple cũng sẽ đánh mất phần lớn thị trường chuyên gia tầm trung
Nếu lựa chọn là desktop Framework hoặc sự vắng mặt của Apple, dĩ nhiên người ta sẽ chọn Framework; và một khi đã quen với desktop Framework chạy Linux, họ có thể cũng sẽ không mua MacBook Pro nữa
Hiện Apple đang có cơ hội chiếm lấy thị trường AI cục bộ, nhưng cơ hội đó sẽ không kéo dài mãi
Có vẻ họ cho rằng trong tương lai, sau khi bong bóng AI biến mất hoặc vỡ tung, họ sẽ có thể kiếm được RAM
Làm một sản phẩm đã lên kế hoạch từ 3 năm trước dễ hơn rất nhiều so với vội vã chắp vá trong 3 tháng
Apple khá thú vị
Họ là một trong số ít công ty có chiến lược chip/PC mạnh, nhưng về cơ bản lại chưa đặt chân vào thị trường hyperscaler
Vì vậy, ít nhất trong ngắn hạn, họ có động lực để PC trở nên đủ mạnh nhằm chạy LLM cục bộ, và động thái lần này vì thế cũng thuyết phục hơn
Từ lâu tôi đã xem điểm ngoặt AI cục bộ là tín hiệu tận thế đối với các phòng thí nghiệm frontier
Phần cứng chỉ chạy được các mô hình lượng tử hóa dùng vài GB VRAM vẫn thua A100 gần như ở mức bội số một chữ số[0], và A100 lại thua cụm 8xH100 cũng ở mức bội số một chữ số[0]
Tôi rất tin vào LLM cục bộ, nhưng không thể tự lừa mình
Chỉ riêng chỉ số tỏa nhiệt/công suất cũng khiến accelerator trong trung tâm dữ liệu có khả năng thắng cao[1], ngay cả khi đánh giá rất rộng rãi về hiệu suất của chip Apple
0. Dựa trên các thử nghiệm huấn luyện tinh chỉnh không khoa học tôi đã làm với GPU cục bộ và GPU thuê; suy luận có thể khác
Nếu Apple giúp chạy được những mô hình như GLM 5.2 tại nhà thì tôi sẽ trở thành khách hàng ngay
MacBook Air M1 chạy máy ảo Linux nhanh hơn và tiết kiệm năng lượng hơn bất kỳ thiết bị nào trong trung tâm dữ liệu
Khi mọi người có thể chạy cục bộ các mô hình cấp opus4.6/gpt5.5, các phòng thí nghiệm có thể tăng giá và bán thêm những thứ như tốc độ token, suy luận tốt hơn, cải tiến tập trung vào di động
Không phải người tiêu dùng nào cũng là power user, và nhiều người sẽ sẵn sàng trả tiền để có sự linh hoạt
Theo bài viết, mục tiêu băng thông bộ nhớ M7 bản cơ bản là 240GB/s
M1 là 70GB/s, M1 Pro là 200, M1 Max là 400, M1 Ultra là 800
RTX 6000 mới nhất vào khoảng 1600GB/s
Nếu một biến thể M7 với RAM 512GB và băng thông 1200~1500GB/s ra mắt vào cuối năm 2027, đó sẽ là một con chip rất thú vị
Nhìn vào xu hướng cải thiện kích thước và hiệu năng của LLM, nó cũng có thể nằm ở vị trí giống như một điểm ngoặt cho suy luận cục bộ
Cũng tò mò không biết ngân sách điện năng trong form factor desktop sẽ ở mức nào
Với mô hình 1T MoE, 37B active, 4-bit, có thể thấy khoảng 100 token/s
Nếu giá bộ nhớ không giảm, có lẽ nó sẽ trên 30.000 USD
Dù vậy, xét việc card RTX Pro 6000 Blackwell 96GB hiện có giá 12.000 USD, nó có thể vẫn cho cảm giác tương đối rẻ
Trước khi Apple ngừng bán, M3 Ultra 512GB có giá khoảng 8.000 USD, và dự đoán M7 Ultra sẽ lên tới 768GB hoặc 1024GB
Trước cuộc khủng hoảng bộ nhớ, Apple Silicon Mac đang dần trở thành máy chạy LLM cục bộ rẻ hơn so với GPU chuyên nghiệp, và vài năm nữa cũng có thể nổi lên như vậy
Cũng có một phép tính thú vị: 512GB đủ để làm 42 chiếc Pro iPhone thay vì một chip Ultra
Giả sử biên lợi nhuận 55% và giá bán trung bình 1.200 USD, lợi nhuận từ việc làm iPhone là 28.160 USD
Việc Apple ngừng bán M3 Ultra 512GB cũng không có gì đáng ngạc nhiên
Nếu nguồn cung RAM cho mọi sản phẩm bị hạn chế, làm 42 chiếc Pro iPhone hợp lý hơn nhiều so với M3 Ultra 512GB giá 8.000 USD
Tính đến tháng 6/2026, M3 Ultra chỉ cấu hình được tối đa 96GB
Để Apple khớp được lợi nhuận iPhone bằng một chiếc Ultra Mac 512GB, họ sẽ phải nâng giá lên khoảng 50.000 USD
Bài viết không nói rằng M5 Ultra sẽ không ra mắt, và nhiều khả năng năm nay nó sẽ cung cấp băng thông bộ nhớ 1228GB/s
Có thể chạy thời gian thực mô hình MoE lớn đã REAP theo mục đích sử dụng, chẳng hạn cho agent coding tiếng Anh, và cũng có thể dùng lượng tử hóa động 2~4-bit
Nếu thế giới AI không diễn ra như kỳ vọng thì kế hoạch dự phòng của Apple là gì
Nếu mọi người muốn năng lực tính toán cơ bản và RAM dung lượng lớn cho cache kho lưu trữ tệp/chương trình thì sao
Dù vậy chiến lược này vẫn có thể hiệu quả
Từng có lúc ai cũng tin, hoặc tôi được nghe là họ tin, rằng tất cả sẽ chuyển trải nghiệm sống 2D của mình sang những khối lập phương GUI 3D chắc chắn mà ta xoay rồi bước vào sống bên trong
Nhưng Apple đã biến các panel chữ nhật desktop ảo 2D đơn giản thành kiểu dải như SONY, và biến số chỉ là một thứ di chuyển sang bên
Giờ chúng ta đang được nghe rằng AI là tương lai, và Apple dường như đang nói “đúng, nhưng nó sẽ chạy cục bộ”
Nếu AI thành hiện thực thì đây có thể là một ván cược an toàn, nhưng về mặt đạo đức, tôi tự hỏi liệu chúng ta có thật sự muốn các kết quả AI giống như khối lập phương GUI 3D nhập vai đã nói ở đây không
Nó quá hữu ích và mạnh mẽ
Càng có nhiều xáo trộn lớn bắt đầu, như các mô hình bị cấm, sức hấp dẫn của AI on-device trong nhiều mục đích sử dụng càng có thể tăng lên
Vì vậy trực giác của Apple có vẻ đúng
Thực tế tôi đã nhiều lần nghĩ rằng các workflow như tìm kiếm vector nhanh, chuyển lời nói thành văn bản và tóm tắt theo thời gian thực nên chạy nhanh hơn và phổ biến hơn trên thiết bị của mình
Nếu vậy thì việc mô hình cục bộ bắt kịp ở một mức nào đó cũng là tự nhiên
So với 5 năm trước thì đây vẫn là một thế giới khá tốt
Nếu có thể chạy cục bộ, LLM mới chính là yếu tố có thể tạo ra nhu cầu mới
Tôi đã mua một chiếc M3 Max 64GB tân trang
Nếu không có AI thì tôi không biết phải nâng cấp vì cái gì, và điều đó phụ thuộc vào việc ứng dụng nào yêu cầu năng lực tính toán cục bộ sẽ xuất hiện
Có thể là game tốt hơn, nhưng chuyện đó không hấp dẫn lắm
Cựu biên tập viên AnandTech Gavin Bonshor đã đưa tin rằng M7 sẽ được sản xuất trên quy trình Intel 18A
https://bontechlabs.com/news/apple-is-reportedly-using-intel...
Xét rủi ro khi thiết lập thiết kế Apple Silicon tại một fab mới, tôi cho rằng các linh kiện M7 ban đầu hẳn đang được sản xuất thử vào khoảng thời điểm này
Thiết kế M7 cơ bản có lẽ đã được chốt
Bài Bloomberg của Mark Gurman không có nội dung về đối tác sản xuất hay quy trình
Intel trước đây nổi tiếng nhờ kỹ thuật và khả năng mở rộng các quy trình nhỏ hơn, mới hơn tới mức khả thi thương mại sớm hơn nhiều
Nhưng quá trình chuyển sang 10nm kiểu Sisyphus bị chậm vài năm đã chấm dứt điều đó, và nói thật Intel có vẻ chưa phục hồi kể từ đó
Vì vậy Intel dường như có công suất fab chưa được tận dụng, trong khi TSMC và Samsung có khả năng dư cầu với mọi con chip họ sản xuất
Xét cả CHIPS Act của chính quyền Biden, việc chính quyền Trump nắm cổ phần Intel, môi trường thuế quan và áp lực mở rộng sản xuất tại Mỹ, các điều kiện đang dần phù hợp để ai đó tận dụng fab vật lý của Intel và sản xuất tại Mỹ, và người đó có thể là Apple
Vì họ sẽ được xem thiết kế của Apple từ vài tháng trước khi ra mắt, chứ không phải sau khi ra mắt
M6 thậm chí còn chưa ra mắt, nên có vẻ đây không phải là một cách phân loại thật sự cần thiết, mà trông giống như một cách phân loại được dựng lên
Tôi nghi đây có thể là một chiến lược marketing nhằm tăng sự quan tâm đến phần cứng Mac thế hệ tiếp theo, đồng thời tăng giá
Thay vào đó Apple sẽ chờ đến thế hệ tiếp theo mới tung ra chip Max/Pro mới
Đây không chỉ đơn thuần là marketing
Vì chip Pro/Max của một thế hệ dùng cùng các lõi với bản thường, nhưng số lượng nhiều hơn hoặc có tổ hợp lõi hiệu năng và lõi tiết kiệm điện khác nhau
Nghĩa là phải đến thế hệ M7 mới có các biến thể cao cấp
Các linh kiện của mỗi thế hệ chia sẻ kiến trúc, nên đây là một phân biệt thực tế
Bài viết có cả một phần suy đoán về linh kiện M6 sẽ ra sao, và nói rằng nó sẽ dừng ở khoảng băng thông bộ nhớ 200GB/s và khoảng 12 lõi đồ họa
Mỗi thế hệ M series đều có cải tiến về kiến trúc chipset
Khác biệt giữa M1 và M1 Pro không nằm ở kiến trúc mà ở cách bố trí và cấu hình, còn từ M6 sang M7 có lẽ sẽ có thay đổi kiến trúc
Ý là các thiết bị cấp thấp sẽ được làm mới, nhưng các phiên bản có nhiều lõi thì không được tạo ra
Giống như Mac Studio đã được làm mới với M4 Max nhưng Apple không làm M4 Ultra, nên nếu muốn CPU từ 28 lõi trở lên hoặc GPU từ 60 lõi trở lên thì vẫn phải dùng M3 Ultra
Lần này điều đó xảy ra trên toàn bộ Pro, Max và Ultra; nếu muốn các bản đó thì trong chu kỳ M6 bạn sẽ phải ở lại thế hệ trước
Cũng không kỳ lạ đến vậy
Apple có dải sản phẩm chip, phần cứng và phần mềm rất lớn, và không phải lúc nào cũng hợp lý khi ép mọi thứ vào cùng một chu kỳ cập nhật cố định hoàn toàn
Vì người tiêu dùng chỉ thấy kết quả cuối cùng đã ra mắt/công bố
Nhưng nếu Apple thực sự đã thiết kế dòng M6 rồi hủy thiết kế đó và yêu cầu nhóm làm một thiết kế mới nhấn mạnh thông số tập trung vào AI, thì đây không phải là một phân loại bịa ra mà là một phân biệt rất thực tế
Cái tên không quan trọng
M7 cũng có thể được tung ra dưới tên M6
Điểm cốt lõi là họ đã bỏ qua một thiết kế, hoặc một bước trong “mô hình Tick-Tock” của CPU
Có lẽ nên xem đây là mặt tích cực hiếm hoi của việc tăng giá
Tôi đã cân nhắc M5 128GB cho suy luận cục bộ, chẳng hạn dùng cho DS4, nhưng chỉ qua một đêm giá đã tăng 2.000 USD nên giờ gần như bị loại khỏi danh sách
Tuy vậy M5 so với 4090 cũng không tốt đến mức đó, nên tôi đã do dự khá lâu
Nó chắc cũng ổn, nhưng không đến mức “wow”
Nếu Apple dốc toàn lực để làm M7 cạnh tranh hơn, có lẽ tôi có thể chờ đến lúc đó
Giờ có khả năng một số người mua thực sự sẽ trì hoãn mua hàng
Về dài hạn, tôi thật sự tin rằng AI cục bộ sẽ thắng, và Apple sẽ trở thành công ty AI quan trọng nhất thế giới nhờ những con chip này
Hãy tưởng tượng những thứ như Opus ngày nay chạy miễn phí trên máy cục bộ, với quyền riêng tư hoàn toàn, trên trải nghiệm Apple UX đẹp mắt
Với phần lớn mọi người và phần lớn tác vụ, đó là đề xuất hấp dẫn hơn nhiều so với các mô hình frontier trên đám mây, vốn phải trả tiền, phải gửi toàn bộ dữ liệu đi và chỉ hoạt động khi trực tuyến
Nếu nói về nhu cầu của lập trình viên phổ thông hoặc người dùng bình thường thì đúng
Nhưng các công ty AI đang chuyên môn hóa sâu hơn vào nhiều lĩnh vực, và những mô hình tùy biến như vậy sẽ vượt xa trong các ngách tương ứng
Tôi đang dùng trực tiếp, và dạo này không chỉ ở đây mà cả các diễn đàn khác cũng dùng rất nhiều
Vì thế tôi thật sự không thể hiểu nổi định giá của các công ty AI hiện nay
M7 Pro và M7 Max được lên lịch sớm nhất vào cuối năm 2027, còn M7 Ultra là năm 2028
Tức là vì không có chip M6 Pro/Max, nên năm nay sẽ không có MBP thiết kế lại
Nhiều người, gồm cả tôi, đã kỳ vọng một mẫu MBP thiết kế lại mỏng hơn với màn hình OLED vào cuối năm nay
Tôi đã chờ cho đến khi quyết định chuyển từ MBP M1 Pro 16 inch sang M5 Air 15 inch vì mức tăng giá dự kiến
Chắc hẳn có nhiều người dùng thế hệ M1 Pro/Max đã chờ nâng cấp trong năm nay
Nghĩ đến các mẫu dùng bàn phím cánh bướm thời Ive là đã rùng mình
Hiệu năng đơn nhân tăng một chút và máy nhẹ hơn, nhưng màn hình tệ hơn và nhỏ hơn, còn hiệu năng đa nhân, hiệu năng GPU, hiệu năng mã hóa video và pin đều giảm
Tôi đang dùng M2 Max và rất vui khi form factor Air lớn hơn xuất hiện, nhưng nhìn thế nào cũng khó gọi là nâng cấp
Ở thời điểm này, liệu Apple có thể bán hợp đồng đã ký với TSMC để kiếm lời không
Ví dụ nếu giao dịch với Google để trì hoãn chip của chính Apple, liệu họ có thể kiếm được nhiều hơn so với việc tự bán sản lượng không
Nhu cầu đang điên rồ đến mức tôi không biết phép tính kiểu này có chút hợp lý nào không