- Lĩnh vực kỹ thuật dữ liệu đang cho thấy xu hướng phân cực mạnh hơn dưới áp lực kép từ sự lan rộng của AI và sự tích tụ nợ kỹ thuật
- Mức độ tận dụng AI trở thành cốt lõi của năng lực cạnh tranh; khi việc sử dụng hằng ngày trở nên phổ biến, chính cách gọi “được AI hỗ trợ” có thể sẽ biến mất
- Tầm quan trọng của mô hình hóa dữ liệu và lớp ngữ nghĩa tăng vọt, kéo theo nhu cầu đào tạo liên quan gia tăng và tích hợp công cụ cùng tự động hóa được đẩy nhanh
- Thị trường công cụ orchestration có thể dịch chuyển từ trung tâm là Airflow sang các công cụ thế hệ mới như Dagster, Prefect, hoặc bị hấp thụ vào các nền tảng
- Thiếu vắng lãnh đạo và sự kém hiệu quả trong tổ chức được chỉ ra là nút thắt lớn nhất; thay vì công nghệ, xây dựng năng lực tổ chức đang nổi lên như yếu tố quyết định sống còn
Xu hướng tổng thể của kỹ thuật dữ liệu
- Những vấn đề kéo dài lâu nay như thiếu vắng lãnh đạo, quyền sở hữu không rõ ràng, nợ kỹ thuật, áp lực thời gian vẫn chưa được giải quyết
- Sự tăng tốc của AI vừa làm các vấn đề này trầm trọng hơn, vừa mở ra khả năng cải thiện ở một số lĩnh vực
- Khoảng cách giữa các đội đã đầu tư vào năng lực nền tảng và các đội chưa làm như vậy đang ngày càng nới rộng
- Sự thiếu vắng mô hình hóa dữ liệu là một vấn đề lớn; 38% các đội không thực hiện mô hình hóa phải liên tục xử lý sự cố
- Trong khi đó, các đội có hệ thống mô hình hóa lại gặp ít vấn đề hơn
- Chủ đề cốt lõi của năm 2026 là “món nợ của quá khứ quay lại với lãi suất cao”, cho thấy áp lực thanh toán nợ kỹ thuật ngày càng tăng
1. Phớt lờ AI thì khó có thể tồn tại
- Trong số người tham gia khảo sát, 82% sử dụng AI mỗi ngày, và điều này đã trở thành yêu cầu cơ bản
- 64% vẫn chỉ ở mức thử nghiệm hoặc chiến thuật, còn 10% đã tích hợp AI hoàn toàn vào workflow
- Các đội thuộc nhóm sau được dự đoán sẽ nhanh chóng nới rộng khoảng cách
- Đến cuối năm 2026, cách gọi “được AI hỗ trợ” có thể sẽ trở nên cơ bản đến mức biến mất khỏi mô tả công việc
- Tuy nhiên, tầm quan trọng của mô hình hóa dữ liệu vẫn được duy trì
2. Khủng hoảng mô hình hóa dữ liệu và lớp ngữ nghĩa
- 89% gặp vấn đề liên quan đến mô hình hóa dữ liệu, nhưng chỉ 5% sử dụng mô hình ngữ nghĩa
- Hai hướng đi được đưa ra
- Hướng A: lớp ngữ nghĩa và lớp ngữ cảnh trở thành xu hướng chủ đạo
- Hướng B: AI tạo mô hình tức thời, làm giảm nhu cầu đối với lớp ngữ nghĩa
- Nhận định được đưa ra là Hướng A sẽ phổ biến trước, sau đó có thể bị các mô hình AI thay thế
- Công cụ lớp ngữ nghĩa và ontology được dự đoán là đột phá của năm 2026, trong khi nhu cầu đào tạo về mô hình hóa và ngữ nghĩa đều được ghi nhận ở mức 19%
3. Orchestration sẽ được tích hợp hoặc biến mất
- 20% doanh nghiệp hoàn toàn không dùng công cụ orchestration, và điều này được đánh giá là trạng thái bất ổn
- Một số vẫn phụ thuộc vào quy trình thủ công hoặc các công cụ không chính thức như cron
- Airflow và orchestration cloud-native hiện là xu hướng chủ đạo,
- Dagster đạt 12% ở doanh nghiệp vừa và nhỏ, 2.6% ở doanh nghiệp lớn, cho thấy xu hướng lan rộng theo kiểu bottom-up chứ không phải áp từ trên xuống
- Orchestration cho AI agent hiện vẫn đang ở giai đoạn chưa rõ ràng
- Trong tương lai có thể xuất hiện khả năng Dagster, Prefect thâm nhập vào khối doanh nghiệp lớn hoặc được tích hợp vào các nền tảng (Databricks, Snowflake, dbt Cloud, v.v.)
4. Kết thúc tranh luận lakehouse vs warehouse
- Tỷ lệ hiện tại là warehouse 44%, lakehouse 27%, hybrid 12%
- Có đề cập khả năng đến năm 2027 sẽ hội tụ về 35% / 35% / 30%
- Do sự hội tụ tính năng giữa Snowflake và Databricks, cách phân biệt “Lakehouse” được dự đoán sẽ dần mất ý nghĩa và đi đến chuẩn hóa
- Tỷ lệ chấp nhận lakehouse 40% ở Mỹ Latinh được chú ý như một chỉ báo sớm
- Đến cuối năm 2026, tranh luận “warehouse vs lakehouse” có thể sẽ bị xem là một chủ đề lỗi thời
5. Lãnh đạo nổi lên như nút thắt lớn nhất
- 22% kỹ sư dữ liệu chỉ ra sự thiếu vắng lãnh đạo là vấn đề chính,
- gần tương đương với nợ kỹ thuật (26%)
- Yêu cầu kém chất lượng (18%) cũng xuất hiện, phản ánh sự kém hiệu quả về mặt tổ chức
- Giữa làn sóng đẩy mạnh áp dụng AI, sự tự nhìn lại của lãnh đạo và cải thiện thiết kế tổ chức trở thành nhiệm vụ thiết yếu
- Trong năm 2026, nội dung và đào tạo về lãnh đạo dữ liệu, quản lý stakeholder, thiết kế tổ chức được dự đoán sẽ gia tăng
Xu hướng bổ sung: sự biến mất của một số đội
- 7% đội dự báo sẽ bị thu hẹp, trong đó 30% chỉ ra thiếu vắng lãnh đạo là nút thắt
- Đây không phải là sự thu hẹp do AI tối ưu hiệu suất mà là do thiếu sót về tổ chức
- Trong năm 2026, một số đội dữ liệu có thể sẽ bị giải thể, sáp nhập vào bộ phận kỹ thuật hoặc thuê ngoài
- Chỉ những đội chứng minh được giá trị kinh doanh mới có thể tồn tại; chỉ năng lực kỹ thuật đơn thuần là không đủ để duy trì lâu dài
Kết luận
- Trọng tâm của kỹ thuật dữ liệu năm 2026 không phải là chọn công cụ mà là năng lực thực thi của tổ chức
- Năng lực tận dụng AI, hệ thống mô hình hóa dữ liệu, chất lượng lãnh đạo sẽ là các tiêu chí phân định khả năng sống còn
- Đây là giai đoạn mà mức độ trưởng thành của tổ chức và cấu trúc hợp tác, hơn cả tiến bộ công nghệ, sẽ quyết định lợi thế cạnh tranh
Chưa có bình luận nào.