11 điểm bởi GN⁺ 2026-01-27 | Chưa có bình luận nào. | Chia sẻ qua WhatsApp
  • Giấc mơ thay thế nhà phát triển phân tích dữ liệu đã lặp lại suốt 50 năm, từ SQL đến AI; công cụ đã thay đổi nhưng nhu cầu về chuyên gia vẫn không biến mất
  • Các công cụ của từng thời kỳ thực sự đã nâng cao năng suất, nhưng những công việc cốt lõi là hiểu doanh nghiệp và đưa ra phán đoán mô hình hóa thì không được tự động hóa
  • Self-service, semantic layer và analytics engineering đã mở rộng khả năng tiếp cận, nhưng đồng thời tạo ra những dạng vai trò chuyên môn mới
  • Các công cụ dựa trên AI đã tăng mạnh tốc độ sinh mã, nhưng quá trình tư duy để quyết định cần xây dựng gì vẫn là phần việc của con người
  • Điểm nghẽn của công việc dữ liệu không nằm ở việc gõ lệnh hay công cụ, mà nằm ở tư duy và phán đoán; đó là sự thật không đổi trong suốt 50 năm
  • Bài viết này được truyền cảm hứng từ "Giấc mơ thay thế nhà phát triển lặp lại mỗi 10 năm" và được sắp xếp lại theo góc nhìn dữ liệu

Mô thức lặp lại: Vì sao giấc mơ này luôn xuất hiện

  • Cứ mỗi 10 năm lại có một công cụ mới xuất hiện, hứa hẹn sẽ đơn giản hóa việc xây dựng nền tảng dữ liệu và giảm phụ thuộc vào chuyên gia
  • Doanh nghiệp không hài lòng với tốc độ cung cấp dữ liệu chậm, còn các đội dữ liệu thì tiếp tục bị quá tải bởi những yêu cầu bất tận
  • Lý do vòng lặp này lặp lại suốt 50 năm nằm ở bản chất cốt lõi của công việc phân tích dữ liệu

1974: SQL và sự ra đời của ‘cơ sở dữ liệu nói tiếng Anh’

  • SQL được thiết kế để cả người không phải lập trình viên cũng có thể truy vấn dữ liệu, nhưng trên thực tế vẫn đòi hỏi hiểu biết về join và aggregate phức tạp
  • Lý tưởng để người dùng doanh nghiệp tự truy vấn trực tiếp đã không thành hiện thực, và những vai trò chuyên môn mới đã xuất hiện
  • Việc tiếp cận dữ liệu trở nên dễ hơn, nhưng chuyên môn vẫn cần thiết

Thập niên 1980: Lời hứa của OLAP và ngôn ngữ thế hệ thứ tư

  • Cách tiếp cận cho rằng nếu cấu trúc dữ liệu phù hợp với cách tư duy của doanh nghiệp, người dùng sẽ có thể tự phân tích đã lan rộng
  • Máy chủ MOLAP đã thực sự mang lại năng suất cho các bộ phận tài chính và kế hoạch
  • Việc thiết kế chiều dữ liệu, tối ưu hiệu năng và tích hợp vẫn đòi hỏi kiến thức chuyên môn
  • Công cụ đã thay đổi, nhưng vai trò của chuyên gia chỉ đổi hình thức

Thập niên 1990: Data warehouse và mô hình hóa chiều

  • Mô hình hóa chiều là nỗ lực che giấu sự phức tạp trong tầng ETL để đơn giản hóa việc phân tích cho người dùng
  • Dù có đầu tư quy mô lớn, nhiều dự án vẫn bị chậm tiến độ hoặc thất bại
  • Công việc mô hình hóa chính xác các quy tắc và ngoại lệ của doanh nghiệp vẫn là lĩnh vực không thể tự động hóa

Thập niên 2000: Semantic layer và BI self-service

  • Semantic layer trừu tượng hóa các thuật ngữ kỹ thuật thành ngôn ngữ doanh nghiệp
  • BI self-service đã nâng cao đáng kể khả năng tiếp cận trực quan hóa
  • Sự không nhất quán trong định nghĩa và tình trạng hỗn loạn dữ liệu nổi lên như những vấn đề mới
  • Quản trị và điều phối tập trung lại trở nên quan trọng

Thập niên 2010: Analytics engineering và ELT

  • Sự phổ biến của cloud data warehouse giúp việc chuyển đổi dữ liệu bằng SQL trở nên khả thi
  • Các nhà phân tích có thể trực tiếp xây dựng một phần của pipeline dữ liệu
  • dbt đã đưa các thực hành phát triển như kiểm thử, tài liệu hóa và quản lý phiên bản vào lĩnh vực dữ liệu
  • Khi quy mô dự án tăng lên, tầm quan trọng của kiến trúc và phán đoán vẫn được giữ nguyên

Kỷ nguyên AI: Điều gì đã thay đổi và điều gì vẫn vậy

  • AI thực hiện rất nhanh các công việc mang tính cơ học trong việc chuyển ý định thành mã
  • Việc chọn kiểu thiết kế chiều dữ liệu, định nghĩa chỉ số và đạt được đồng thuận trong doanh nghiệp vẫn cần phán đoán của con người
  • Tốc độ phát triển đã nhanh hơn, nhưng tổng thời gian dự án vẫn được dùng cho tư duy và điều phối
  • Thay đổi lớn nhất là vòng lặp phản hồi đã ngắn hơn, cho phép cải tiến lặp đi lặp lại

Ràng buộc không đổi: Sự phức tạp của tư duy

  • Data warehouse là mô hình của doanh nghiệp, và việc hiểu đúng doanh nghiệp là điều bắt buộc
  • Đằng sau những yêu cầu có vẻ là câu hỏi đơn giản luôn tồn tại vô số định nghĩa và ngoại lệ
  • Đây là vùng phức tạp mà công cụ không thể loại bỏ

Ý nghĩa đối với lãnh đạo dữ liệu

  • Điều cốt lõi không phải là công cụ có thay thế chuyên gia hay không, mà là nó nâng năng suất của chuyên gia lên bao nhiêu
  • Cần đánh giá liệu công cụ có giúp giảm việc lặp lại và cho phép tập trung vào những phán đoán giá trị cao hay không
  • Công cụ mới đòi hỏi những năng lực kỹ thuật mới

Vì sao giấc mơ này vẫn tiếp diễn

  • Giấc mơ loại bỏ chuyên gia đã đóng vai trò là động lực thúc đẩy đổi mới công cụ
  • Dù giấc mơ đó chưa bao giờ được hiện thực hóa hoàn toàn, nó vẫn tạo ra giá trị thực chất trong quá trình đó
  • AI cũng không thay thế chuyên gia, nhưng khiến chuyên gia làm việc hiệu quả hơn

Hướng đi sắp tới

  • Không có lý do gì để từ chối công cụ mới, nhưng kỳ vọng cần được đặt ở mức thực tế
  • Đối tượng đầu tư cốt lõi không phải là công cụ, mà là những con người hiểu được sự phức tạp của doanh nghiệp
  • Phân tích dữ liệu rốt cuộc là công việc biến sự hiểu biết về doanh nghiệp thành dạng có thể truy vấn
  • Sự thật không đổi trong suốt 50 năm là phán đoán và tư duy mới là điểm nghẽn lớn nhất

Chưa có bình luận nào.

Chưa có bình luận nào.