Báo cáo State of Data Science 2021 [PDF 46 trang]
(anaconda.com)- Báo cáo khảo sát về việc lĩnh vực khoa học dữ liệu đang tăng trưởng như thế nào
→ Thông qua các xu hướng được doanh nghiệp và cơ sở giáo dục áp dụng, sinh viên nên chuẩn bị gì cho tương lai?
-
Anaconda.org thực hiện khảo sát trực tuyến với 4.299 người tại 140 quốc gia
-
Nam 72%, nữ 23%
-
25~40 tuổi 50%, 18~24 tuổi 24%, 41~56 tuổi 18%
-
Cử nhân 34%, thạc sĩ 24%, tiến sĩ 10%, trình độ trung học 13%
-
Sinh viên 27%, nhà phân tích kinh doanh 11%, nhà khoa học dữ liệu 11%, giáo sư/nghiên cứu viên 9%, kỹ sư dữ liệu 7%, lập trình viên 6%
-
Cấp quản lý 26%, senior 25%, entry-level 15%, cấp giám đốc 10%, principal 8%, chủ sở hữu/ban điều hành/C-level 8%, VP 5%
-
Tác động của COVID-19 đến đầu tư vào khoa học dữ liệu: giảm 37%, tăng 26%, giữ nguyên 24%
-
Quy mô nhóm
→ Làm một mình 19%
→ 6~10 người 44%
→ 1~5 người 29%
→ 11-20 người 17%
→ Trên 20 người 10%
-
Nhóm của bạn trong tổ chức: IT 23%, R&D 16%, khoa học dữ liệu tiên phong 8%, vận hành 8%, tài chính 6%
-
Phân bổ thời gian của nhà khoa học dữ liệu: chuẩn bị dữ liệu 22%, làm sạch dữ liệu 17%, báo cáo & thuyết trình 17%, trực quan hóa dữ liệu 15%, chọn mô hình 12%, huấn luyện mô hình 12%, triển khai mô hình 11%
-
Những yếu tố cản trở mô hình dữ liệu được đưa vào production
→ 27%: tuân thủ tiêu chuẩn bảo mật IT
→ 24%: recode mô hình viết bằng Python/R sang ngôn ngữ khác
→ 23%: quản lý dependency và môi trường
→ 24%: recode mô hình viết bằng ngôn ngữ khác sang Python/R
- Các yếu tố được cân nhắc chính khi mua hệ thống cho khoa học dữ liệu
→ Hiệu năng CPU/GPU 60%
→ Bộ nhớ 46%
→ Phê duyệt của bộ phận IT 45%
→ OS 42%
→ Danh tiếng hỗ trợ khách hàng của nhà sản xuất 40%
→ Thương hiệu 32%
-
Việc sử dụng mã nguồn mở trong tổ chức: được phép 87%, không được phép 7%
-
Khuyến khích sử dụng mã nguồn mở: có 65%, không 21%
-
Tổ chức hỗ trợ đội ngũ đóng góp cho mã nguồn mở như thế nào
→ Dành riêng thời gian để đóng góp cho dự án mã nguồn mở 46%
→ Cấp kinh phí riêng cho việc phát triển dự án mã nguồn mở 54%
→ Có thành viên trong nhóm chỉ tham gia các dự án mã nguồn mở 41%
Mức độ sử dụng ngôn ngữ (Always, Frequently, Somtimes, Rarely, Never)
→ Python: luôn luôn 34%, thường xuyên 29%, thỉnh thoảng 22%, hiếm khi 11%, không bao giờ 4%
→ SQL: luôn luôn 15%, thường xuyên 20%, thỉnh thoảng 27%, hiếm khi 16%, không bao giờ 22%
→ R: luôn luôn 10%, thường xuyên 17%, thỉnh thoảng 25%, hiếm khi 18%, không bao giờ 30%
- 32% số người trả lời dự định tìm công việc mới trong vòng 6-12 tháng
1 bình luận
Liên kết tệp: https://know.anaconda.com/rs/387-XNW-688/…