Lộ trình dành cho kỹ sư dữ liệu
(github.com)<p>Lộ trình về các lý thuyết/công cụ/framework mà các kỹ sư dữ liệu ngày nay nên học, tính đến năm 2020<br />
1. Kiến thức nền tảng CS<br />
2. Ngôn ngữ lập trình<br />
3. Kiểm thử<br />
4. Kiến thức cơ bản về DB<br />
5. RDB <br />
6. Non-RDB<br />
7. Kho dữ liệu<br />
8. Kiến thức cơ bản về tính toán cụm<br />
9. Xử lý dữ liệu<br />
10. Messaging<br />
11. Lập lịch workflow<br />
12. Giám sát data pipeline<br />
13. Mạng máy tính<br />
14. Infrastructure as Code <br />
15. CI/CD<br />
16. Identity and Access Management<br />
17. Bảo mật dữ liệu và quyền riêng tư cá nhân<br />
- Những thứ nên học thêm <br />
18. Trực quan hóa dữ liệu<br />
19. Kiến thức cơ bản về machine learning<br />
20. Machine Learning Ops </p>
3 bình luận