38 điểm bởi xguru 2024-07-02 | 2 bình luận | Chia sẻ qua WhatsApp
  • Là một kỹ sư phần mềm đã xây dựng các ứng dụng đòi hỏi nhiều dữ liệu hơn 10 năm. Chủ yếu làm backend (legacy, cloud)
  • (1) Có nên chuyển hướng không? (2) Có ai đã làm vậy chưa? (3) Công việc hiện tại của tôi không có ML thì phải làm thế nào?
  • Có công việc kỹ thuật ML nào tập trung nhiều hơn vào quản lý/triển khai/mở rộng mô hình thay vì xây dựng mô hình không?
    • Tức là có thể không cần học toàn bộ phần toán học nền tảng phía sau không?

arnabgho

  • Làm Tech Lead MLE tại Snap và đã đặt nền móng cho hạ tầng AI tạo sinh của Snap
    • Đây là một lộ trình sự nghiệp rất đáng giá, và tôi rất muốn tích cực khuyến khích con đường MLE
  • Cuốn sách "Designing Machine Learning Systems: An Iterative Process for Production-Ready Applications" là một tài liệu nhập môn rất tốt về thiết kế hệ thống machine learning cho môi trường production
  • Tôi cũng rất khuyến khích blog này do chính tác giả đó (Chip Huyen) viết như một tài liệu nhập môn về xây dựng hệ thống AI và ML cấp production
    Xây dựng ứng dụng LLM cho production (bao gồm liên kết đến bản tóm tắt và bản dịch)
  • Trả lời các câu hỏi
    • (1) Có, đặc biệt là ở một bước ngoặt của thời đại như hiện nay thì thực hiện sự chuyển đổi này là điều khôn ngoan
    • (2) Có
    • (3) Xem các tài nguyên ở trên về cách bắt đầu và thành thạo kỹ năng kỹ thuật ML

breckenedge

  • Khoảng 7 tháng trước, tôi thử tham gia một dự án kéo dài 3 tháng nhằm xây dựng hệ thống gợi ý nội dung bằng ML
  • Bắt đầu với thư viện collaborative filtering có sẵn và kết thúc bằng PyTorch; ChatGPT đã giúp rất nhiều
  • Tôi có thể tiếp tục đi theo hướng đó, nhưng ban lãnh đạo muốn kết quả nhanh hơn và tốt hơn, và khi bắt đầu mà chưa có kinh nghiệm thì 3 tháng là đủ để bắt nhịp
  • Phần lớn công việc ML là dọn dẹp và chuẩn bị dataset, và điều đó không mấy thú vị
  • Một lãnh đạo đã gợi ý dùng Amazon Personalize; tôi đã thử nghiêm túc nhưng cuối cùng không thành công. Không rõ là do vấn đề dữ liệu hay do mô hình nền tảng
  • Cốt lõi của vấn đề khi dùng dịch vụ ML kiểu hộp đen là bạn không thể phân tích được điều gì đang diễn ra
  • Amazon Personalize khiến việc thay đổi lớp dữ liệu trở nên khó khăn, nên không thể biết liệu mình có đang tiến gần hơn tới một giải pháp tốt hơn hay không
  • Một chuyên gia ML dày dạn có thể dùng Personalize để tiến gần hơn tới một giải pháp tốt hơn
  • Vì vậy, nếu bạn có thể tiếp cận ML, tốt hơn nên làm một dự án thử nghiệm ML trước khi biến nó thành sự nghiệp để xem mình có thực sự thích hay không

nsyptras

  • > Có công việc kỹ thuật ML nào tập trung nhiều hơn vào quản lý/triển khai/mở rộng mô hình thay vì xây dựng mô hình không?
  • Tôi đã chuyển sang hướng này vào năm 2018. Nó được gọi là MLOps. Trước đó tôi là lập trình viên mobile
  • Thời điểm đó việc chuyển hướng khá dễ (dù bây giờ có thể cạnh tranh hơn nhiều)
  • Những gì tôi đã làm:
    • Tự mình thực hiện một dự án ML chuyên sâu và nhận ra rằng tôi thích làm việc trên toàn bộ ML stack
    • Tôi cũng viết một bài blog về dự án này
    • Sau đó tôi ứng tuyển vào một team MLOps và dùng dự án đó để chứng minh kỹ năng/kinh nghiệm
    • Có thể bạn sẽ né được toán, nhưng nếu học phần nền tảng thì mọi thứ sẽ dễ hơn rất nhiều
    • Tôi nghĩ nếu không có toán ML cơ bản thì mình sẽ phải mò mẫm gần như trong bóng tối

ilaksh

  • Có vẻ bạn đang nghĩ tới "MLOps". MLOps cũng rất quan trọng
  • Hãy thử luyện tập triển khai mô hình bằng Python với HuggingFace và RunPod
  • Ngoài ra, hãy tìm các tutorial về pretraining, fine-tuning và đánh giá LLM, đồng thời xem qua Predibase
  • Hiện tại, tôi cho rằng diffusion transformer là thứ quan trọng nhất
    • Nếu bạn có thể tìm được tài liệu giải thích cách chạy các job huấn luyện cho nó, điều đó có thể sẽ hữu ích với mọi người
  • Nếu muốn một cách "gian lận", hãy xem replicate.com. cog cũng có thể hữu ích để tự host mô hình ML bên ngoài replicate.com

nottorp

  • Tôi không thực sự "chuyển sang làm kỹ sư ML", nhưng trong 2,5 tháng qua tôi đã phần nào học được cách dùng các mô hình công khai, cũng như cách huấn luyện và chạy chúng bằng công cụ và API
  • Tôi hầu như không viết code mà đọc rất nhiều sách
  • Làm việc với một tổ chức nhỏ (nơi bạn không bị đóng khung vào vai trò mà chỉ được giao việc cần làm) sẽ hữu ích

trybackprop

  • Tôi thực sự đã viết và chia sẻ một bài blog về chủ đề này dành cho các kỹ sư phần mềm giàu kinh nghiệm đang cân nhắc chuyển sang ML
  • Trả lời
      1. Nếu bạn thích tự mày mò trong thời gian cá nhân thì có thể gọi đó là "khôn ngoan". Trước khi chuyển hướng, trong suốt 1 năm tôi đã học tài liệu vào buổi tối và cuối tuần, và đó là lần đầu tôi nghĩ mình muốn làm việc này toàn thời gian
      1. Có, và hiện tôi đã làm kỹ sư ML được 7 năm sau khi chuyển hướng. Hiện là ML tech lead tại một công ty FAANG. Trước đó tôi làm về hạ tầng và sản phẩm
      1. Một lời khuyên tôi từng nhận được vài năm trước là hãy tham gia một team ở gần với công việc ML để làm quen với việc ML trong production trông như thế nào. Bạn cũng có thể bắt đầu rèn tư duy ML trên Kaggle.com
  • Trong các bài viết khác trên blog của tôi, bạn có thể xem các tài nguyên để học AI/ML và phần toán cần thiết cho nghề này
  • Linear Algebra 101 for AI/ML – Part 1
  • (bao gồm quiz tương tác, kiến thức cơ bản về vector/ma trận, và phần giới thiệu ngắn về PyTorch, framework ML mã nguồn mở được dùng rộng rãi trong ngành).

deepGem

  • Hãy xem fast.ai, cụ thể là khóa "Practical Deep Learning for Coders
  • Dù là tài liệu từ năm 2022, các nguyên lý học được ở đây đến nay vẫn rất đúng và cực kỳ hữu ích
  • Đặc biệt là Self Attention, transformer và các kiến trúc hiện đại dựa trên những khái niệm này
  • Nhiều người hoàn thành khóa fast.ai đã chuyển hướng sự nghiệp không chỉ sang kỹ sư ML mà còn sang nhà khoa học nghiên cứu
  • Nói vậy chứ đây không phải là một khóa dễ, nên bạn sẽ cần dành thời gian rảnh để theo học
  • Nếu bạn quan tâm đến triển khai/mở rộng, có thể nhảy thẳng tới bài 2 của phần 1. Jeremy là một giảng viên xuất sắc
    • Tôi không xuất thân từ học thuật nên thấy phong cách giảng dạy của ông ấy rất lành mạnh

2 bình luận

 
rawoon89 2024-07-03

Đọc rất hay. Cảm ơn bạn.

 
ahwjdekf 2024-07-02

Ở Hàn Quốc thì chỉ cần biết ở mức gọi API là được; doanh nghiệp không muốn đầu tư nhiều tiền, nhưng lại vẫn muốn chạy theo các xu hướng đang hot... một bầu không khí khá mập mờ như vậy.