5 điểm bởi GN⁺ 5 giờ trước | 3 bình luận | Chia sẻ qua WhatsApp
  • Trong bối cảnh các công cụ AI nhanh chóng xâm nhập cả vào việc viết và review code, cần mặc định loại trừ việc dùng AI trong phỏng vấn và đánh giá tập trung vào năng lực nền tảng
  • Một buổi phỏng vấn tốt được đánh giá trên hai trục là chất lượng tín hiệu (signal quality)chi phí đối với công ty (cost to company), và hai yếu tố này không hoàn toàn độc lập
  • Các loại phỏng vấn được chia thành bốn nhóm: Take-home, Live exercise, Presentation, Actual work, mỗi loại có chất lượng tín hiệu và chi phí khác nhau
  • Do AI coding, take-home trở nên quá dễ, gánh nặng review tăng lên, và ngay cả các câu hỏi đã bị lộ cũng khiến AI trở thành một huấn luyện viên cực kỳ mạnh
  • Mức độ thành thạo AI chỉ là instrumental skill (kỹ năng công cụ), vì vậy công ty nên tập trung đánh giá foundational skill (năng lực nền tảng)

Luận điểm cốt lõi

  • Trước tốc độ tiến hóa nhanh của mô hình và công cụ AI, người ta đặt câu hỏi liệu 6 tháng nữa kỹ sư còn viết và review code hay không; và nếu kỹ năng cốt lõi biến mất thì cách phỏng vấn có nên tiến hóa theo không
  • Phần lớn công ty chọn giữ nguyên hiện trạng, kể cả các công ty đang dẫn dắt cuộc cách mạng này
    • Hướng dẫn tuyển dụng của Anthropic yêu cầu bài take-home phải được hoàn thành "không dùng Claude, trừ khi có chỉ dẫn khác"
  • Một số công ty cho phép, khuyến khích hoặc bắt buộc dùng AI, và bản thân năng lực dùng AI cũng trở thành chủ đề của phỏng vấn
  • Kết luận là nên loại trừ AI một cách phổ biến trong phỏng vấn, đồng thời đưa ra các cách cụ thể để điều chỉnh phỏng vấn cho phù hợp với AI

Hai chiều của một buổi phỏng vấn tốt

  • Chất lượng tín hiệu (Signal quality)

    • Khả năng nhận diện ứng viên mạnh đối với một tập năng lực nhất định và bỏ qua nhiễu (những yếu tố không cốt lõi cho vai trò hoặc có thể dạy dễ dàng)
    • Khả năng kháng luyện thi (Invulnerability to preparation): nếu kết quả bị chi phối bởi lượng chuẩn bị và công sức bỏ ra, thì bạn chỉ đang thu được tín hiệu về đúng đặc tính đó
    • Tính thực tế (Realism): phỏng vấn nên giống công việc hằng ngày, nhưng đó không phải mục tiêu tự thân. Phỏng vấn kiểu "algorithm & data structure" vẫn tồn tại lâu dài dù không được dùng trực tiếp trong thực tế công việc
    • Tính bình đẳng (Equality): một số ứng viên có lợi thế hơn nhờ chuyên môn lĩnh vực từ trước, mentoring trả phí, nhiều thời gian rảnh, câu hỏi bị lộ trên mạng, hoặc bạn bè vừa trải qua quy trình tương tự. Lý tưởng là cần một môi trường công bằng cho tất cả
    • Độ khó (Difficulty): một buổi phỏng vấn tốt phải đủ khó để phần lớn người tham gia thất bại. Tốt nhất là một bài toán rộng, mơ hồ, đòi hỏi nhiều lớp insight
  • Chi phí đối với công ty (Cost to company)

    • Câu hỏi phỏng vấn đòi hỏi đầu tư thời gian đáng kể: thiết kế bản nháp và phê duyệt thử nghiệm, viết scorecard theo vị trí và cấp bậc, kiểm thử với ứng viên nội bộ lẫn bên ngoài, tài liệu hóa và đào tạo interviewer
    • Câu hỏi và scorecard cần được hiệu chỉnh liên tục nên khoản đầu tư này phải được duy trì thường xuyên
    • Độ khó (Difficulty): làm ra câu hỏi đã khó, làm ra câu hỏi đủ khó còn khó hơn. Cả hai thái cực quá dễ hoặc quá khó đều là lãng phí thời gian của mọi bên
    • Sức hấp dẫn với ứng viên (Appeal to candidate): quy trình quá tốn thời gian hoặc câu hỏi nhàm chán sẽ khiến kỹ sư giỏi rời đi và làm giảm tỷ lệ chuyển đổi. Câu hỏi cũng phản ánh văn hóa kỹ thuật của công ty
  • Hai chiều này không hoàn toàn độc lập; ví dụ độ khó ảnh hưởng tới cả hai phía. Phỏng vấn khó có thể làm ứng viên mạnh tỏa sáng, nhưng cũng có thể gây ra false negative (loại nhầm)
  • Phỏng vấn không cần hoàn hảo, và false negative lẫn false positive luôn tồn tại. False negative khó nhận diện, nhưng false positive có thể được xử lý nhanh hơn bằng onboarding tốt và các mốc rõ ràng trong học kỳ đầu tiên

Phân loại kiểu phỏng vấn

  • Take-home

    • Ứng viên nộp (1) lời giải cho một vấn đề mơ hồ (ví dụ: đặc tả sản phẩm) đồng thời (2) tuân thủ một số ràng buộc kỹ thuật (ví dụ: danh sách ngôn ngữ lập trình)
    • Thường được nối tiếp bằng một buổi review nơi ứng viên trình bày công việc và chỉnh sửa trực tiếp
    • Chất lượng tín hiệu: (trước AI) cao — cung cấp tín hiệu rộng về thiết kế, coding, chú ý chi tiết, testing..., và việc dành hơn 6 giờ cũng chứng minh động lực
    • Chi phí công ty: trung bình — có thể tự động hóa đánh giá, review đầu ra (code) theo kiểu bất đồng bộ, nhưng vẫn có thể làm ứng viên bỏ cuộc
    • Rất dễ tổn thương trước AI và những người có động lực cao
  • Live exercise

    • Bao gồm algorithm & datastructure, live coding, system design, postmortem review..., thường kéo dài hơn 1 giờ. Ứng viên giải trực tiếp trước interviewer các bài như "thiết kế kiến trúc Netflix" hay "viết rate-limiter"
    • Chất lượng tín hiệu: trung bình — nếu thiết kế và triển khai tốt thì khá khách quan, nhưng tín hiệu thường tập trung vào một chủ đề
    • Chi phí công ty: trung bình — để ít bị ảnh hưởng bởi việc ứng viên luyện trước, cần có nhiều câu hỏi đa dạng
    • Một số công ty dùng dịch vụ tự động hóa để giảm chi phí
  • Presentation

    • Ứng viên tự chọn vấn đề và câu trả lời như "giải thích một dự án bạn dẫn dắt", "sơ đồ kiến trúc", "một trải nghiệm bạn từng có"
    • Chất lượng tín hiệu: thấp — có nhiều kiểu thất bại
      • Chưa từng làm bài toán thú vị (ví dụ: junior), chọn vấn đề nhàm chán, phóng đại tác động hoặc đóng góp, chuẩn bị thuyết trình kém, giao tiếp rất giỏi nhưng không phải người thực thi, hoặc interviewer thiếu kiến thức miền nên đánh giá sai
    • Chi phí công ty: thấp — không có quá nhiều thứ phải chuẩn bị về mặt hiệu chỉnh
    • Có thể giảm bớt chất lượng tín hiệu thấp bằng các câu hỏi hồi cố như "nếu làm lại bạn sẽ làm khác điều gì?" hoặc giả định như "nếu thay đổi yêu cầu X thì sao?"; khi đó nó gần hơn với live exercise chưa hiệu chỉnh. Tuy nhiên interviewer sẽ cần nhiều công sức và chuyên môn hơn
  • Actual work (không hẳn là một kiểu phỏng vấn)

    • Làm việc cùng nhau trong 1 tuần có trả lương. Các công ty như Linear dùng cách này
    • Chất lượng tín hiệu: cao / Chi phí công ty: cao
  • Phần lớn công ty trộn nhiều kiểu với nhau, và Live exercise đang chiếm ưu thế

Việc lộ câu hỏi chỉ là vấn đề thời gian (không liên quan đến AI)

  • Việc lộ câu hỏi chỉ là vấn đề thời gian, và các trang như Glassdoor liệt kê gần như toàn bộ bí mật phỏng vấn. Thậm chí có ứng viên đi phỏng vấn chỉ để bán lại câu hỏi
  • Nếu bỏ qua điều này, tín hiệu sẽ yếu đi và động lực chính quyết định hiệu suất phỏng vấn sẽ bị biến thành "bạn có tìm được quy trình phỏng vấn của chúng tôi không"
  • Chiến thuật ứng phó

    • Kiểm soát việc chuẩn bị (Control the preparation): đưa presentation vào hỗn hợp hoặc cung cấp hướng dẫn rõ ràng (ví dụ: "system design sẽ thiên về database", "thuật toán sẽ là đồ thị") để tạo môi trường công bằng hơn
    • Đa dạng hóa câu hỏi theo từng loại: định kỳ lưu trữ (archive) các câu hỏi cũ. Nếu ứng viên không thể đoán chính xác câu hỏi, họ buộc phải mở rộng phạm vi chuẩn bị, và đó chính là mục tiêu. Dù vậy, cách này không miễn phí
    • Làm việc rò rỉ khó hơn (Make it harder to leak): tổ chức onsite, dùng whiteboard, đặt những câu hỏi dễ lộ nhất ở giai đoạn sau của quy trình (khi số ứng viên ít hơn nên xác suất rò rỉ thấp hơn)

AI coding đang đe dọa mô hình phỏng vấn hiện tại

  • (1) Take-home trở nên quá dễ với ứng viên và quá đắt với công ty

    • Đến năm 2026, phần lớn bài nộp có khả năng sẽ do AI tạo ra hoặc được AI hỗ trợ; ngay cả những bài hiện còn trụ vững cũng chỉ còn là vấn đề thời gian trước khi bản phát hành mô hình tiếp theo giải được
    • Kết quả là đa số ứng viên đều qua vòng đầu, khiến thời gian review tăng mạnh. Dùng AI để review các bài nộp do AI tạo ra là điều vô lý
    • AI coding chuyển chi phí phỏng vấn từ người được phỏng vấn sang interviewer
      • Trích luật Brandolini: năng lượng cần để bác bỏ code tệ lớn hơn một bậc độ lớn so với năng lượng để tạo ra nó
  • (2) Khi thời gian viết code giảm, việc giảm tỷ trọng live-coding là điều tự nhiên

    • Cũng như ta dùng ngôn ngữ bậc cao thay vì viết mã máy, có quan điểm cho rằng hợp lý khi các công cụ được phép dùng trong phỏng vấn cũng nên gần với công việc thường ngày
  • (3) Khi câu hỏi bị lộ, AI trở thành một huấn luyện viên cực mạnh

    • Trước đây, việc tìm câu hỏi và chuẩn bị tốn nhiều thời gian và nguồn lực; còn bây giờ AI mang lại hình thức trợ giúp mạnh nhất mà cũng rẻ nhất

Cách mô hình đánh giá học đường cổ điển chống lại công nghệ

  • Các kỳ thi trung học và đại học ở Pháp nhìn chung vẫn giữ cùng một hình thức
    • Không được mang tài liệu vào (bài giảng, sách...), hầu như không được dùng công cụ (đặc biệt là máy tính cầm tay), nội dung không công bố trước, không thể đoán trước (mỗi đề khác nhau và chỉ dùng một lần), bài toán rộng và mơ hồ
    • Tinh túy của kỳ thi văn học Pháp là dissertation, nơi thí sinh viết bài luận 5–10 trang từ một chủ đề một câu, đã tồn tại từ năm 1830. Các kỳ thi khoa học cũng có hình thức tương tự với 3–4 bài toán mơ hồ
  • Vẫn có các hình thức bổ sung như take-home, câu hỏi kiến thức trắc nghiệm, bài tập nhóm, thuyết trình..., nhưng đó chỉ là ngoại lệ chứ không phải nguyên tắc
  • Áp lại khung phân loại
    • Chất lượng tín hiệu: cao — không gian chuẩn bị cực rộng và đòi hỏi nỗ lực bền bỉ
    • Chi phí: rất cao — phải thiết kế đề mới và hướng dẫn chấm cho từng kỳ thi, và mọi ứng viên cùng thi một đề tại cùng thời điểm (gần như phi thực tế hoàn toàn với tuyển dụng doanh nghiệp)
  • Điều thú vị là mô hình này gần như không thay đổi dù đã có những bước nhảy vọt của công cụ nhận thức như copy-paste, Internet, máy tính cầm tay hay solver
    • Giáo dục nên tập trung vào năng lực nền tảng chứ không phải công cụ nhất thời, điều này phù hợp với mô hình mang tính Aristote, nhấn mạnh phán đoán (phronesis) hơn là ghi nhớ (mneme)

Vì sao công ty nên hạn chế dùng AI trong phỏng vấn

  • Phân biệt giữa năng lực nền tảng và năng lực công cụ

    • Foundational traits & skills là những năng lực, thái độ hoặc thói quen khó xây dựng hoặc tốn kém để xây dựng
      • Năng lực trí tuệ thô, chuyên môn sâu đạt được sau nhiều năm học hỏi (hệ thống phân tán hàng triệu request/giây, chuyển hàng trăm microservice thành monolith...), suy luận bậc hai, và các phẩm chất như đạo đức nghề nghiệp, integrity, khả năng hồi phục
      • Đây là phần kiến thức đã được nội hóa (fundamentals) giúp con người nhận diện, trừu tượng hóa và giải quyết vấn đề, đồng thời tạo nền để tích lũy thêm kỹ năng khác. Kiểu mà người ta nói "người này thông minh nên sẽ tự xoay xở được"
    • Instrumental skills có thể được xây khá nhanh hoặc với chi phí thấp
      • Thành thạo trung cấp một ngôn ngữ lập trình, dùng text editor hợp lý, tra cứu tài liệu, điều chỉnh prompt cho AI
    • Trong phỏng vấn, người ta thường dùng tín hiệu từ nhiều kỹ năng công cụ để suy ra các đặc tính nền tảng của ứng viên như sẵn sàng đầu tư vào năng suất hay khả năng học có cấu trúc
  • Lý do 1: Thành thạo AI không phải là năng lực nền tảng

    • Công cụ kỹ thuật luôn tiến hóa, nhưng phỏng vấn nhìn chung vẫn giữ nguyên (không có kiểu phỏng vấn low-code, system design chủ yếu vẫn dùng công nghệ cơ bản và không quản lý)
      • Những công ty giỏi nhất không tìm kiếm sự thành thạo với một công cụ duy nhất; với sự trỗi dậy của LLM, tầm quan trọng của Expert Generalist còn lớn hơn
    • Đây cũng là lý do chuyên môn sâu với một ngôn ngữ lập trình hiếm khi quá quan trọng trong phỏng vấn. Ngôn ngữ chỉ là công cụ phục vụ mục tiêu cấp cao hơn là giải quyết vấn đề
    • AI cũng vậy: prompt/context engineering, định nghĩa MCP/skills, multi-agent workflow, harness engineering... đều cần kỹ thuật tinh tế, nhưng đó vẫn là kỹ năng công cụ, và chúng đòi hỏi cùng những năng lực nền tảng cần thiết để viết code, review code, hay thiết kế kiến trúc có thể mở rộng
    • Công ty tuyển bộ não chứ không tuyển một đôi tay vô thức gõ lệnh cho AI agent
    • Review và sản xuất chỉ là hai mặt của một đồng xu: review code, kiến trúc hay phân tích đều đòi hỏi năng lực gần giống với việc viết, thiết kế hay phân tích. Vì vẫn cần con người tạo và xác thực yêu cầu kinh doanh nên code review sẽ không sớm biến mất (một đặc tả đủ chi tiết gần như đã là code)
  • Lý do 2: AI che khuất các đặc tính và năng lực nền tảng

    • Trích Peter Drucker: không thể chỉ thuê đôi tay; bạn luôn thuê cả con người
    • Dùng phân biệt của Lewis Mumford — tool (con người là chủ thể điều khiển) vs machine (vận hành theo logic riêng và có agency). Nếu dùng AI quá mức, gần như không thể phân biệt phần đóng góp riêng của kỹ sư với phần đóng góp của mô hình AI
    • Cần cảnh giác với những kỹ sư dùng AI như một "machine" thay vì một "tool". AI không chỉ là autocomplete mạnh hơn mà là cú nhảy năng suất đủ lớn để ngoại hóa phần lớn tư duy. Ngay cả những vùng thuần người như "taste" cũng bị đe dọa, khiến cả Fitts' list trông đã lỗi thời
    • Theo cách Plato được Derrida phân tích qua khái niệm pharmakon, AI vừa là thuốc chữa (tự động hóa refactor lặp đi lặp lại, tiết kiệm thời gian học các điểm đặc thù của thư viện) vừa là chất độc (nguy cơ làm teo đi năng lực nền tảng)
    • Một buổi phỏng vấn quá nhấn mạnh AI có nguy cơ đánh giá mô hình ("machine") thay vì con người. Cần thiết kế bài tập nhấn mạnh suy luận của con người như chủ đề chính của phỏng vấn
  • Lý do 3: AI tiến hóa quá nhanh

    • Theo Arthur Mensch (CEO của Mistral), mô hình AI tích lũy khoảng 1 năm kinh nghiệm software engineering sau mỗi 12 tháng. Những câu đùa ví AI agent như intern giờ không còn nghe nhiều nữa
    • Phần lớn công ty không đủ nguồn lực để liên tục tạo và duy trì các câu hỏi kháng AI mà vẫn ép được năng lực nền tảng. Khi mô hình thay đổi hàng tháng và bạn thậm chí không thể tiếp cận mọi mô hình, việc tiếp tục tạo câu hỏi chống được các mô hình tốt nhất là một cuộc chiến thua chắc
      • Bài "Designing AI resistant technical evaluations" của Anthropic là một case study về việc "chiến đấu" với AI chứ không phải với ứng viên
    • Làm take-home khó hơn cũng giống như cho phép dùng máy tính nhưng lại ra bài nhẩm khó hơn
    • Best practice của AI cũng thay đổi hàng tháng, và khi mô hình ngày càng hiểu chỉ dẫn tốt hơn thì tầm quan trọng của prompt engineering giảm đi. Việc ứng viên có nắm kỹ thuật mới nhất hay không không phải tín hiệu hữu ích
    • Trong khi đó, fundamentals theo định nghĩa là không đổi

Trả lời các phản biện

  • Với ý kiến không có dữ liệu: (1) một thí nghiệm thực sự có ý nghĩa thống kê (thử nghiệm đối chứng ngẫu nhiên) gần như bất khả thi, và sẽ không có công ty nào chấp nhận false negative do nó tạo ra; (2) phần lớn quyết định thiết kế phỏng vấn vốn đã dựa trên lập luận trừu tượng chứ không phải thí nghiệm kiểu thử nghiệm lâm sàng
  • Gian lận bằng AI (ví dụ trong lúc phỏng vấn): nếu đã cấm rõ ràng thì việc dùng công cụ AI là lý do loại ngay lập tức
    • Trích Warren Buffett: khi tuyển dụng, hãy nhìn vào integrity, intelligence và energy; nếu không có integrity thì hai yếu tố còn lại sẽ phá hỏng con người đó. Nếu buộc phải tuyển người thiếu integrity thì thà người đó ngu và lười còn hơn
  • Có nên dùng AI để đánh giá ứng viên không: Không. (1) Về mặt đạo đức là sai — bạn đang tuyển một con người làm lao động tri thức, không thể để máy đánh giá mọi thứ; (2) đánh giá bằng AI vốn không ổn định và dễ hallucination, nên cuối cùng bạn vẫn phải review lại đánh giá của AI

Khuyến nghị cụ thể cho công ty

  • Không cho phép dùng AI trong phần lớn các buổi phỏng vấn. Đừng nhấn quá mạnh vào một công cụ cụ thể, hãy tập trung vào năng lực nền tảng
  • Đầu tư vào Live exercise. Chúng không nhất thiết phải giả tạo, nhàm chán, tín hiệu thấp hay quá ngắn. Hãy xem lại phỏng vấn data structure & algorithm — chúng vẫn là dạng thử thách trí tuệ nhất. Thiết kế bài tập đòi hỏi nỗ lực thực sự từ con người, và duy trì nhiều câu hỏi để ngăn việc luyện quá mức cho một câu duy nhất
  • Trộn nhiều kiểu phỏng vấn để thu được tín hiệu rộng với chi phí hiệu quả
  • Điều chỉnh take-home. Hoặc cấm AI rõ ràng, hoặc cho phép nhưng đừng lãng phí thời gian vào việc review đầu ra của AI. Take-home bắt buộc nên dẫn tới một live exercise dựa trên chính bài đó, nơi ứng viên phải trình bày công việc, cách tiếp cận trade-off, thay đổi yêu cầu, khả năng mở rộng...
  • Ít nhất có một buổi phỏng vấn đánh giá năng lực review. Chi phí tạo thấp, cho tín hiệu thú vị và ít gây gánh nặng cho ứng viên hơn. Ví dụ: kế hoạch AI, postmortem, codebase sẵn có (Bug squash), tài liệu yêu cầu sản phẩm, phân tích trade-off, review kiến trúc hệ thống
  • Cân nhắc mời ứng viên onsite. Đây là cách đơn giản nhất để ngăn gian lận, đồng thời cũng làm việc lộ câu hỏi khó hơn phần nào. Tuy nhiên chỉ phù hợp với các công ty RTO (quay lại văn phòng)
  • Cung cấp hướng dẫn chuẩn bị phỏng vấn rõ ràng để tạo môi trường công bằng

3 bình luận

 

Với tôi thì có vẻ hợp để cùng làm việc thử 1 tuần.

 
linusjeh 3 giờ trước

Bài đó chắc cũng do AI viết nhỉhaha

 
jjpark78 3 giờ trước

Dù sao thì khi làm việc cũng sẽ dùng AI, nên tôi thấy việc loại trừ nó ra có ý nghĩa gì không nhỉ. Thà bỏ phỏng vấn từ xa, chỉ tổ chức trực tiếp tại chỗ, rồi đánh giá bằng các câu hỏi được thiết kế tốt cùng việc quan sát xem tại hiện trường họ dùng AI và tư duy như thế nào, như vậy có phải phù hợp hơn với thời đại AI không?

Ngay cả với cùng một bài toán, chỉ cần nhìn cách họ viết prompt cũng có thể biết được rất nhiều điều về con người đó.