15 điểm bởi GN⁺ 2024-03-13 | 2 bình luận | Chia sẻ qua WhatsApp
  • Devin là kỹ sư phần mềm AI tự chủ hoàn toàn đầu tiên trên thế giới
  • Devin có thể làm việc cùng kỹ sư con người hoặc hoạt động độc lập, giúp các kỹ sư tập trung vào những vấn đề thú vị hơn
  • Devin có thể lập kế hoạch và thực thi các tác vụ kỹ thuật phức tạp, đồng thời sử dụng các công cụ dành cho lập trình viên như shell, trình soạn thảo mã và trình duyệt

Năng lực của Devin

  • Devin đã đạt được bước tiến về suy luận và lập kế hoạch dài hạn, có thể thực hiện các tác vụ kỹ thuật phức tạp qua hàng nghìn quyết định.
  • Có thể cộng tác với người dùng, báo cáo tiến độ theo thời gian thực, nhận phản hồi và cùng đưa ra các lựa chọn thiết kế.
  • Devin có thể học các công nghệ mới, xây dựng và triển khai ứng dụng, tìm và sửa lỗi trong codebase, cũng như huấn luyện và tinh chỉnh các mô hình AI của riêng mình.

Hiệu năng của Devin

  • Trên benchmark lập trình SWE-bench, Devin đạt tỷ lệ thành công 13.86% trong việc giải quyết các issue GitHub thực tế, vượt xa kỷ lục trước đó là 1.96%.
  • Devin được đánh giá trên một tập con ngẫu nhiên 25% của bộ dữ liệu; trong khi các mô hình khác được hỗ trợ bằng cách chỉ ra chính xác tệp cần chỉnh sửa, Devin thực hiện mà không cần trợ giúp.

Giới thiệu về Cognition

  • Cognition là một phòng nghiên cứu AI ứng dụng tập trung vào suy luận.
  • Công ty hướng tới việc phát triển các đồng nghiệp AI, mang lại năng lực vượt xa các công cụ AI hiện nay.
  • Cognition đã nhận khoản đầu tư Series A trị giá 21 triệu USD do Founders Fund dẫn dắt, cùng sự hậu thuẫn từ các lãnh đạo trong ngành.
Quảng cáo

Thuê Devin

  • Devin hiện đang ở giai đoạn truy cập sớm, và nếu muốn sử dụng Devin cho các tác vụ kỹ thuật, bạn có thể liên hệ với Cognition.

Hãy tham gia cùng chúng tôi

  • Đội ngũ của Cognition có quy mô nhỏ; nhóm sáng lập sở hữu 10 huy chương vàng IOI và bao gồm các lãnh đạo, nhà xây dựng từng làm việc tại Cursor, Scale AI, Lunchclub, Modal, Google DeepMind, Waymo, Nuro và nhiều nơi khác.
  • Việc xây dựng Devin mới chỉ là bước đầu tiên, và những thử thách khó khăn nhất vẫn còn ở phía trước.

Ý kiến của GN⁺

  • Kỹ sư phần mềm AI mang tên Devin tượng trưng cho tương lai của phát triển phần mềm, và có tiềm năng cải thiện đáng kể hiệu suất công việc kỹ thuật thông qua sự kết hợp giữa tự động hóa và AI.
  • Việc AI cho thấy tỷ lệ thành công cao như vậy trong giải quyết các vấn đề kỹ thuật thực tế là một thành tựu đáng chú ý, cho thấy sự phát triển của công nghệ AI có thể được tích hợp tốt đến mức nào vào môi trường làm việc thực tế.
  • Tuy nhiên, cần cân nhắc các tác động đạo đức và xã hội liên quan đến việc AI thay thế công việc của con người. Việc áp dụng AI đòi hỏi cách tiếp cận thận trọng đối với ảnh hưởng đến việc làm và sự thay đổi vai trò của con người.
  • Một công cụ phát triển dựa trên AI khác cung cấp chức năng tương tự là GitHub Copilot, vốn được sử dụng rộng rãi để hỗ trợ lập trình viên viết mã.
  • Khi áp dụng công nghệ như Devin, cần xem xét các vấn đề về bảo mật dữ liệu, quyền riêng tư, cũng như tính minh bạch và trách nhiệm đối với các quyết định của AI. Điều quan trọng là phải hiểu và quản lý tác động của các quyết định AI đối với doanh nghiệp và người dùng.

2 bình luận

 
yangeok 2024-03-13

Muốn được dùng thử Devin miễn phí quá.

 
GN⁺ 2024-03-13
Ý kiến trên Hacker News
  • Với tư cách là một nhà phát triển kiêm phụ trách sản phẩm, tôi đã thử dùng AI để lập trình nhưng thất bại vì độ dài ngữ cảnh, đầu ra kém chất lượng của mô hình, thiếu kiến trúc, v.v. Tôi chưa thể dùng AI cho những công việc hữu ích vượt xa mức hỗ trợ Leetcode. Ngay cả việc trích xuất selector từ một trang HTML đơn giản, tôi cũng đã thử với nhiều mô hình AI nhưng không thành công. Tôi từng rất kỳ vọng vào tiến bộ công nghệ, nhưng giờ chỉ muốn một sản phẩm thực sự hoạt động đúng.
  • Con người tìm kiếm những công việc mang lại ý nghĩa và sự thỏa mãn. Với tiến bộ công nghệ, những người thợ lành nghề lại là những người đầu tiên trở nên vô dụng. Xã hội gửi đi thông điệp rằng nếu không tạo ra giá trị thì sẽ không được công nhận phẩm giá. Khi giao nghệ thuật và kỹ thuật cho AI, ngay cả những người không hiểu chúng cũng có thể sử dụng với chi phí rẻ. Điều này đặt ra câu hỏi: tiến bộ công nghệ đang mang lại lợi ích cho ai, và vị trí của con người trong tương lai sẽ ở đâu?
  • Scott Wu là một trong số rất ít người đạt điểm tuyệt đối kể từ năm 1989, tôi đã gặp anh ấy tại một kỳ Olympic lập trình thi đấu. Thật vui khi thấy anh ấy đang phát huy tài năng đáng kinh ngạc của mình.
  • Tôi không mấy ấn tượng với một trang web cho phép tải lên tệp có kích thước bất kỳ mà không cần xác thực. Tôi đã tải một tệp 500MB lên máy chủ.
  • Nếu AI thật sự xuất sắc, nó nên được dùng cho mục đích tốt. Là một kỹ sư phần mềm cấp cao, việc viết mã không chiếm 90% công việc; phần lớn là chia nhỏ các yêu cầu phức tạp thành các tác vụ rõ ràng, tìm ra những lỗ hổng trong yêu cầu, viết lượng mã tối thiểu và hiểu codebase. Thứ cần không phải là một "kỹ sư phần mềm AI" mà là một "đầu mối quan hệ con người bằng AI".
  • Bản demo rất ấn tượng nhưng phạm vi bị giới hạn, nên tôi nghi ngờ nó sẽ hoạt động tốt đến đâu trong tình huống thực tế. Liệu nó có thể làm kiến trúc phần mềm hay không, liệu lời giải chỉ đơn thuần là tái tạo lại, và sẽ có bao nhiêu lần việc lời giải chỉ đúng 90% là không đủ.
  • Với tư cách là người có kinh nghiệm phát triển backend, tôi thấy LLM mang lại mức tăng năng suất đáng kinh ngạc trong việc sinh mã khi bạn hiểu rõ thư viện/framework/ngôn ngữ nền tảng. Tuy nhiên, bạn vẫn phải biết mọi thứ; AI chưa thể tự động làm hết tất cả.
  • Bản demo rất ấn tượng và xin chúc mừng việc ra mắt, nhưng tôi tự hỏi những lỗi mà Devin gặp phải có thể được xử lý bằng các chỉnh sửa đơn giản hay không. Ví dụ, bọc mã bằng try-catch để xử lý KeyError có thể giúp chương trình chạy được, nhưng không phải lúc nào cũng là giải pháp lý tưởng.
  • LLM vẫn đang ở giai đoạn "gieo vần". Liệu nó có thể chuyển sang "lý luận" hay không vẫn chưa rõ, nhưng lập trình đòi hỏi lý luận đối với các vấn đề phức tạp. Xét đến tốc độ thay đổi hiện nay, tôi không loại trừ bất kỳ khả năng nào.
  • Với tư cách là người làm trong lĩnh vực này, việc sử dụng AI trong lập trình hiện giờ chỉ ở mức công cụ hỗ trợ và tự động hoàn thành nâng cao. Các công ty như Pythagora cũng cho rằng sự can thiệp của con người là quan trọng, và có thể xem LLM như một lập trình viên junior đầy nhiệt huyết, hành động nhanh theo chỉ dẫn. Với prompt nội bộ và một chút định hướng từ con người, nó có thể tạo ra kết quả đáng kinh ngạc.