3 điểm bởi GN⁺ 2024-02-07 | 1 bình luận | Chia sẻ qua WhatsApp
  • Hỏi mọi người đang tạo ra những gì bằng cách tận dụng LLM
  • Người đặt câu hỏi
    • đang phát triển một tiện ích mở rộng Chrome: triển khai tính năng đọc phụ đề để bỏ qua các đoạn tài trợ trong video YouTube
    • thử nghiệm giải thích chuỗi gọi hàm trong nhiều ngôn ngữ lập trình khác nhau: dùng MakeFile, Python và Bash để thử tạo phần giải thích thông qua LLM
    • đang vận hành một bot Telegram: thiết lập prompt để thực hiện các lệnh cụ thể, chẳng hạn như hỗ trợ về thuế

1 bình luận

 
GN⁺ 2024-02-07
Ý kiến Hacker News
  • Một người dùng không thích bán hàng đã thiết lập một số điện thoại để có thể gọi cho AI nhằm luyện tập gọi điện chào hàng theo cách giống ngoài đời thực.

    • AI này mô phỏng các cuộc gọi bán hàng.
    • Người dùng nhận thấy việc gọi rảnh tay với AI rất hữu ích nên cũng dùng cho các mục đích chung.
    • Hiện tại dịch vụ đang ngoại tuyến, nhưng mã nguồn kèm thông tin về stack và triển khai được cung cấp trên GitHub.
    • Tất cả chạy trên một Raspberry Pi giá $35.
  • Một người dùng khác đã nhờ hỗ trợ để “viết” một cuốn sách nấu ăn dựa trên các công thức của bà mình.

    • Nhân dịp sinh nhật lần thứ 100 của bà, họ phục dựng hơn 250 trang công thức mà cha của người này đã sưu tầm trong nhiều năm.
    • Một số được đánh máy, một số khác do bà viết tay.
    • Người cha quét các công thức đã đánh máy và “đọc lại” các công thức viết tay.
    • Họ dùng Google OCR để xử lý các công thức đã quét, rồi dùng GPT-4 để chuyển những công thức không có định dạng thành Markdown được trình bày gọn gàng.
    • Họ đã sửa thành công lỗi chính tả và lỗi từ Google OCR.
    • Sau đó, họ dán toàn bộ phần văn bản đã được sắp xếp gọn gàng vào Google Docs và thêm hình ảnh.
    • Họ dùng tính năng tạo ảnh của OpenAI để tạo hình cho hơn 250 công thức.
    • Một số hình vẫn phải tuyển chọn thủ công, đặc biệt là với món ăn Mexico.
    • Kết quả là cuốn sách trông rất đẹp, và khi bản sao kỹ thuật số được chia sẻ trong gia đình, mọi người đều rất ngạc nhiên.
  • Một người dùng đã tạo một “stack” trên MacOS bằng cách dùng Apple Shortcuts để thực hiện các lệnh gọi API HTTP POST tới OpenAI và hoàn thành công việc.

    • Mỗi tác vụ được kích hoạt bằng phím tắt hoặc qua nhập Spotlight bằng Alfred.
    • Các chức năng gồm tóm tắt URL YouTube, chỉnh ngữ pháp và văn phong cho văn bản, và dùng OpenAI Whisper thay cho nhập liệu bằng giọng nói.
    • Mỗi khi phát hiện một tác vụ cần dùng LLM lặp đi lặp lại, người này sẽ biến nó thành một Apple Shortcut để tích hợp vào quy trình làm việc như một tính năng của MacOS.
  • Một người dùng khác đã thực hiện nhiều dự án phần cứng + LLM.

    • Tạo một Pokédex có thể nhận diện Pokémon ngoài đời thực.
    • Lọc ra những bình luận hay trong văn phòng rồi in chúng ra.
    • Xây dựng một trợ lý chat đa dụng trên hệ thống intercom cũ.
    • Những dự án này không đặc biệt hữu ích, nhưng tất cả đều vui.
  • Một người dùng đã tạo một chatbot AI dạng sơ yếu lý lịch tương tác để người khác có thể hỏi về kinh nghiệm và kỹ năng của mình.

    • Backend dùng Python FastAPI, lưu sơ yếu lý lịch và các cặp hỏi-đáp bằng ChromaDB, đồng thời dùng OpenAI và Airtable để ghi lại request và response.
    • UI dùng Sveltekit.
    • Hiện người này đang làm các công cụ khác và dự định dùng LangSmith thay cho Airtable.
    • Họ cũng đang viết bài trên Substack, như một phần trong nỗ lực #buildinpublic nhằm xây dựng thương hiệu cá nhân.
    • Người này đã thất nghiệp từ tháng 9 và hy vọng việc tập trung vào các dự án trên sẽ giúp họ tìm được việc làm hoặc hợp đồng trong bối cảnh thị trường khó khăn.
  • Một người dùng khác muốn tự động hóa quá trình tạo các tour tự hướng dẫn quanh thành phố, thị trấn và các cuộc săn kho báu trực tuyến.

    • Họ muốn có cả một marketplace nơi bất kỳ ai cũng có thể tạo và bán tour.
    • Quá trình tạo tour hiện rất phiền phức.
    • Họ cung cấp thông tin địa phương cho GPT-4 để mô hình viết câu hỏi và các đáp án trắc nghiệm.
    • Frontend dùng React Typescript, backend dùng Net Core Web API on Linux, MySQL, EF Core, cùng tích hợp với GPT4 và Stripe.
    • Dịch vụ được host tại treasuretours.org.
    • Do chi phí, hiện chỉ superuser mới có thể truy cập công cụ AI, nhưng vẫn có thể thử một số cuộc săn kho báu dựng sẵn được AI tạo một phần.
  • Một người dùng bắt đầu bằng việc xây dựng sản phẩm, nhưng cuối cùng lại tạo ra một nền tảng phát triển cho các sản phẩm dựa trên LLM.

    • Ban đầu họ làm một công cụ phân tích cổ phiếu. Người dùng có thể viết bằng ngôn ngữ tự nhiên về công ty và khoảng thời gian muốn so sánh, rồi cổ phiếu sẽ được hiển thị trên biểu đồ.
    • Trong quá trình phát triển, họ nhận ra những thách thức đặc thù và quyết định không ra mắt sản phẩm, mà chuyển sang xây dựng nền tảng phát triển.
    • Họ dùng “LLM structured tasks” để thực hiện tác vụ trên đầu vào của người dùng và xuất ra JSON để backend có thể xử lý.
    • Prompt rất mong manh và dễ hỏng chỉ với những thay đổi nhỏ trong prompt hoặc cấu hình mô hình.
    • Để giải quyết điều này, họ phát triển một nền tảng cho phép kiểm thử các phiên bản prompt và cấu hình mô hình trên toàn bộ tập đầu vào, nhằm tránh phát sinh lỗi trong quá trình phát triển.
    • Có thể xem tại promptotype.io.
  • Một nhóm đang xây dựng nhiều công cụ dữ liệu khác nhau dựa trên LLM, và đang trong quá trình đổi thương hiệu cũng như ra mắt sản phẩm chính.

    • Họ phát triển nhiều công cụ và sản phẩm như sketch, datadm, julyp.
    • Họ dùng nhiều stack và công cụ khác nhau; từng tự xây công cụ riêng nhưng gần đây thiên về tự viết logic và áp dụng trực tiếp vào sản phẩm.
    • Sản phẩm chính có code trong một ứng dụng next và được triển khai trên vercel.
  • Một người dùng đã xây nhiều thứ, bao gồm cả bot để sinh mã.

    • Hiện tại họ đang làm một hệ thống phỏng vấn thử bằng AI. Họ ghét việc luyện LeetCode và cảm thấy mình học tốt hơn thông qua tương tác.
    • comp.lol cung cấp phỏng vấn lập trình thử do AI dẫn dắt. Họ đang tìm alpha tester, và vì mọi thứ chạy trên free tier nên thời gian tải có thể chậm.
  • Một người dùng khác đã tạo một trợ lý tuyển dụng AI có thể thực hiện sàng lọc ban đầu, thu thập thông tin ứng viên, trả lời câu hỏi về vị trí và đặt nhiều câu hỏi phỏng vấn hành vi.

    • Họ xây dựng nó chỉ trong một ngày bằng Vercel và OpenAI.
    • Phần khó nhất là thiết lập đăng nhập Google.
    • Hàng chục ứng viên đã sử dụng, giúp tiết kiệm rất nhiều thời gian và hỗ trợ ưu tiên các cuộc trò chuyện.
    • Hôm qua họ đã viết một bài ngắn về nó.