25 điểm bởi xguru 2025-10-18 | 2 bình luận | Chia sẻ qua WhatsApp
  • Ứng dụng macOS native được xây dựng bằng SwiftUI, ghi lại màn hình ở 1 FPSphân tích bằng AI mỗi 15 phút để tự động tạo dòng thời gian và bản tóm tắt
    • Có thể phát timelapse để xem lại trực quan diễn biến của cả ngày
  • Hướng đến nhẹ và ít tải hệ thống với mục tiêu khoảng 25MB kích thước ứng dụng, ~100MB RAM, <1% CPU, đồng thời cung cấp trải nghiệm UX thiên về xử lý cục bộ, không có thành phần phân tán
  • Có thể chọn AI xử lý bằng Gemini (nhập khóa của riêng bạn) hoặc mô hình cục bộ (Ollama·LM Studio)
  • Dữ liệu đã ghi sẽ được tự động dọn dẹp sau 3 ngày lưu trữ để tối ưu quản lý tài nguyên và bảo vệ quyền riêng tư
  • Sắp ra mắt
    • Bảng điều khiển tùy biến gần như vô hạn: đặt câu hỏi bất kỳ, biến kết quả thành các ô và tiếp tục theo dõi
    • Nhật ký hằng ngày: ghi lại nhìn lại các điểm nổi bật, phản ánh prompt hướng dẫn, cùng ảnh chụp màn hình và ghi chú bên cạnh dòng thời gian
  • Cách hoạt động
    • Capture: ghi màn hình ở 1 FPS theo từng đoạn 15 giây
    • Analyze: mỗi 15 phút gửi các đoạn gần đây đến nhà cung cấp AI đã chọn để phân tích
    • Generate: tạo thẻ tóm tắt hoạt động để hình thành dòng thời gian theo thứ tự thời gian
    • Display: hiển thị diễn biến trong ngày bằng giao diện dòng thời gian trực quan
    • Cleanup: tự động xóa bản ghi sau 3 ngày để quản lý dung lượng lưu trữ

2 bình luận

 
oh3vci 2025-10-21

Tôi đang dùng thử cục bộ, nhưng có vẻ nó không phân tích tiếng Hàn tốt lắm. Nhìn phần được ghi lại thì có vẻ chỉ những phần được viết bằng tiếng Anh mới được ghi nhận.

 
GN⁺ 2025-10-18
Ý kiến trên Hacker News
  • Có vẻ nếu bán sản phẩm này cho luật sư hoặc các nghề chuyên môn tính phí theo giờ thì sẽ nhận được phản hồi tốt, vì nó có thể khôi phục phần công việc bị bỏ sót trong ngày và ngăn thất thoát khi tính phí, nên họ có khả năng sẵn sàng trả mức giá cao

    • Mặt khác, tôi cũng nghĩ việc dùng cái này có thể làm lộ ra việc các luật sư thực sự làm ít đến mức nào so với số giờ họ tính phí
    • Tôi cũng luôn muốn có tính năng này với tư cách là nhà thầu phần mềm, và hiện đang làm một bản prototype đơn giản trên Linux
    • Ở Anh, người ta không chỉ tính theo giờ mà còn tính theo từng 6 phút, đây đúng là một chi tiết cho thấy văn hóa nghề nghiệp
  • Sản phẩm tốt đấy! Hiện tại tôi đang dùng ActivityWatch trên PC để theo dõi công việc
    Đây là những điều tôi mong ở loại phần mềm này

    • Tính năng tìm ra điểm khởi đầu của sự xao nhãng: ví dụ, khi mở cửa sổ email để kiểm tra một email cụ thể, tôi lại xem cả những email không liên quan rồi bị cuốn vào việc khác trong khoảng 5~15 phút, nếu có thông tin này thì có thể dẫn đến hành động thực tế để giảm xao nhãng; ví dụ, sau khi cài plugin ẩn video đề xuất trên YouTube thì tôi thực sự bớt mất tập trung hơn, và tôi cũng đóng hết các cửa sổ không dùng để khỏi bị chúng kéo sự chú ý sang việc khác
    • Nắm được các công việc lặp lại và chu kỳ của chúng: ví dụ, nếu mỗi tuần một lần tôi đều phải viết hóa đơn thủ công gần như giống hệt nhau cho một trường hợp ngoại lệ cụ thể, thì tôi có thể cân nhắc liệu có thể tự động hóa việc đó không
    • Ghi lại trạng thái cảm xúc trước, trong và sau công việc: đây là câu hỏi rộng nhất và khó định nghĩa nhất, nhưng tôi nghĩ nó có tiềm năng lớn trong việc cải thiện thói quen trì hoãn và giúp bắt đầu công việc dễ hơn
    • Sẽ thật tuyệt nếu có tính năng giúp mỗi người hiểu được kiểu xao nhãng của chính mình, tôi cũng đang dùng cùng loại tiện ích mở rộng YouTube đó
  • Tôi lập tức nghĩ rằng loại sản phẩm này cũng sẽ cực kỳ hữu ích cho người mắc ADHD
    Có thể xác định điều gì gây xao nhãng và những mẫu lặp lại nào đang tồn tại (ví dụ: cứ mỗi lần git commit là lại vào Hacker News rồi mất 15 phút)
    Việc có thể xem lại nhật ký được tự động ghi lại là cực kỳ giá trị; trước đây tôi từng rất thành công khi dùng TimeRescue để đo thời gian khách hàng một cách chính xác
    Nhưng những công cụ đòi hỏi nhập tay thì lúc nào cũng làm gián đoạn sự tập trung hoặc tôi quên dùng, nên không bao giờ gắn bó được lâu
    Nếu tiến thêm một bước nữa, sẽ rất hay nếu có tính năng báo cho tôi biết theo thời gian thực (có tính đến độ trễ xử lý) rằng tôi đang làm việc ngoài lề; cũng có thể hình dung cách để người dùng tự định nghĩa thế nào là lạc hướng, hoặc hệ thống dần thông minh hơn nhờ phản hồi
    Tôi thấy sản phẩm này rất hấp dẫn; tôi vốn thích ý tưởng như Windows Recall, nên rất vui khi thấy một sản phẩm như thế nhưng tập trung vào quyền riêng tư

  • Tôi rất thích ý tưởng sản phẩm này, nhưng cũng lo ngại khi một nhà phát triển có GitHub gần như trống rỗng lại đột ngột phát hành một ứng dụng có thể rất dễ biến thành spyware, đặc biệt là lo về bảo mật như mật khẩu

    • Nếu mã nguồn đã có trên GitHub rồi thì thay vì bận tâm đến hồ sơ cá nhân, có thể tự kiểm tra code để xóa bớt lo ngại một cách khá dễ dàng
  • Tôi không thoải mái khi gửi dữ liệu nhạy cảm như thông tin ngân hàng, mật khẩu v.v. sang Gemini
    Tôi tò mò không biết hiệu năng sẽ khác đến mức nào khi dùng mô hình cục bộ

    • Nếu chấm điểm dựa trên trải nghiệm và đánh giá của tôi thì Gemini 2.5 pro ở mức A-, còn qwen2.5vl khoảng B-/C+, kết quả không phải lúc nào cũng ổn định nên khó đảm bảo chất lượng
      Theo các bài báo gần đây, kỹ thuật distillation có thể giúp mô hình cục bộ đạt hiệu năng SOTA, nên tôi định tự thử nghiệm theo hướng đó
    • Nếu dùng Gemini thường chứ không phải bản enterprise, thì mọi thông tin nhạy cảm trong prompt và câu trả lời đều bị lộ 100% cho Google
    • Google đã có email, trình duyệt, hệ điều hành điện thoại của tôi, thậm chí cả một số mật khẩu của tôi rồi, nên về cơ bản tôi mặc định là toàn bộ dữ liệu mật của mình đã bị lấy mất
    • Bình thường mật khẩu không hiển thị trên màn hình, mà đi thẳng từ trình quản lý mật khẩu vào ô nhập đã được che, nên lẽ ra chúng không nên xuất hiện trên màn hình
  • Ý tưởng này tương tự screenpipe, còn screenpipe thì cho phép tùy biến nhiều hơn
    github.com/mediar-ai/screenpipe

    • Tôi là nhà sáng lập screenpipe, sẽ rất vui nếu có thêm nhiều sản phẩm như thế này; lý tưởng nhất là OSS, chạy cục bộ, không vendor lock-in và thân thiện với API/MCP
      Điểm đáng tiếc là hiện tại chỉ hỗ trợ macOS, còn dạo này tôi dùng Windows là chính
  • Dự án rất hay! Tôi đã có trải nghiệm tương tự với Rewind và từng có lo ngại liên quan đến quyền riêng tư
    Để tham khảo thì Rewind xử lý OCR cục bộ rồi chỉ gửi dữ liệu văn bản đi
    Nếu tập trung vào macOS, bạn có thể tận dụng VNRecognizeTextRequest để bỏ qua quy trình OCR phức tạp
    Đặc biệt nếu dùng AI trên đám mây, có thể dùng một mô hình nhẹ như BERT để phát hiện và che dữ liệu nhạy cảm

    • Tôi chưa biết đến VNRecognizeTextRequest, nghe thật sự rất thú vị, cảm ơn vì đã giới thiệu
  • Tôi tò mò không biết trong Zoom hay các cuộc họp video, nếu chụp capture thay vì record, thì về mặt pháp lý có cần phải thông báo là đang “ghi hình” hay không
    Tôi cũng muốn biết liệu có phụ đề trực tiếp hoặc tính năng chép lời thì yêu cầu pháp lý có khác đi không

    • Ở bang của tôi, việc chụp lại màn hình Zoom mà không thông báo rằng mình đang ghi lại nhìn chung là bất hợp pháp; tôi không chắc hoàn toàn, nhưng mấu chốt là có đang lưu video 1fps hay không chứ không phải có AI tóm tắt hay không
  • Sản phẩm này thực sự rất tốt, gánh nặng tinh thần nhẹ hơn nhiều so với việc tự dùng time tracker truyền thống
    Tôi cũng thích việc có tùy chọn cục bộ và tùy chọn BYO key (tự cung cấp khóa) nên có thêm lựa chọn về quyền riêng tư
    Cảm giác như dạng sản phẩm này lẽ ra phải xuất hiện từ sớm hơn, và lần này họ thật sự làm rất tốt

  • Tôi cũng chỉ định dùng với mô hình cục bộ, sản phẩm rất tuyệt

    • Bạn bè tôi và tôi chia đều giữa thích local và cloud; thật hay khi mỗi người có thể chọn chất lượng hoặc quyền riêng tư tùy theo ưu tiên của mình