- Merlin Bird ID là công cụ chuyên về nhận diện và tra cứu chim
- Giúp người dùng nhanh chóng xác định loài thông qua ảnh hoặc âm thanh của chim
- Cung cấp trải nghiệm thân thiện, dễ dùng cho cả người dùng phổ thông lẫn chuyên gia
- Tính năng nhận diện chim dựa trên AI giúp xác minh thông tin chính xác trong nhiều môi trường khác nhau
- Có tiềm năng đóng góp tích cực cho bảo tồn chim và nghiên cứu khoa học công dân
Tổng quan về Merlin Bird ID
- Merlin Bird ID là nền tảng nhận diện chim và tra cứu loài được sử dụng trên toàn cầu
- Người dùng có thể tải lên ảnh hoặc âm thanh của chim từ điện thoại hoặc website để nhanh chóng xác định loài chim tương ứng
- Do All About Birds cung cấp, nền tảng được thiết kế với mục tiêu mang lại trải nghiệm trực quan, dễ dùng cho cả người mới bắt đầu và chuyên gia
- Sử dụng thuật toán và công nghệ máy học để cung cấp khả năng tiếp cận thông tin chính xác về chim trong nhiều khu vực và môi trường khác nhau
- Merlin Bird ID có thể đóng góp lớn cho khoa học công dân, bảo vệ môi trường và các hoạt động nghiên cứu về chim
Hướng dẫn về an toàn trang web hoặc kết nối
- Để sử dụng trang web này, cần cho phép JavaScript và cookie
- Để bảo đảm kết nối an toàn, hệ thống thực hiện quy trình rà soát bảo mật và xác thực tự động
- Những quy trình bảo mật này nhằm bảo vệ quyền riêng tư và dữ liệu của người dùng
Tóm tắt
- Merlin Bird ID là nền tảng toàn cầu mạnh về nhận diện chim bằng AI và tra cứu loài
- Nhờ cách sử dụng đơn giản và thuật toán được cải tiến, nền tảng hữu ích cho quan sát tự nhiên, giáo dục và hoạt động khoa học
- Cung cấp khả năng nhận diện có độ chính xác cao trong nhiều môi trường và quốc gia
1 bình luận
Ý kiến trên Hacker News
Một tháng gần đây thói quen buổi sáng của tôi đã thay đổi hoàn toàn, tôi dành thời gian ở sân sau thay vì ở trong nhà
Đổ và vệ sinh máng ăn cho chim, để thêm đậu phộng cho sóc, rồi ngồi trên deck với cà phê, bữa sáng và ứng dụng Merlin ID đã thành một nếp sinh hoạt
Tôi không học nổi ngôn ngữ của con người mới, nhưng nhờ dùng ứng dụng này đều đặn, giờ tôi không chỉ phân biệt được các loài chim mà còn nhận ra cả tiếng kêu hay giọng hót đặc trưng của từng cá thể
Điều duy nhất tôi mong là có tính năng ghi lại từng cá thể chim và lưu kèm bản ghi âm cùng ảnh của con đó
Xin gửi tràng pháo tay tới những người phát triển ứng dụng này, đây là ứng dụng tuyệt nhất tôi dùng trong một thời gian rất dài
Đây đúng là một ứng dụng rất tốt, nhưng với cá nhân tôi thì điểm trừ là UX để thêm chim vào Life List quá tệ
Khi bạn nhận dạng bằng âm thanh hay ảnh, nó hỏi bạn gặp con chim đó khi nào và ở đâu, nhưng giá trị mặc định thực sự rất dở — dù biết vị trí và thời gian hiện tại, nó vẫn có lúc tự lôi ra một vị trí hay thời điểm ngẫu nhiên từ vài tháng trước
Nó cũng phớt lờ việc ngay trước đó tôi vừa nhập bao nhiêu con ở vị trí hiện tại
Một ứng dụng tuyệt vời, và nó giúp rất nhiều người đến gần thiên nhiên hơn
Thỉnh thoảng có hiện lời nhắc quyên góp cho tổ chức vận hành, nhưng đó là lời kêu gọi rõ ràng, trực tiếp, không hề có trò tiếp thị lắt léo hay dark pattern kỳ quặc nào
Đặc biệt, tính năng nhận dạng bằng âm thanh là thứ ai cũng có thể dùng, nhưng lại mở ra một trải nghiệm mà bình thường gần như không thể có được (phân biệt loài chỉ bằng tai), đồng thời hướng bạn tập trung hơn vào âm thanh trong tự nhiên
Cá nhân tôi thấy hơi tiếc là Merlin, và đặc biệt là eBird, có xu hướng đẩy việc ngắm chim theo kiểu cạnh tranh điểm số — nếu xét đến sự suy giảm số lượng cá thể chim, thì việc khuyến khích đi khắp thế giới để nhìn được nhiều loài nhất có thể có lẽ là vấn đề
Nhưng đó chỉ là một phàn nàn rất nhỏ, và Merlin vẫn là một trong số ít ứng dụng tôi có thể tự tin giới thiệu cho bất kỳ ai
Tôi mong những người quan tâm đến hacking sẽ chủ động ủng hộ để các ứng dụng như thế này không bị thương mại hóa như AllTrails hay Couchsurfing
Mong là các dev hay PM nhìn thấy bài này và ghi nhận cả phản hồi
Đặc biệt, sound ID hoạt động tốt hơn kỳ vọng rất nhiều ngay cả ngoài thực địa ở rừng hay rừng rậm Colombia, nơi hoàn toàn không có mạng
Tuy vậy, các phần khác của ứng dụng còn khá yếu
Nút bấm hay bị đơ, các màn hình thiếu nhất quán, kết quả bị biến mất và có nhiều vấn đề khác
Sẽ rất hay nếu có tích hợp với iNaturalist, và khi mở lại bản ghi cũ thì những con chim từng được nhận dạng lúc đó lại hiện là "No matches"
Khi đi theo nhóm ngoài thiên nhiên, nhiều lần đã nhận dạng thành công rồi nhưng đến lúc muốn cho ai đó xem thì kết quả đã biến mất
Chỉ cần thêm một nút phản hồi đơn giản thôi cũng có thể cải thiện quy trình rất nhiều
Xin gửi lời cảm ơn sâu sắc tới tất cả những người đã phát triển và đóng góp cho ứng dụng này
Nhưng trên Android thì cứ đúng 255 giây sau khi bắt đầu là nó luôn bị crash (tôi còn tự bấm giờ)
Không biết có cách nào để gửi bug report không
Tôi phải cài lại mới dùng tiếp được
Trên iOS, phần thêm thông tin khu vực hiện đang hỏng hoàn toàn
Cả nhóm đã bỏ ra rất nhiều công sức để làm cho mô hình machine learning và phần đánh giá thực sự hoạt động tốt
Sound ID là một ví dụ rất hay cho thấy thay vì kiểu tiếp cận "ném dữ liệu vào rồi huấn luyện qua loa" thường thấy, việc nghiên cứu tỉ mỉ cùng chuyên gia lĩnh vực có thể cho ra kết quả đáng tin cậy hơn nhiều
Có lần bên ngoài nhà tôi, chim ở nhiều khoảng cách khác nhau cùng lúc hót ầm ĩ, mà ứng dụng này chỉ trong 30 giây đã nhận đúng 6 loài
Theo đánh giá của tôi thì cả 6 kết quả đó đều khá hợp lý
Những con hay ghé khu vườn của tôi thì tôi đều biết là loài nào rồi, nên giờ tôi muốn phân biệt xem con nào quay lại, cặp đôi có thay đổi không, hay từ xa hơn một chút cũng nhận ra kiểu "à, lại là Kevin"
Với những loài có nhiều cá thể trông na ná nhau như blackbird thì có thể khó, nhưng với vài loài thì tôi nghĩ AI hoàn toàn có thể làm được
Tôi có vài ý tưởng về việc nhận dạng chim bằng tiếng hót, và nếu công nghệ nhận dạng của Merlin được công khai dưới dạng API cho bên ngoài thì sẽ cực kỳ hữu ích
Lần nào tôi cũng mong ứng dụng nhận ra gà trống, nhưng lần nào nó cũng không hiện
Nhờ bạn chuyển lời tới nhóm nghiên cứu rằng "gà trống cũng là chim! Và còn là chiếc đồng hồ báo thức tuyệt nhất thế giới, xin hãy đưa nó vào danh sách nhận dạng"
Có lẽ đây là giới hạn kỹ thuật khó tránh khỏi
Vài ngày trước tôi vô tình bấm vào tiếng hót của cardinal trong danh sách nhận dạng, và con cardinal đực làm tổ gần hàng rào nhà tôi phản ứng cực kỳ mạnh, sau hôm đó thì cả hai con đều không thấy xuất hiện lại nữa
Ngày nào tôi cũng thấy chúng, nên tôi lo rằng vì tính territorial quá mạnh, chỉ việc phát tiếng bằng ứng dụng thôi cũng có thể đã khiến chúng bỏ tổ
Lần nào cũng là kiểu: "ơ con chim đó ở gần thật đấy nhỉ?" → "để lấy điện thoại ra dùng Merlin xem là loài gì nào" rồi mới phát hiện chuyện gì đang xảy ra
Tôi nghĩ ứng dụng cũng nên nhấn mạnh cảnh báo này hơn — kiểu như "đừng dùng tính năng này để gọi chim đến, chỉ nghe để tham khảo cho bản thân thôi"
Nếu tôi là một con chim, mà nghe tiếng một con chim lạ mang cảm xúc hay ý nghĩa nhất định lại được phát ra ngay gần đó bởi một con thú có vú là con người to lớn, thì chuyển cả gia đình đi nơi khác có lẽ là phản ứng hoàn toàn hợp lý
Cardinal đặc biệt có tính lãnh thổ cao nên trong mùa làm tổ chúng rất hay xua đuổi nhau
Huýt sáo, "pishing", dùng điện thoại — tất cả đều làm gián đoạn hành vi tự nhiên
Ô tô, xe tải, máy cắt cỏ, mô tô và đủ loại tiếng ồn khác cũng ảnh hưởng rất lớn đến chim
Tham khảo tài liệu playback proper use của "Sibley Guides",
Ngày xưa tôi từng phân tích spectrogram trong phòng thí nghiệm ngôn ngữ học để xác định vị trí cấu âm của các âm vị
Vì vậy với tôi thì việc dùng nó để huấn luyện mô hình nghe có vẻ rất tự nhiên, hơn là dùng các biểu diễn âm thanh khác
Nhờ nó mà tôi phát hiện thêm hơn 12 loài mới chỉ bằng tiếng hót, và một số loài giờ tôi còn có thể tự nhận ra chỉ bằng nghe tiếng kêu
Công nghệ kiểu này đã khiến tôi tận hưởng sở thích này theo một cách hoàn toàn khác
Ít nhất trong lĩnh vực này, đây rõ ràng là một trường hợp machine learning/AI mang lại tác động tích cực
Nhưng một điểm bất tiện là không thể tải ảnh lên từ máy tính PC qua web
Với người chụp chim bằng DSLR như tôi thì chỉ riêng việc chuyển ảnh thôi đã rất phiền
Không phải vấn đề chí mạng, nhưng cuối cùng tôi vẫn phải nhận dạng chim bằng cách khác
Nếu có thêm lựa chọn UX không phụ thuộc di động thì sẽ cực kỳ hữu ích
Dù còn đang ở giai đoạn alpha sớm, nó có thể hữu ích cho workflow ảnh chụp bằng DSLR
Nếu bạn cần một phương án thay thế trên web, còn có demo space trên Hugging Face, bạn có thể tải ảnh lên thẳng bằng trình duyệt để dùng ngay
Tuy nhiên đây chỉ là bản trình diễn mô hình, nên trải nghiệm sử dụng chưa phải trọng tâm, và còn bất tiện ở chỗ phải tự chọn mô hình theo khu vực (châu Âu, bán đảo Ả Rập, v.v.)
Phạm vi khu vực hiện còn hạn chế nhưng sẽ dần được mở rộng thêm
Khi cần nhận dạng, tôi chỉ việc chụp lại màn hình monitor bằng smartphone rồi đưa vào Merlin
Không cần ảnh 48MP, chỉ cần screenshot là đủ
Cá nhân tôi chỉ nhận dạng những bức ảnh mà tôi thấy không ngại đăng lên, và sau khi đăng thì có thể truy cập từ điện thoại (Flickr, IG, v.v.), nên rất dễ lấy vào ứng dụng
Chỉ khi gặp những loài quá giống nhau thì đôi lúc tôi mới hơi nghi ngờ phán đoán
Ví dụ, tôi không chắc quanh nhà mình thực sự có Purple Finch hay không (vì lúc nào tôi cũng chỉ thấy House Finch)
Dù vậy, Merlin đáng tin đến mức nó khiến tôi nghĩ rằng có khi chính tôi mới là người sai
Nhưng đa số vẫn chính xác, và nếu nghi ngờ thì bạn cứ tự đi nhìn con chim là xong
Ngay cả khi nghe tận tai tiếng của chim săn mồi thật, tôi cũng gần như không phân biệt nổi với tiếng nhái của jay
Về lý thuyết thì cũng có thể là chim săn mồi thật, nhưng việc nhận ra "bald eagle" thì có lẽ hợp lý hơn nếu cho rằng nó đã nhầm với tiếng trẻ con trong khu phố la hét
Hai loài này nhìn ngoài đời thì phân biệt rất rõ, nhưng chỉ nghe bằng tai thì ngay cả tôi cũng khó tách bạch, nên cũng khó trách Merlin
Tôi thường dùng WhoBird, ứng dụng này chạy kiểu tích hợp sẵn hoàn toàn offline, dùng tốt cả khi không có Internet, và cũng có trên fdroid (https://f-droid.org/packages/org.woheller69.whobird/)
Tôi định sẽ thử cả Merlin rồi so sánh hiệu năng của hai ứng dụng
Tôi cũng luôn dùng nó ngoại tuyến khi ở trên núi