1 điểm bởi GN⁺ 2025-06-05 | 1 bình luận | Chia sẻ qua WhatsApp
  • Merlin Bird ID là công cụ chuyên về nhận diện và tra cứu chim
  • Giúp người dùng nhanh chóng xác định loài thông qua ảnh hoặc âm thanh của chim
  • Cung cấp trải nghiệm thân thiện, dễ dùng cho cả người dùng phổ thông lẫn chuyên gia
  • Tính năng nhận diện chim dựa trên AI giúp xác minh thông tin chính xác trong nhiều môi trường khác nhau
  • Có tiềm năng đóng góp tích cực cho bảo tồn chim và nghiên cứu khoa học công dân

Tổng quan về Merlin Bird ID

  • Merlin Bird ID là nền tảng nhận diện chimtra cứu loài được sử dụng trên toàn cầu
  • Người dùng có thể tải lên ảnh hoặc âm thanh của chim từ điện thoại hoặc website để nhanh chóng xác định loài chim tương ứng
  • Do All About Birds cung cấp, nền tảng được thiết kế với mục tiêu mang lại trải nghiệm trực quan, dễ dùng cho cả người mới bắt đầu và chuyên gia
  • Sử dụng thuật toán và công nghệ máy học để cung cấp khả năng tiếp cận thông tin chính xác về chim trong nhiều khu vực và môi trường khác nhau
  • Merlin Bird ID có thể đóng góp lớn cho khoa học công dân, bảo vệ môi trường và các hoạt động nghiên cứu về chim

Hướng dẫn về an toàn trang web hoặc kết nối

  • Để sử dụng trang web này, cần cho phép JavaScript và cookie
  • Để bảo đảm kết nối an toàn, hệ thống thực hiện quy trình rà soát bảo mật và xác thực tự động
  • Những quy trình bảo mật này nhằm bảo vệ quyền riêng tư và dữ liệu của người dùng

Tóm tắt

  • Merlin Bird ID là nền tảng toàn cầu mạnh về nhận diện chim bằng AI và tra cứu loài
  • Nhờ cách sử dụng đơn giản và thuật toán được cải tiến, nền tảng hữu ích cho quan sát tự nhiên, giáo dục và hoạt động khoa học
  • Cung cấp khả năng nhận diện có độ chính xác cao trong nhiều môi trường và quốc gia

1 bình luận

 
GN⁺ 2025-06-05
Ý kiến trên Hacker News
  • Tôi thực sự rất thích ứng dụng này. Khoảng một tháng trước tôi bắt đầu dùng vì tò mò không biết con chim hót rất to là loài nào, hóa ra là Tufted Titmouse (giờ là một trong những loài tôi thích nhất, ngoại hình cực kỳ đẹp) và Carolina Wren (ngoại hình kém nổi bật hơn một chút nhưng tiếng hót thì quá cuốn hút)
    Một tháng gần đây thói quen buổi sáng của tôi đã thay đổi hoàn toàn, tôi dành thời gian ở sân sau thay vì ở trong nhà
    Đổ và vệ sinh máng ăn cho chim, để thêm đậu phộng cho sóc, rồi ngồi trên deck với cà phê, bữa sáng và ứng dụng Merlin ID đã thành một nếp sinh hoạt
    Tôi không học nổi ngôn ngữ của con người mới, nhưng nhờ dùng ứng dụng này đều đặn, giờ tôi không chỉ phân biệt được các loài chim mà còn nhận ra cả tiếng kêu hay giọng hót đặc trưng của từng cá thể
    Điều duy nhất tôi mong là có tính năng ghi lại từng cá thể chim và lưu kèm bản ghi âm cùng ảnh của con đó
    Xin gửi tràng pháo tay tới những người phát triển ứng dụng này, đây là ứng dụng tuyệt nhất tôi dùng trong một thời gian rất dài
    • Tôi không chắc hiểu ý bạn — trong tab "Explore" và Life List bạn có thể xem cả ảnh lẫn tiếng kêu
      Đây đúng là một ứng dụng rất tốt, nhưng với cá nhân tôi thì điểm trừ là UX để thêm chim vào Life List quá tệ
      Khi bạn nhận dạng bằng âm thanh hay ảnh, nó hỏi bạn gặp con chim đó khi nào và ở đâu, nhưng giá trị mặc định thực sự rất dở — dù biết vị trí và thời gian hiện tại, nó vẫn có lúc tự lôi ra một vị trí hay thời điểm ngẫu nhiên từ vài tháng trước
      Nó cũng phớt lờ việc ngay trước đó tôi vừa nhập bao nhiêu con ở vị trí hiện tại
    • Với tôi, Merlin là ví dụ điển hình cho thấy "máy tính trong túi của mọi người" thực sự có thể làm được gì
      Một ứng dụng tuyệt vời, và nó giúp rất nhiều người đến gần thiên nhiên hơn
      Thỉnh thoảng có hiện lời nhắc quyên góp cho tổ chức vận hành, nhưng đó là lời kêu gọi rõ ràng, trực tiếp, không hề có trò tiếp thị lắt léo hay dark pattern kỳ quặc nào
    • Hoàn toàn đồng ý! Thường thì các ứng dụng chỉ muốn nhốt người dùng trong thế giới ảo, còn Merlin lại là một trường hợp hiếm hoi kéo sự chú ý của người dùng trở về thế giới thật, tức thiên nhiên
      Đặc biệt, tính năng nhận dạng bằng âm thanh là thứ ai cũng có thể dùng, nhưng lại mở ra một trải nghiệm mà bình thường gần như không thể có được (phân biệt loài chỉ bằng tai), đồng thời hướng bạn tập trung hơn vào âm thanh trong tự nhiên
      Cá nhân tôi thấy hơi tiếc là Merlin, và đặc biệt là eBird, có xu hướng đẩy việc ngắm chim theo kiểu cạnh tranh điểm số — nếu xét đến sự suy giảm số lượng cá thể chim, thì việc khuyến khích đi khắp thế giới để nhìn được nhiều loài nhất có thể có lẽ là vấn đề
      Nhưng đó chỉ là một phàn nàn rất nhỏ, và Merlin vẫn là một trong số ít ứng dụng tôi có thể tự tin giới thiệu cho bất kỳ ai
    • iNaturalist cũng là một viên ngọc khác
      Tôi mong những người quan tâm đến hacking sẽ chủ động ủng hộ để các ứng dụng như thế này không bị thương mại hóa như AllTrails hay Couchsurfing
  • Thật đáng mừng khi một ứng dụng như thế này nhận được sự chú ý
    Mong là các dev hay PM nhìn thấy bài này và ghi nhận cả phản hồi
    Đặc biệt, sound ID hoạt động tốt hơn kỳ vọng rất nhiều ngay cả ngoài thực địa ở rừng hay rừng rậm Colombia, nơi hoàn toàn không có mạng
    Tuy vậy, các phần khác của ứng dụng còn khá yếu
    Nút bấm hay bị đơ, các màn hình thiếu nhất quán, kết quả bị biến mất và có nhiều vấn đề khác
    Sẽ rất hay nếu có tích hợp với iNaturalist, và khi mở lại bản ghi cũ thì những con chim từng được nhận dạng lúc đó lại hiện là "No matches"
    Khi đi theo nhóm ngoài thiên nhiên, nhiều lần đã nhận dạng thành công rồi nhưng đến lúc muốn cho ai đó xem thì kết quả đã biến mất
    Chỉ cần thêm một nút phản hồi đơn giản thôi cũng có thể cải thiện quy trình rất nhiều
    Xin gửi lời cảm ơn sâu sắc tới tất cả những người đã phát triển và đóng góp cho ứng dụng này
    • Nút không bấm được, màn hình thiếu nhất quán, kết quả biến mất, v.v.
      Tò mò hỏi bạn đang dùng thiết bị gì? Tôi dùng hằng ngày trong nhiều tháng trên vài đời Google Pixel mà chưa từng gặp bất kỳ vấn đề nào như vậy
      Tôi cũng không rõ "đã nhận dạng rồi mà sau đó muốn cho người khác xem thì kết quả biến mất" nghĩa là gì — ý là trong lúc đang ghi âm thì có nhận dạng, nhưng khi dừng lại kết quả lại mất à?
      Theo trải nghiệm của tôi thì chỉ khi ghi âm dài hơn 10 phút mới có hơi lag, và tôi chỉ cần ngắt rồi bắt đầu bản ghi mới là xong

    • sound ID hoạt động tốt cả ở rừng/rừng rậm Colombia
      Trải nghiệm thú vị đấy
      Với tôi, để sound ID hoạt động tốt thì (1) không được bỏ điện thoại trong túi mà phải để ngoài không khí tự do (nếu che micro thì nó không nhận ra gì), (2) bản thân phải đứng yên, không di chuyển (tiếng bước chân của tôi át mọi tiếng chim nhỏ), và (3) phải để ứng dụng Merlin ở "chế độ lấy nét" — nếu nó chạy nền thì tôi có cảm giác gần như không bắt được gì cả (có thể chỉ là tôi tưởng vậy thôi)
      Có lúc một con chim lớn kêu ngay trên đầu mà nó không nhận ra, nhưng tiếng rất nhỏ từ xa thì lại bắt rất chính xác
      Cá nhân tôi muốn AI làm nổi bật rõ phần nào trên sonogram (phổ âm thanh) đã được dùng để nhận dạng
      Khi nhiều con chim cùng hót một lúc thì việc diễn giải sonogram này đặc biệt khó

Các phần còn lại của ứng dụng còn khá yếu
Tôi lại không thấy thế chút nào, chắc có lẽ là khác biệt do điện thoại
Dù sao thì đây vẫn là một ứng dụng tốt

  • Tôi rất yêu ứng dụng này
    Nhưng trên Android thì cứ đúng 255 giây sau khi bắt đầu là nó luôn bị crash (tôi còn tự bấm giờ)
    Không biết có cách nào để gửi bug report không
  • Khi tôi ở châu Âu và cố thêm khu vực thứ hai thì ứng dụng bị treo cứng hoàn toàn
    Tôi phải cài lại mới dùng tiếp được
    Trên iOS, phần thêm thông tin khu vực hiện đang hỏng hoàn toàn
  • Bạn tôi đang tham gia nhóm nghiên cứu phần Sound ID
    Cả nhóm đã bỏ ra rất nhiều công sức để làm cho mô hình machine learning và phần đánh giá thực sự hoạt động tốt
    Sound ID là một ví dụ rất hay cho thấy thay vì kiểu tiếp cận "ném dữ liệu vào rồi huấn luyện qua loa" thường thấy, việc nghiên cứu tỉ mỉ cùng chuyên gia lĩnh vực có thể cho ra kết quả đáng tin cậy hơn nhiều
    • Công nghệ Sound ID thực sự rất ấn tượng
      Có lần bên ngoài nhà tôi, chim ở nhiều khoảng cách khác nhau cùng lúc hót ầm ĩ, mà ứng dụng này chỉ trong 30 giây đã nhận đúng 6 loài
      Theo đánh giá của tôi thì cả 6 kết quả đó đều khá hợp lý
    • Tôi ước có tính năng tự động gán tên riêng cho từng cá thể chim kiểu như "Fred", "Bertha", "Kevin"
      Những con hay ghé khu vườn của tôi thì tôi đều biết là loài nào rồi, nên giờ tôi muốn phân biệt xem con nào quay lại, cặp đôi có thay đổi không, hay từ xa hơn một chút cũng nhận ra kiểu "à, lại là Kevin"
      Với những loài có nhiều cá thể trông na ná nhau như blackbird thì có thể khó, nhưng với vài loài thì tôi nghĩ AI hoàn toàn có thể làm được
    • Tôi ước có open API
      Tôi có vài ý tưởng về việc nhận dạng chim bằng tiếng hót, và nếu công nghệ nhận dạng của Merlin được công khai dưới dạng API cho bên ngoài thì sẽ cực kỳ hữu ích
    • Gần nhà tôi có một con gà trống sáng nào cũng gáy
      Lần nào tôi cũng mong ứng dụng nhận ra gà trống, nhưng lần nào nó cũng không hiện
      Nhờ bạn chuyển lời tới nhóm nghiên cứu rằng "gà trống cũng là chim! Và còn là chiếc đồng hồ báo thức tuyệt nhất thế giới, xin hãy đưa nó vào danh sách nhận dạng"
    • Đây là một ứng dụng thật sự đáng kinh ngạc, nhưng đôi khi cũng có khá nhiều false positive (nhận dạng sai)
      Có lẽ đây là giới hạn kỹ thuật khó tránh khỏi
  • Khi phát tiếng chim bằng ứng dụng thì thực sự phải hết sức cẩn thận
    Vài ngày trước tôi vô tình bấm vào tiếng hót của cardinal trong danh sách nhận dạng, và con cardinal đực làm tổ gần hàng rào nhà tôi phản ứng cực kỳ mạnh, sau hôm đó thì cả hai con đều không thấy xuất hiện lại nữa
    Ngày nào tôi cũng thấy chúng, nên tôi lo rằng vì tính territorial quá mạnh, chỉ việc phát tiếng bằng ứng dụng thôi cũng có thể đã khiến chúng bỏ tổ
    • Tôi đã vài lần gặp cảnh "vô tình để ứng dụng Merlin bật lên trong túi"
      Lần nào cũng là kiểu: "ơ con chim đó ở gần thật đấy nhỉ?" → "để lấy điện thoại ra dùng Merlin xem là loài gì nào" rồi mới phát hiện chuyện gì đang xảy ra
    • Khi đi ngắm chim tôi đã nghe đến thuật ngữ "calling back"
      Tôi nghĩ ứng dụng cũng nên nhấn mạnh cảnh báo này hơn — kiểu như "đừng dùng tính năng này để gọi chim đến, chỉ nghe để tham khảo cho bản thân thôi"
      Nếu tôi là một con chim, mà nghe tiếng một con chim lạ mang cảm xúc hay ý nghĩa nhất định lại được phát ra ngay gần đó bởi một con thú có vú là con người to lớn, thì chuyển cả gia đình đi nơi khác có lẽ là phản ứng hoàn toàn hợp lý
      Cardinal đặc biệt có tính lãnh thổ cao nên trong mùa làm tổ chúng rất hay xua đuổi nhau
      Huýt sáo, "pishing", dùng điện thoại — tất cả đều làm gián đoạn hành vi tự nhiên
      Ô tô, xe tải, máy cắt cỏ, mô tô và đủ loại tiếng ồn khác cũng ảnh hưởng rất lớn đến chim
      Tham khảo tài liệu playback proper use của "Sibley Guides",

Các nghiên cứu cho thấy khi phát tiếng hót trong một lãnh thổ nhất định, cả chim hàng xóm lẫn chim mái đều chú ý sát sao đến phản ứng đó, và nếu cá thể ấy không thể xua đuổi kẻ xâm nhập vô danh trong thực tế thì thứ bậc của nó có thể bị suy giảm
Về mặt kỹ thuật, giờ đây chúng ta đã có thể sao chép và phát lại ngôn ngữ của chúng, và điều đó thực sự có thể gây ra tác động như làm tan vỡ cả một gia đình chim

  • Một điểm thú vị xin chia sẻ

Sound ID chuyển âm thanh thành spectrogram trực quan rồi phân tích bằng công cụ computer vision (tương tự công nghệ dùng cho Photo ID)
Tức là spectrogram cuộn ở phía trên cùng của ứng dụng không chỉ để trang trí mà chính là cơ chế nhận dạng thực tế

  • Thông tin hay thật
    Ngày xưa tôi từng phân tích spectrogram trong phòng thí nghiệm ngôn ngữ học để xác định vị trí cấu âm của các âm vị
    Vì vậy với tôi thì việc dùng nó để huấn luyện mô hình nghe có vẻ rất tự nhiên, hơn là dùng các biểu diễn âm thanh khác
  • Spectrogram cũng rất hữu ích cho việc nhận dạng thủ công thực tế hoặc ghi nhớ từng tiếng kêu riêng lẻ (ít nhất là với tôi)
  • Hầu hết các mạng nơ-ron cho âm thanh đều hoạt động dựa trên spectrogram
  • Tôi đã quan sát chim đều đặn nhiều năm rồi, nhưng năm nay mới lần đầu dùng ứng dụng nhận dạng âm thanh
    Nhờ nó mà tôi phát hiện thêm hơn 12 loài mới chỉ bằng tiếng hót, và một số loài giờ tôi còn có thể tự nhận ra chỉ bằng nghe tiếng kêu
    Công nghệ kiểu này đã khiến tôi tận hưởng sở thích này theo một cách hoàn toàn khác
    Ít nhất trong lĩnh vực này, đây rõ ràng là một trường hợp machine learning/AI mang lại tác động tích cực
  • Tôi cũng là fan dùng ứng dụng này rất thường xuyên
    Nhưng một điểm bất tiện là không thể tải ảnh lên từ máy tính PC qua web
    Với người chụp chim bằng DSLR như tôi thì chỉ riêng việc chuyển ảnh thôi đã rất phiền
    Không phải vấn đề chí mạng, nhưng cuối cùng tôi vẫn phải nhận dạng chim bằng cách khác
    Nếu có thêm lựa chọn UX không phụ thuộc di động thì sẽ cực kỳ hữu ích
    • Tôi là tác giả của Birder Framework (bộ công cụ computer vision phân loại chim) — https://gitlab.com/birder/birder
      Dù còn đang ở giai đoạn alpha sớm, nó có thể hữu ích cho workflow ảnh chụp bằng DSLR
      Nếu bạn cần một phương án thay thế trên web, còn có demo space trên Hugging Face, bạn có thể tải ảnh lên thẳng bằng trình duyệt để dùng ngay
      Tuy nhiên đây chỉ là bản trình diễn mô hình, nên trải nghiệm sử dụng chưa phải trọng tâm, và còn bất tiện ở chỗ phải tự chọn mô hình theo khu vực (châu Âu, bán đảo Ả Rập, v.v.)
      Phạm vi khu vực hiện còn hạn chế nhưng sẽ dần được mở rộng thêm
    • Tôi cũng chụp ảnh chim bằng DSLR
      Khi cần nhận dạng, tôi chỉ việc chụp lại màn hình monitor bằng smartphone rồi đưa vào Merlin
      Không cần ảnh 48MP, chỉ cần screenshot là đủ
    • Tôi cũng dùng cách đó
      Cá nhân tôi chỉ nhận dạng những bức ảnh mà tôi thấy không ngại đăng lên, và sau khi đăng thì có thể truy cập từ điện thoại (Flickr, IG, v.v.), nên rất dễ lấy vào ứng dụng
  • Với tư cách một người ngắm chim bình thường, tôi cực kỳ ấn tượng với công nghệ này và gần như tin tưởng hoàn toàn
    Chỉ khi gặp những loài quá giống nhau thì đôi lúc tôi mới hơi nghi ngờ phán đoán
    Ví dụ, tôi không chắc quanh nhà mình thực sự có Purple Finch hay không (vì lúc nào tôi cũng chỉ thấy House Finch)
    Dù vậy, Merlin đáng tin đến mức nó khiến tôi nghĩ rằng có khi chính tôi mới là người sai
    • Đúng là những loài tương tự nhau đôi khi vẫn bị nhận sai — gần đây tôi thấy rõ ở quạ và warbler
      Nhưng đa số vẫn chính xác, và nếu nghi ngờ thì bạn cứ tự đi nhìn con chim là xong
    • Quanh nhà tôi lúc nào cũng có rất nhiều Blue Jay, và bọn này bắt chước một số tiếng của chim săn mồi cực hay, đến mức Merlin thỉnh thoảng nhận là chim săn mồi thật
      Ngay cả khi nghe tận tai tiếng của chim săn mồi thật, tôi cũng gần như không phân biệt nổi với tiếng nhái của jay
      Về lý thuyết thì cũng có thể là chim săn mồi thật, nhưng việc nhận ra "bald eagle" thì có lẽ hợp lý hơn nếu cho rằng nó đã nhầm với tiếng trẻ con trong khu phố la hét
    • Tôi sống ở Anh, và lỗi phổ biến của Merlin ở đây là nhầm tiếng hót kiểu "at rest" của nhóm finch, đặc biệt là greenfinch, thành goldfinch
      Hai loài này nhìn ngoài đời thì phân biệt rất rõ, nhưng chỉ nghe bằng tai thì ngay cả tôi cũng khó tách bạch, nên cũng khó trách Merlin
  • Tôi rất thích những ứng dụng kiểu này
    Tôi thường dùng WhoBird, ứng dụng này chạy kiểu tích hợp sẵn hoàn toàn offline, dùng tốt cả khi không có Internet, và cũng có trên fdroid (https://f-droid.org/packages/org.woheller69.whobird/)
    Tôi định sẽ thử cả Merlin rồi so sánh hiệu năng của hai ứng dụng
    • Merlin cũng hoạt động hoàn hảo khi offline
      Tôi cũng luôn dùng nó ngoại tuyến khi ở trên núi
    • Theo tôi biết thì WhoBird cũng dựa trên cùng mô hình (hoặc do Cornell phát triển), nhưng Merlin vẫn vượt trội hơn ở khả năng nhận dạng đồng thời nhiều con
    • WhoBird chỉ hoạt động với audio (âm thanh), không hỗ trợ nhận dạng bằng ảnh