深層学習をもちいた鳴き声による鳥類の種判別システムの開発と今後の展望
鳥類は環境状況を把握するための指標生物として優秀であるといわれている.そのため,効率的に鳥類を記録できる鳴き声による音声モニタリングが注目されており,特に欧米では,機械学習により鳴き声から鳥類の自動種判別をする研究が盛んである.しかし,日本に生息する鳥類を対象とした研究事例は少なく,その多くは単一種や限られた数種類のみの判別を試みており,判別可能な種数が少ない現状である.高精度に自動で判別できる種数を増やすことが,日本の鳥類モニタリングをより発展させると考えられる.そこで本研究では,日本国内で利用可能,かつ複数種を識別可能な種判別システムを構築することを目的とした.本研究では,66種の鳥類を対...
Saved in:
Published in | Bird Research Vol. 19; pp. A31 - A50 |
---|---|
Main Authors | , , , , , |
Format | Journal Article |
Language | Japanese |
Published |
特定非営利活動法人バードリサーチ
2023
|
Subjects | |
Online Access | Get full text |
ISSN | 1880-1587 1880-1595 |
DOI | 10.11211/birdresearch.19.A31 |
Cover
Summary: | 鳥類は環境状況を把握するための指標生物として優秀であるといわれている.そのため,効率的に鳥類を記録できる鳴き声による音声モニタリングが注目されており,特に欧米では,機械学習により鳴き声から鳥類の自動種判別をする研究が盛んである.しかし,日本に生息する鳥類を対象とした研究事例は少なく,その多くは単一種や限られた数種類のみの判別を試みており,判別可能な種数が少ない現状である.高精度に自動で判別できる種数を増やすことが,日本の鳥類モニタリングをより発展させると考えられる.そこで本研究では,日本国内で利用可能,かつ複数種を識別可能な種判別システムを構築することを目的とした.本研究では,66種の鳥類を対象とし,Transformerベースの音声分類モデルであるAudio Spectrogram Transformerにより判別システムを構築し,その精度はOverall Accuracyが0.801,Precisionが0.797,Recallが0.780,F1 scoreが0.782であった.また,未知のデータに対する検証も行なった結果,Overall Accuracyが0.677,Precisionが0.679,Recallが0.635,F1 scoreが0.670であり,先行研究を上回る精度であった.ただし,一部の種については精度が低く,その原因としては,①学習用データの不足,②地域差や個体差,録音機材や録音形式の差が影響した可能性が考えられた.次に,今後このようなシステムを社会実装することを目指して,鳥類識別システムの改善に向けた課題を整理した.その結果,システムの構築については,市民科学データを活用することや,目的にあわせた技術を選択することが課題解決につながると考えられた.社会実装の段階では,音声収集~音声データの前処理~モデルの構築のワークフロー全体を通した結果により,種判別システムをもちいた調査と従来の調査を比較して,メリットとデメリットを理解した上で目的に合わせた調査設計をするとよいことがわかった. |
---|---|
ISSN: | 1880-1587 1880-1595 |
DOI: | 10.11211/birdresearch.19.A31 |