Hort-YOLO:半自動アノテーションフレームワークを統合した多作物深層学習モデル

【研究のポイント】
・MSRM、PUSM、SPPMなどのモジュールを搭載し、データ間の関連性情報(コンテクスチュアル情報)の保持と精度の向上を実現する
・多くの種類の作物のデータセットを用いて評価されており、幅広い園芸作物において有効性を発揮する
・農産物のデータのように症状やランクが偏っている、つまり、クラスのデータが偏っており、データセットの数が中規模の場合、Hort–YOLOは優れた性能を発揮する
・Hort–YOLOは、アノテーション速度の向上と教師あり学習のスケールアップの高バランスを実現する
・データの分析結果を、ユーザーのデバイスやスマートグラスに結果を表示する

【研究の概要】
愛媛大学大学院農学研究科のイスラム・MD・パルベス准教授と羽藤堅治教授を中心とする研究グループは、園芸作物のリアルタイムモニタリングシステム「Hort-YOLO」を開発しました。このシステムは、作物の形態を正確にとらえ、かつその状態を正確に判定可能な物体検出が可能なディープラーニングモデルです。アノテーション速度を圧倒的に改善し、教師あり学習の精度と安定性を向上させることを両立させており、実環境への導入が実用的です。

本研究は、農業現場などの刻一刻と変動する太陽光や人工光源などの様々な光条件下において正確な物体検出(葉、花、果実、茎など)を実践的に行う事が可能になり、農業現場でリアルタイムに利用可能なAIの開発に取り組んでいます。この実現のため、我々は、カスタムバックボーンであるDeepD424v1と、再設計されたYOLOv4ヘッドを特徴とする新しいアーキテクチャ、Hort-YOLOを提案します。
DeepD424v1バックボーンは、モジュール式で非対称な構造に基づいて構築されており、判別性の高いマルチスケールな大域的・局所的空間特徴を効果的に抽出することが可能となります。設計においては、深層学習において異なる深さの特徴を融合させることで、特徴知覚の損失を防ぎつつ、認識速度と精度の両方を同時に向上させることを目的としました。具体的には次のとおりに設計しました。本ネットワークの非対称なブランチは、マルチスケール及び並列のダウンサンプリング層を備え、特徴マップの空間サイズを徐々に縮小していきます。このプロセスにより、きめ細かな(fine)詳細から粗い(coarse)詳細まで、より豊かな特徴情報とともに抽出し、空間次元とチャネル次元の両方で多様なコンテキスト情報を生成する事が可能となります。結果として、計算複雑性を効果的に削減し、畳み込みニューラルネットワーク(CNN)の表現学習能力を強化することができます。
実験結果として、まず、モデルサイズは約 2.6×102MB です。Hort-YOLO検出器の改良された空間ピラミッドプーリングモジュール(SPPM)は、ターゲットオブジェクトのピクセルサイズが入力画像の5%未満であっても、正確に位置を特定することができました。次に、クラス不均衡で動的かつノイズの多い園芸データセットに対する比較性能評価では、低度及び中程度のクラス不均衡が存在するにもかかわらず、モデル1、2及び4は、検証データセットで0.68という高いF1スコアを達成しました。他の物体検出器(YOLOv10(n, s, m, l, x, b)、YOLOv11(n, s, m, l, x)、YOLOv12(n, s, m, l, x)、YOLOx(medium coco)、標準及び改変版YOLOv4を含む)と比較すると、Hort-YOLOはmAP05スコア0.77、リコールスコア0.80を達成するなど高評価を得ました。このシステムによるアノテーション時間は1/5〜1/6となり半自動アノテーションプロセスの高効率を実証することができました。したがって、このアノテーションフレームワークは、大規模データセットを効率的に処理することで、教師あり学習プロセスのスケールアップに貢献することが確認できました。さらにHort-YOLOは、15〜30フレーム/(FPS)の動画像においてもリアルタイムで物体を検出することを示すことができました。
以上のことから、農業現場のような異なる照明、遮蔽及び背景の複雑さの条件下におけるモデルの堅牢性とリアルタイムでの処理能力を示すことができます。

参考 URL1: https://doi.org/10.1016/j.compag.2025.111196

論文情報

Title:Hort-YOLO: A multi-crop deep learning model with an integrated semi-automated annotation framework
Authors:M.P. Islam, K. Hatou, K. Shinagawa, S. Kondo, Y. Kadoya, M. Aono, T. Kawara, K. Matsuoka
Journal:Computers and Electronics in Agriculture, 240, 111196
DOI:10.1016/j.compag.2025.111196, 2026(Available online 15 November 2025).

助成金等

  • 日本学術振興会(JSPS)24K09164

図表等

  • AI支援による半自動アノテーションフレームワークを統合した多作物深層学習モデル

    AI支援による半自動アノテーションフレームワークを統合した多作物深層学習モデル

    ネットワーク中心型Hort-YOLOモデルの動作原理と栽培目標

    credit : Md Parvez Islam(愛媛大学)
    Usage Restriction : 使用許可を得てください

  • AI支援による半自動アノテーションフレームワークを統合した多作物深層学習モデル

    AI支援による半自動アノテーションフレームワークを統合した多作物深層学習モデル

    半自動データアノテーションタスクの効率を評価するためのサリエンシーマップ

    credit : Md Parvez Islam(愛媛大学)
    Usage Restriction : 使用許可を得てください

問い合わせ先

氏名 : Md Parvez Islam
電話 : 089-946-9823
E-mail : islam.md_parvez.by@ehime-u.ac.jp
所属 : 愛媛大学大学院農学研究科