PROJECT リッジアイの現場で使えるAI開発事例

AI開発のデータ不足を克服 | Image-to-Imageによるデータ拡張の可能性

AI開発・MLOps設計
DX戦略
インフラ・プラント
セキュリティ・防犯
宇宙・衛星
生成AI
製造業

イントロダクション

  • AI開発におけるデータ不足の課題

近年、AIはビジネスの様々な分野で革命を起こす可能性を秘めた技術として注目されています。しかし、AI 開発、特に機械学習の分野では、高精度なモデルを構築するために大量のデータが必要となることが大きな課題となっています。

例えば、医療業界においては医療画像の解析では患者のプライバシー保護のためにデータの収集が制限されているケースや、製造業においても特定の故障データが希少であるため、十分なデータを得ることが困難なケースが非常に多く見られます。

これら専門性の高い分野や、データ収集にコストや時間がかかるケースでは、この「データ不足」が AI 導入を阻む大きな壁となっています。従来のデータ拡張技術では、限られたデータから十分な量のバリエーションを生成することが難しく、精度向上にも限界がありました。AI 導入を試みたものの、データ不足によって期待した成果を上げられなかった、というケースも少なくありません。

  • Ridge-iのアプローチ

このような状況の中、Ridge-i では、画像生成AIモデルであるDiffusion model を活用したデータ拡張技術に注目し、研究開発を進めています。近年、Diffusion model は目覚ましい発展を遂げており、様々な先端技術が登場しています。

その中で、Ridge-i は、特に専門性が高く特定の用途に特化した画像を扱う分野において、限られたデータからでも高精度かつ効率的にデータ拡張を実現できる技術の1つとして、Diffusino modelの「Image-to-Image」の手法に着目しています。この画像を入力とする「Image-to-Image 」の手法は、テキストを入力とする テキスト条件付きDiffusion model では困難だった課題を克服できる、大きな可能性を秘めています。

Diffusion model によるデータ拡張 - Image-to-Image の可能性 -

  • Diffusion model とは

Diffusion modelは、入力されたデータに対してノイズを徐々に加えて変換する過程と、そのノイズを除去して元のデータに戻す過程を学習させることで、データ生成を行う深層学習モデルです。このDiffusion model を使用して合成データを生成する最も一般的な方法は、テキストから画像への変換方法ですが、特殊な画像の場合、テキストで表現することが難しく、また、一般的な対象物(猫、犬、テーブル、椅子など)でトレーニングされたDifuusion model が専門用語を理解することも難しく、実務においての利用にハードルがあります。

本技術は昨年(2023年)に広く注目されたものであり技術進展の速さを考慮すると最新技術ではありませんが、現在もなお、実務におけるデータ拡張の課題に対する有用なソリューションの1つであることから、今回ご紹介いたします。

  • Ridge-iが着目した Image-to-Image の可能性

Ridge-i が関わる多くのプロジェクトでは、医療画像、衛星画像、設備画像など、専門的で特殊な状況を映した画像データを扱っています。これらの特徴を正確にテキストで表現するのは難しく、テキストを入力とするDiffusion modelでは、データ拡張に適した高品質な画像生成が困難でした。一方、Image-to-Image手法を用いることで、テキストに変換することなく、元の画像の特徴をそのまま維持してDiffusion modelに入力できるため、特殊なデータでも適切な画像生成が可能となります。これは、Ridge-iが扱うような専門性の高い分野でのデータ拡張に最適な手法となります。

Ridge-iでは、実際のプロジェクトにおけるデータ不足の壁を突破する技術としてDifusion modelのImage-to-Imageを用い成果を創出しています。

ケーススタディ - 衛星画像を用いた船舶検出モデルへの活用 -

  • 課題背景と解決策

近年、衛星画像を用いた船舶検出は、違法漁業の監視や海上交通の安全確保など、様々な分野で注目されています。しかし、高精度な検出モデルを構築するには、天候や時間帯、船舶の種類など、多様な条件下で撮影された大量の衛星画像データが必要となります。

Ridge-i は、データ不足を解消するため、Image-to-Image を用いたデータ拡張技術を採用しました。具体的には、限られた数の船舶画像から、様々な角度、天候条件、海面状態を再現した画像を自動生成することで、学習データの大幅な増量を実現しました。

  • 成果

データ拡張技術の導入により、60枚のデータを10倍に拡張し、合計660枚のデータを用いたモデル学習ではデータを拡張しなかった時と比較し、物体検出の評価指標であるmAP*が、13.8ポイント向上(70.7% → 84.5%)しました。この成果による高性能なモデル開発によって、海洋環境の保全、海難事故の予防、海上における安全保障など、様々な分野での活用が期待できます。

上記の結果は、1枚の画像から10種類の画像データを生成・拡張したものです。拡張の最適な数は、対象物の種類や元の画像の枚数によって調整する必要がありますが、Diffusion modelを追加の微調整なしでそのまま活用できるため、専門知識がなくても簡単に利用できる手法です。また、開発プロセスにおいても、効率的かつ手軽に導入できる点が大きな利点となります。

*mAP(mean Average Precision):複数の物体を検出するタスクにおいて、各物体の検出精度を平均した値を計算することで、モデル全体の性能を総合的に評価する指標

関連技術の詳細 :こちらの弊社技術ブログ“Using diffusion models to generate synthetic data for real-life projects”をご覧ください。

Image-to-Image 適用例

  • 医療画像診断支援

医療画像診断支援AI開発においては、学習データとなる画像の不足が課題となっています。特に、希少疾患など症例数が限られているケースでは、高精度なAIモデルの開発が困難です。Image-to-Imageを活用することで、既存の医療画像から様々な病変のバリエーションを生成し、診断支援AIの学習データを充実させることが期待できます。

出典:”Kazerouni, A., Aghdam, E. K., Heidari, M., Azad, R., Fayyaz, M., Hacihaliloglu, I., & Merhof, D. (2023). Diffusion models in medical imaging: A comprehensive survey.

  • 製造業における品質管理

製造業における製品の品質管理は、目視検査に頼ることが多く、検査員の負担が大きくなっています。また、熟練検査員の不足や人為的なミスによる検査精度のバラつきも課題です。Image-to-Imageを活用することで、限られた不良品画像から様々な欠陥を模倣した画像を生成し、外観検査AIの学習データを増やすことができます。これにより、検査AIの精度向上と検査の自動化による省人化・効率化が期待できます。

出典:”Sousa, T., Ries, B., & Guelfi, N. (2024). Data Augmentation in Earth Observation: A Diffusion Model Approach.

  • 警備・防犯・都市計画等における群衆管理

イベント会場や駅など、多くの人が集まる場所では、安全確保や混雑緩和のために、群衆の密度や流れを正確に把握することが重要です。Image-to-Imageを活用することで、既存の画像から様々な密度や状況の群衆画像を生成し、群衆カウントAIの学習データを充実させることができます。これにより、群衆カウントAIの精度が向上し、より効果的な警備計画や都市計画の立案に役立てることができます。

出典:”Tan, X., & Ishikawa, H. (2023). Dataset-Level Directed Image Translation for Cross-Domain Crowd Counting. In International Conference on Image Processing.

 

Ridge-i の強み – 実プロジェクトにおける課題解決力 –

  • 先端技術を持ちいたソリューション開発

Ridge-iは、Diffusion modelをはじめとする最先端のAI技術を駆使し、顧客のビジネス課題解決に貢献しています。
最先端技術の研究開発はもちろんのこと、お客様の課題やニーズに最適な技術を選択し、独自にカスタマイズすることで、実用的なソリューションを迅速に提供いたします。

  • クライアントへの伴走による課題解決

また、技術力だけでなく、クライアントの事業に深く入り込み、課題・ニーズを的確に捉えながらプロジェクトを進めていくことで期待を超える成果を創出します。

 

 

▼本リリース内容に関するご質問や、AIソリューションに関するお問い合わせは、以下よりお気軽にご連絡ください。▼

その他の開発事例

  • AI開発のデータ不足を克服 | Image-to-Imageによるデータ拡張の可能性

    AI開発・MLOps設計
    DX戦略
    インフラ・プラント
    セキュリティ・防犯
    宇宙・衛星
    生成AI
    製造業
  • AI開発のデータ不足を克服 | Image-to-Imageによるデータ拡張の可能性

    AI開発・MLOps設計
    DX戦略
    インフラ・プラント
    セキュリティ・防犯
    宇宙・衛星
    生成AI
    製造業