ディープラーニング技術を用いたエッジコンピュータによる高速な画像認識ソリューション

株式会社 日立超LSIシステムズ(以下、当社)は、独自のディープラーニング技術を用い、単眼カメラの入力画像から自動車、人物、白線などの物体を検出し、物体までの距離を測距する技術を開発した。これを用いた「画像認識ソリューション」を2018年6月より提供開始している。

安価な小型の組込み向けGPU(Graphics Processing Unit)モジュール(Jetson TM TX2)と単眼カメラを組み合せ、リアルタイムな物体検出および測距を実現し、高度な認識技術を必要とする人工知能型アプリケーション開発を支援していく。

開発の経緯

近年、人工知能による映像・画像の解析技術や、ディープラーニングによる人に近い視認性をもつ画像認識技術は、周辺環境の安全性把握や障害物検知などが必要とされる監視カメラ、自動運転やロボティクスなどの様々な分野で実用化されている。これらの分野ではリアルタイム応答性能や高度な組込み技術が求められる。

当社ではこれまで長年培ってきた複数プロセッサでひとつのタスクを実行する並列処理技術と、組込み機器で高速処理するエッジコンピューティング技術を融合することによってこうした要件に応えてきた。

今般、リアルタイム画像認識分野で拡大する人工知能活用の需要に対応すべく、ディープラーニングをエッジコンピューティングに実装し、工事現場、工場、オフィス、交差点などで安全性を確保する監視システムや車載、ロボティクス分野における自動走行システムなどのお客さまのアプリケーション開発に貢献するソリューションを開発した。

特長と優位性

開発したソリューションは、ディープラーニングによる物体検知と単眼カメラ測距のソフトIP(Intellectual Property)から構成される(図1)。

図1 システム構築例

さらに、プロフェッショナルサービスを追加いただくことにより、学習用プラットフォームを整備し、再学習や追加学習が可能な環境の構築、お客さまシステムへの実装、動作確認を対応可能とする。主な技術的特長と優位性を以下に示す。

1)低リソースでの物体検知
当社独自のアルゴリズムに基づく評価では、カメラからの距離が20m以内の人物、車の検出は約90%の認識精度を実現している(評価は車載カメラを用いNVIDIA社製の組込み機器モジュールJetsonTM TX2上で行った)。

OpenコードのYOLO(You Only Look Once)1) 、SSD(Single Shot MultiBox Detector)2) と比して推論時間は短く、少ないメモリ所要量で検知できることを確認した(図2)。

図2 当社DNN(Deep Neural Network)とOpenコードとの性能・精度比較(JetsonTM TX2)

2)組込み向けGPUモジュールによる小型・低消費電力実装
組込み向けGPUモジュールに実装可能なのでリアルタイム、低消費電力化が可能となる。

3)単眼カメラでの測距
測距を行うためには、ステレオカメラやレーダ系のセンサを用いることが一般的である。開発したソリューションでは単眼カメラを用いることにより、安価で小型ポータブルな実装が可能となる。

ディープラーニングにより検出した認識枠底辺までの距離を射影変換に基づき導出し、物体検出枠のトラッキング補正によって精度向上を実現した。

開発事例

現在、当社では高度な画像認識技術を用いて安全性確保や業務プロセス改善を望まれるお客さまとの協創活動を通して、ソリューションの社会実装を推進している。以下に開発事例の一部を紹介する。

1)交差点監視
交差点での車両や人物の流れを動的に把握し、車両監視や事故予防の実現が可能となる(図3)。

図3 交差点監視

2)ドライブレコーダ
車両に設置したカメラで先行車、人物、白線などを検出し、ドライブレコーダの映像を用いた運転行動分析や運転手の安全運転支援を実現する(図4)。

図4 ドライブレコーダ

3)人物把握
広角レンズによるカメラ映像から、広範囲の監視領域における人物数や行動パターンを把握する。防犯、マーケティングへの活用が可能である(図5)。

図5 人物把握

4)エレベータ監視・室内監視
エレベータや室内のカメラ映像から人物把握や入退監視が可能になる(図6、7)。

図6 エレベータ監視

図7 室内監視

市場動向と当社対応

ディープラーニング技術を用いたエッジコンピュータによる高速な画像認識ソリューションは自動運転、ロボティクス分野で今後も伸張が期待される。当社としては大きく次の対応によってお客さまの課題解決につながるソリューション開発を推進する。

(1)さらなるDNN計算の軽量化による高速化
(2)複数のDNNをリアルタイム動作させるアプリケーション開発
(3) 需要に合致した多種多様なカメラに基づく学習データの拡充
(4)誤認識対策を含めた学習データの効果的選定技術およびディープラーニングシステムの品質保証

応用/ユーザメリット

 開発事例で示したように、ディープラーニングを画像認識に適用するソリューション開発は自動運転のみならず、様々な現場の安全確保や事故防止、人流把握など、これまで専門家の知見や知識に頼っていた多くの分野で適用を広げている。

こうした取り組みによりユーザ視点では、安価なカメラと小型のエッジコンピューティングを用いて要望に合わせた物体(特殊車両、自転車、バイク、特徴的人物など)を自由に検出できる。さらに市場動向に対応した当社開発成果の活用により応用分野の拡大に寄与できるものと考える。

今後の展開

今後、お客さまの課題解決やビジネスの成長に資するディープラーニングの業務への適用範囲はますます拡大していくものと思われる。

当社は、拡大する需要に対応すべく、ディープラーニング技術をエッジコンピューティングに実装することで、処理の高速化、人的作業の効率化に貢献し、省電力で安全、安心な環境を実現するソリューションを提供していく。

※映像情報インダストリアル2018年9月号『画像認識は新たな次元』特集より転載

※商標注記
NVIDIA、Jetsonは、米国および/または他国のNVIDIA Corporationの商標および/または登録商標。

■ 参考資料
1)YOLO:You only look once : https://pjreddie.com/darknet/yolo/
2)SSD:Single Shot MultiBox Detector : https://github.com/weiliu89/caffe/tree/ssd

問い合わせ
株式会社 日立超LSIシステムズ
TEL:042-512-0845
http://www.hitachi-ul.co.jp/public/jp/inqury/inqury.html

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

このサイトはスパムを低減するために Akismet を使っています。コメントデータの処理方法の詳細はこちらをご覧ください