お問い合わせ

クラウドで運用できる画像認識機能
「Cloud Recognition」とは

AR技術を支える画像認識

Wikitudeが提供するクラウドベースの画像認識機能「Cloud Recognition」について紹介します。まずは、この機能のメリットを理解する上で欠かせない、コンピュータービジョンの画像認識技術の発展と画像認識の機能にある課題について触れていきます。

ソリューション

画像認識の発展とARの進歩

近年、画像の合成や復元、特徴点の抽出などにおいて、コンピュータービジョン(CV)の技術は発展してきました。その一つである画像認識の技術についても精度が大いに向上し、様々な形で利用されています。

コンピュータービジョン技術の発展はコンピューターグラフィックス(CG)技術の発展と合わせてAR技術の発展につながり、今日ではたいていのARライブラリで画像認識が一機能として取り入れられるようになりました。

画像認識の利用方法についても、変化が見て取れます。近年では複雑な画像(いろんなものが写っている画像)でも個々の情報として認識できるようになったため、黎明期に多かった白黒のシンプルな二次元バーコードのARマーカーに取って代わり、画像そのものをARマーカーにするアプローチが出てきているのもその一例です。

また、リアルタイムにデバイスのカメラで画像を読み取り、検索情報として画像に照合する情報を返したり、画像そのものユーザーインプットの要素として扱ったりできるようにもなってきています。

画像認識、画像追跡の機能は様々なARライブラリに取り込まれるように

画像認識の機能は、iOS向けの「ARKit」やAndroid向けの「ARCore」といったOSベンダーによるARライブラリにも取り入れられ、提供されています。

数多くのエンジニアにARアプリの開発プラットフォームとして利用されている「Unity」においては、ARKitおよびARCoreを内包して両プラットフォームのアプリを開発できる「ARFoudation」が提供されており、その中の一機能として「ImageTracking」のAPIが含まれています。利用しているOSプラットフォームにかかわらず、画像認識の機能を手軽に取り入れられるようになっています。


[写真1:iOSでもAndroidでも画像認識の機能がデフォルトで入っている]

ネイティブのARライブラリの課題

様々なARライブラリの機能として取り入れられるようになった画像認識機能ですが、課題がないわけではありません。

まず画像認識を行うには、認識のターゲットとなる画像セットとそれに対応した辞書データである「メタデータ」が必要です。しかし、これらのデータは基本的にアプリの中に内包されるため、データが大きいとアプリが肥大化し、端末のディスク容量を逼迫してしまうといった課題があります。

また、画像セットとメタデータがアプリに内包されるということは、これらのデータの更新を行う際にアプリのリビルドと再配布を行わなければならないということ。ストア配布しているアプリの場合は再審査のプロセスが必要になるので、更新リスクが伴います。このように、画像認識の機能をアプリに取り込むには、「容量」や「更新性」という点で一定の課題があるのです。



[図1 ネイティブライブラリを使った場合の課題]

画像認識の機能を「クラウド」で開発する課題

こうした課題をクリアするための選択肢として、「クラウド」側に画像認識の機能を持たせるという方法があります。クラウド側で画像認識を行い、返ってきた結果に基づいてアプリ側で処理をする――という仕組みにすれば、リビルドや再配布のプロセスを経ることなく、画像セットとメタデータを逐次更新しながら運用することが可能になります。

独自でクラウド上で画像認識エンジンを実装するには

一方、クラウドで画像認識機能を持たせたアプリを開発するとなると、以下のような課題が出てきます。

@独自で画像解析のエンジンを開発する
サーバ側で画像認識を行うには、アプリでデバイスのカメラによるシーンキャプチャや高度なシーン処理を行い、カメラで撮影したフレームをサーバ側のキューに送り(以後、「スキャンコール」と呼ぶ)、それを解析して検出された画像データが「何の画像か」という結果を返すという機能を実装しなければなりません。

画像解析機能については、独自でアルゴリズムを用意するのも可能ですし、Amazon Web Service(AWS)やGoogle Cloud Platform(GCP)などにある画像認識サービス・機械学習(ML)サービスを利用する方法もあります。

A認識した画像と辞書データを対応させる
スキャンコールし解析された画像に対して、これが「何の画像か」という結果を返す機能が必要であることは先に触れました。この機能を動かすには、解析された画像とメタデータと紐付ける必要があります。

しかし、AWSなどのクラウドサービス画像認識サービスの場合、そのまま利用してもサービス側があらかじめ用意した学習セットに基づいた一定のカテゴリの分析までしか行えないケースが多いです。この場合、さらなる画像セットの学習と画像に対してメタデータを追加し紐付ける機能を実装していかなければならず、非常に大きな作業負担が伴います。

B @・Aを管理するためのCMS的なシステムを構築する
@とAでご紹介した画像解析機能やメタデータと対応する機能を実装しても、管理・更新の作業はエンジニアしか対応できません。アプリのリリース後は別の担当者が運用を引き継ぎ、認識の対象にする画像を新しく追加したり、削除したりするでしょう。そのためには、運用者が変わっても容易に更新できるCMSのようなシステムの構築が不可欠です。
サーバで対応できる画像認識機能を独自に実装するとなると、このように大きなハードルを越えていく必要があります。結果的に、独自開発には膨大な開発コストと開発期間を要することになるでしょう。しかも、仮に開発したサービスが実際に使いたい仕様とずれてしまった場合、かけた開発コストがまるまる無駄になってしまうリスクもないとは言い切れません。


[図2 クラウドで画像認識する場合の全体図と課題]



クラウドを使った画像認識エンジンでアプリを開発する条件

以上のことから、次の要件を満たさないケースにおいて、独自にクラウド上の画像認識機能を開発するメリットは生まれてきません。あらかじめこれらを満たしたサービスを利用したほうが、開発コストを抑えられるでしょう。

・クラウドの処理でも精度が高く速いレスポンスで処理できる
・リビルドや再配布を介さず認識する認識ターゲットの画像とメタデータを更新できる
・認識ターゲットの画像とそのメタデータをシステムで管理できる
・アプリ側でもプラットフォームごとにクラウドとの連携処理を実装することなく汎用的に扱える

Wikitudeの「Cloud Recognition」で手軽に
クラウド認識サーバを自分のものに

ここまで画像認識機能をアプリ上で実装する課題、クラウドで画像認識する機能を開発する際の課題を述べてきましたが、Wikitudeの「Cloud Recognition」を利用すればこれらの課題をまとめて解決できます。

クラウドでも高速でスケーラブルで安定した画像認識を実現

「Cloud Recognition」はクラウドベースの画像認識機能で、カメラで撮影した画像データ情報をRecognitionサーバ上で検索し、照合されたメタデータの情報を返すことができるサービスです。画像認識を高速で、スケーラブルで、そして信頼性の高いかたちでオンライン認識することができ、認識時に安定した画像追跡も可能です。

下記のPaperPlusの例は「CloudRecognition」を活用して定期的に配布している新聞に常にイメージトラッキングの機能を提供しているものです。このように「CloudRecognition」を利用すれば、定期的配布するメディアに対して認識ターゲットの画像データを追加・更新して常に新しい画像認識の体験を提供し続けることができます。


PaperPlusの動画

Cloud Recognitionで大規模かつシンプルな更新運用

Wikitudeの通常のImageTracking機能でも1,000個のデータを認識することが可能ですが、「Cloud Recognition」ならそれを超える多数の画像認識ターゲットを保持することが可能です。下記の動画のようにRecognitionサーバと通信するためリビルドは不要で、認識ターゲットの画像およびメタデータもCMS的に手間なく管理することができます。


CloudRecoginitionの動画

また、Wikitudeライブラリによりクライアント開発においてもOSに依存することなくマルチプラットフォームで対応することが可能。プラットフォームごとにクライアント側でRecognitionサーバとの連携を実装する必要はありません。

アプリのUI/UXを工夫して効率よくスキャンコール

「Cloud Recognition」は、各商用ライセンスで毎月1,000,000回のスキャンコールが可能です。
継続的に画像を認識し続ける方法で実装すれば、リアルタイム性の高い認識を実現できるでしょう。もしスキャンコールを抑えたい場合には、「画像認識をする際にタップなどのユーザー操作を一度介してAPIリクエストを行う」といったアプリ上のUI/UXの部分で工夫をすることで、不要なリクエストを減らせます。

トライアルライセンスの活用で低コスト、低リスクで導入

事前に試してメリットを確認したいという方には、45日間のトライアルライセンスをご用意しています。無料で1ヶ月にアップロード1,000枚まで試すことが可能なので、低コスト・低リスクで導入できる「Cloud Recognition」をぜひ検討してみてはいかがでしょうか。

※記載されている会社名および製品名は、各社の商標および登録商標です。

wikitude無料ダウンロード、体験版
選ばれる理由 ブログで情報公開中

お気軽にお問い合わせください

AR/VRのご相談やお見積り依頼などお気軽にご連絡ください。