(株)ディジタルメディアプロフェッショナル

技術ブログ

技術ブログ / 新着記事

  • 2014年10月02日
    【満員御礼】 DMP Computer Visionセミナー2014 開催報告 その3

    セミナー報告のその3と題しまして、午後2の部をご紹介します。

    ● 午後2の部
    セッション4: クロスコンパス CTO 佐藤氏

    IMG_2238

    午後2の部のはじめの講演は、「DeepLearningを用いた画像処理の可能性」と題して、株式会社クロスコンパスのCTO 佐藤氏から最近流行りのDeepLearningに関する講演がありました。

    Deep Learningは、ここ1、2年大きな脚光を浴びている技術です。
    GoogleやFacebook、MicrosoftなどIT関連のガリバーがいち早くDeepLearningを自社の事業に取り入れています。

    DeepLearningとは何? と思われる方もいらっしゃると思いますので少し解説しますと、DeepLearningとは文字認識や機械翻訳などを代表的技術とする「マシン学習」と呼ばれる技術分野の手法で、コンピュータにより自動的にデータに潜む構造を学習する際に、単純な特徴形状からはじめて、より総合的かつ抽象的な情報に変換しながら学習させることで高度な認識処理を行う技術になります。

    DeepLearningを適用することにより、物体認識や文字認識、音声認識などの認識率が従来よりも格段に高くなります。Google社はAndroid™の音声認識にDeepLearningを取り入れていますが、Android™の音声認識のエラー率はDeepLearningにより、従来に比べて25%低減することができたと言われています。

    余談ですが、Google社はDeepLearningを自社のR&Dで開発したわけではなく、ベンチャー企業を買収して技術を導入しました。
    2013年3月にGoogleはDeepLearningの先駆者であるジェフリー・ヒルトン (トロント大学教授) のベンチャー企業DNNresearchを買収、2014年1月には英国のベンチャー企業DeepMindを買収してます。DeepMindの買収額は約4億ドル。10人程の超優秀な研究者を獲得しました。そして、自社で開発していた技術をあっさりと捨ててます。(個人的にあっさりと自社の技術を捨てれる処もGoogle社の凄いところだと思います。)

    参考:http://www.itmedia.co.jp/enterprise/articles/1401/27/news117.html

    話を今回のセミナーの話に戻しますと、佐藤氏の講演では、DeepLearningが必要となった背景から技術的なメカニズムを平易な言葉でわかりやすく解説していただきました。
    佐藤氏のクロスコンパス社は、世界のIT企業の巨人が取り組んでいるDeepLearningに対して、同氏曰くおそらく世界初のGUIベースのツールを、これからDeepLearningを使ってみたいという顧客に対して提供しています。
    顧客は、ツールを使うことによりDeepLearning導入の技術障壁が低くなります。クロスコンパス社は、DeepLearningのツールを提供することで、最終的には知のプラットフォームの構築を目指しています。

    DMPが取り組んでいるComputerVision技術が、カメラから入力された画像情報をリアルタイムで処理し、顔認識をしたり人物認識をしたりと様々な付加価値をそこに加える技術であるのに対して、DeepLearningはその蓄積されたデータに対する分析技術となるため親和性が極めて高いです。
    今後Internet of Things(IoT)時代になり、身の回りの機器にイメージセンサーが付き、データが蓄積されていくに連れて(よくビックデータと言われていますね)、欲しいデータを正しく且ついち早く見つけることがますます重要になってきます。画像データと画像データの背後に潜むパターンを見出す能力を高めるためにはDeepLearningが今最もフィットした技術と言われています。

    ComputerVision技術に加えて、DeepLearningの今後の動向に注目していきたいです。

    特別講演2:三菱電機株式会社 ロボット製造部 課長 奥田氏

    IMG_2239

    このセミナーの最後のセッションは、三菱電機の産業用ロボットでのComputerVision技術の適用事例の話です。
    三菱電機 ロボット製造部 奥田氏から、産業用ロボットでのComputer Vision技術の適用に関して動画によるデモを交えながら解説いただきました。

    産業用ロボットは、従来人が行っていた作業を置き換えるために開発されました。
    人が意識せずに行っている、目で見て、物体を認識し、動かす、という作業を、ロボットの場合は、センサー技術とComputerVision技術、ロボット制御技術などを組合せて実現しています。3次元ビジョンセンサーにより、対象物体の色と3次元情報(奥行き含めた距離情報)を入手し、認識アルゴリズムによって物体をどうやって掴むか考え、実際に物体を掴み動かす。文章だと簡単に思えるかもしれませんが、この動作を実現するには、モデルレス認識(部品形状を正確に認識するのではなく、部品を把持できる位置を探索する三菱の独自技術)、モデルマッチング認識、柔軟物認識などの様々な要素技術を高次元に統合しなければなりません。いわば産業用ロボットは、三菱の高い技術が統合化された成果物となります。

    奥田氏の講演では、上記のロボットを実現するための各要素技術をひとつづつ丁寧に動画や絵によるスライドを交えながら解説いただきました。
    詳細は割愛させていただきますが、今回の講演を通して、産業機器や自動車など高い性能と品質を実現しているのは、ロボットの力によるところも大きいことを学びました。
    また、奥田氏と講演後お話をしたところ、ロボットの開発自体は、私が思っていたよりも少数で開発されていることに驚きました。どこの技術分野でも卓越した製品は少数チームから生まれているんだなと思いました。



    今回の技術Blogで、ComputerVisionセミナーの報告は終了となります。
    この技術Blogで3回にわたって各講演の概要を紹介しましたが、お読みいただいた方々に少しでも内容が伝わると嬉しいです。

    ComputerVision技術は、スマートフォン、タブレットなどの民生機器から車載やロボットなどの産業機器まで幅広い分野で適用され始めています。
    今後東京オリンピックが開催される2020年に向けて、日本だけでなく世界中の企業が新しい製品を開発しようとしています。新しい製品を生み出す上で、ComputerVision技術は1つの重要な要素技術の役割を担います。
    DMPは、ComputerVision技術(もちろんグラフィックス技術を含めて)の提供を通して、モノづくりの技術革新に貢献していきたいと考えています。

    最後に長文となり、また拙い文章をお読みいただき、誠にありがとうございました。
    来年もおそらく技術セミナーを開催すると思いますので、その際にはまたよろしくお願いします。

    引き続きDMPのご支援よろしくお願いします。

PAGE TOP