コンピュータビジョンの先端技術で未来を見据える VISION&IT Lab 代表 Dr. 皆川卓也

2017.06.13 記者:佐藤 愛美 編集・校正:やつづか えり 撮影・取材サポート:神谷 亮平 インタビュー

コンピュータの視覚をつくる技術、コンピュータビジョン。今回は、そのスペシャリストである皆川卓也さんにお話を伺いました。個人事業主としてVISION&IT Labを立ち上げている皆川さんは、これまでに数多くのコンピュータビジョンを用いるアプリやシステム、サービス開発に従事してきました。また、定期的に勉強会を主催し、コンピュータビジョンの最先端を探求し続けています。

皆川さんの仕事における信念や、コンピュータビジョンの魅力とは……?

このエントリーをはてなブックマークに追加

コンピュータビジョンに特化した専門性の高いサービス

▲VISION&IT Lab のwebサイトより

はじめに、皆川さんの現在のお仕事の内容について教えてください。

現在は個人事業主として仕事をしています。「アカデミックとビジネスをつなぐ」というスタンスのもと、VISION&IT Labを立ち上げ、コンピュータビジョンに関するコンサルや受託研究開発、マネジメントなどを行っています。

R&Dコンサルティングや開発マネジメントなど、コンピュータビジョン分野に的を絞って様々な業務を行っているのですね。

何でも屋のように色々やってます(笑)。R&Dコンサルティングでは、お客さんのまだ明確になっていない「これをやってみたい」というニーズを一緒に掘り下げ、目的にマッチする技術を提案し、最終的にはプロトタイプまで作っていきます。あとは、高い専門性が必要なコンピュータビジョンに関する研究および開発業務や、開発に際するマネジメントの代行、コンサルティング業務などをやっています。コンピュータビジョンは最後まで作ってみないと実際の精度が分からないというリスクがあるため、開発業務に関しては成功報酬型で行う場合もあります。

他にも、シーズとニーズを繋いで事業化するための「ビジネス化コンサルティング」も行っています。

「有名人の誰に似てる?」コンピュータビジョンの技術をユニークな携帯サービスに活用

皆川さんがこれまでに開発した代表的なプロダクトについて教えてください。

独立する前、2007年にリリースされた「顔ちぇき!」は、モバイルプロジェクトアワード2007で、コンテンツ部門優秀賞を受賞しました。こちらは顔認識技術を用いて、顔写真がどの芸能人と似ているのかを判定する携帯サービスです。当時はまだメジャーではなかった顔認識のシステムを、どう売り込んでいくか考えたのが開発のきっかけです。まだ認識率が十分でないシステムであったものの、「有名人の誰に似ている?」と曖昧さを許すことで、エンターテイメントとして仕上がった面白い事例ですね。

開発の過程で、お客さんがどうも使い方を理解するまで至っていないことが分かり、アイコンや説明の順番を変えてみたところ、すんなり理解してくれるようになったんです。この経験から、インターフェースの大切さを学びました。シーズをニーズに結びつけるためには、実際に動くものをユーザーに使ってもらい、そこからフィードバックをもらって改善していく営みが必要なのだと実感しましたね。

ホームページで紹介されている実績の中に「歯科プロジェクト」という面白い形のプロダクトがありますが、これは何ですか?

これは、2003年から2004年まで在籍していたベンチャー企業で携わったプロジェクトです。関係者の間では「顎関節解析システム」と呼ばれていました。これは、より噛み合わせの良い入れ歯を作るため、コンピュータビジョンを用いて下顎関節の三次元的な動きを追跡するシステムなんです。会津の歯科とチェコ工科大学の共同プロジェクトで、私が初めてコンピュータビジョンの可能性に触れたきっかけでもあります。

35歳までには自分の名前で仕事を取れるようにしたい

皆川さんは現在にいたるまで、どのようなキャリアを築いてきたのでしょうか。

慶応大学の修士課程では、小沢・斎藤研究室にてコンピュータビジョンの研究をしていました。卒業後は、インターネット関連の仕事がしたいと思い、Hewlett Packard(ヒューレット・パッカード)に入社。私は計測機器を扱う部門に配属されたのですが、入社して半年後くらいにその計測機器部門が分社化して別会社になり、その会社に移籍しました。そこでは、プリセールス・プロジェクトマネージメントのような仕事をしていました。ウェブサービスやメールサービスの運用会社向けに、応答時間レベルできちんと動いているかを監視するソフトウェアを提供する仕事でした。今はフリーツールで簡単にできてしまうことですが、当時は違ったんですよ。

最初に勤めた会社は、コンピュータビジョンを扱うところではなかったのですね。

そうなんです。4年半ほど仕事をしたのですが、ITバブルが弾けてリストラをされてしまいました。実はその時、開発の仕事をしたくて転職活動をしていたんです。タイミング良く辞めるきっかけができたので、リストラは逆にありがたかったですね(笑)。

前職で開発の経験がなかったため、なかなか転職活動は苦労しましたが、辞めて1〜2ヶ月後、ベンチャー企業に拾ってもらいました。日本の社員は私と事務員の女性だけ、あとはインドにエンジニアが数名という小さな会社だったんですが、その会社のCTOの方が、大学でコンピュータビジョンの研究をしている先生たちとコネクションを持っていたため、企業との間に立って大学の技術を実用化するといった事業を行っていたんです。私はそこで、お客さんの要求に合わせた開発や、プロジェクトのマネージメントを担当していました。

なるほど。転職先でコンピュータビジョンの開発を経験したのですね。

その後、会社が中小企業に吸収されてしまい、CTOと一緒に私も吸収先の会社に移りました。ところが、その会社がいわゆるブラック会社だったため、1年ほど働いた後にまた転職をしました。

次に入ったのが、Neven Visionという会社です。そこの日本支社で、アメリカの本社で開発された顔認識エンジンを、日本の企業向けにアプリ化する仕事をしていました。日本ではようやくデジカメに顔認識エンジンが搭載された時期で、技術としてはホットだったんですよ。日本のお客さんは着実に増えていたのですが、ワールドワイドで見ると実績が振るわず、Googleに買収されました。Googleにアメリカ本社の開発人員以外はいらないと判断されて、私は二度目のリストラをされてしまいました。

二回目のリストラですか! 波乱万丈ですね。

いい加減振り回される働き方は嫌だなと思いましたね。そして、海外のコンピュータビジョンの技術を日本に持ってくるだけでなく自分で作りたい!という思いが高まっていたので、二回のリストラの退職金もあるし、仕事を一旦中断してじっくりと腰を据えて改めて勉強をしようと決めました。出身研究室の斎藤英雄先生に相談に行くと、仕事を中断してしまうのはもったいないからと、社会人博士を勧められました。

働き先をどうしようかと悩んでいた時、Neven Visionの日本支社のトップだった宮田さんに声をかけてもらい、大学に通いながら宮田さんが新しく立ち上げたジェイマジックという会社にジョインすることになったんです。実は、Neven Visionで働いていた時、ウェブサービス用に顔認識を利用する計画があったのですが、それをジェイマジックでやってみようという流れになり、でき上がったのが「顔ちぇき!」です。

社会人博士過程と仕事の両立、さぞ多忙だったと思います……。

博士号を取るのは本当に辛かったですね〜(苦笑)。査読付きの論文を通すのに苦労したり、時間がない中で博士論文の執筆を行っていました。結局、博士号を取るまでに7年かかりました。

途中で学業との両立が難しくなり、勤めて約3年でジェイマジックを退社したんです。その時34歳だったのですが、もともと自分の中で「(転職が厳しくなると言われている)35歳までには自分の名前で仕事をとれるようにする」という目標を持っており、独立して個人事業主になりました。独立後には、食品や食玩向けキャンペーンのためのARや、ナンバープレート認識プログラム、ディープラーニングを使った車両検出など、他にもいくつかの開発に携わってきました。

最先端の技術を学ぶ勉強会を主催

皆川さんは「コンピュータビジョン勉強会」を主催しているそうですね。

勉強会を始めたきっかけは、私が博士課程の時に参加した読書会なんです。「パターン認識と機械学習(Pattern Recognition and Machine Learning)」という本の読書会だったんですが、そこで知り合った人たちと、コンピュータビジョンのトップカンファレンス(国際学会)の論文読み会をやりたいよね〜と話していて……その流れで私が主催することに。

最初は論文を読むのではなく「コンピュータビジョン最先端ガイド」という本を読むところから始めました。参加者の間口が広いところから始めて、論文の読み会はしばらく経ってから開催しました。

コンピュータビジョン最先端ガイド」の読み会では、実際に執筆された中部大学の藤吉先生や当時はオムロンにお勤めになっていた現中部大学の山下先生が来てくださることもありました。その時は、ご本人に直接解説していただくという大変貴重な会となりました。その会のためにわざわざ遠方からお越しくださったんです。とてもありがたかったです。

現在は、読み会だけでなくコンピュータビジョンに関することであれば何でもOKというスタンスで勉強会を行っています。毎回申し込みは100人を超え、若手の先生や博士号を取り立ての人、企業の技術者、学生など、これから勉強したい人々が集まってくれています。

発表者も勉強をするために来ているので、分からないことは分からないまま来てくださいと呼びかけています。

私自身が勉強をしたいというのと、外部からの刺激がほしいので、こういった機会を設けることができるのはありがたいと思っています。

皆川さんが注目している技術や、今後の展望があれば教えてください。

IoTの分野でコンピュータビジョンをどう使っていけるかに興味があります。センシング技術の中でコンピュータビジョンの果たす役割はとても大きいと思うんです。

大手IT企業では、自社のIoTプラットフォームにユーザーを引き込むために無料でツールを公開しています。不特定多数の一般ユーザーに向けたコンシューマービジネスもいいのですが、私は一人一人のお客さんのやりたいことをきちんと理解した上で、提案したり改善したりできるようなソリューションを将来は作りたいです。そういう中で、IoTに触れていきたいですね。

また、今は一人でやっていますが、将来的には法人化も視野に入れています。技術的な刺激を与え合えるような人と一緒にやっていきたいですね。

リアルとバーチャルを繋ぐコンピュータビジョンの可能性と面白さ

皆川さんが仕事をする上で大切にしている信念とは?

目的思考ですね。お客さんの話を聞いていくと、私に依頼されていることとお客さんの目的がマッチしていないケースもあるんです。例えば一から作るより、他から買ってきた方がお客さんの状況にマッチするような時には、正直に「私に頼まず他から買ったほうがいいですよ」と伝えて、知っている商品をお勧めしたりしています。

お客さんがやりたいことに対して、自分が思っていることは正直に言うようにしているんです。その結果、仕事の依頼は来なくても、そのほうがお客さんのためになるんじゃないかという考え方です。

皆川さんにとってコンピュータビジョンとは?また、コンピュータビジョンの可能性についてどう思いますか。

コンピュータビジョンは、リアルとバーチャルを繋ぐゲートウェイだと思っているので、その両者を繋ぐ技術を開拓していきたいですね。現実の状況をうまく理解し、仮想空間上に持っていって解析やシミュレートをし、それを現実にフィードバックする。コンピュータビジョンのそういった役割はとても面白く、まだ未開拓の応用先があると思っています。これからもコンピュータビジョンの可能性を探求し続けると同時に、リアルとバーチャルを繋ぐ様々な技術の開発や、色々なお客さんの話を聞いて、新たな領域を開拓していきたいです。

佐藤 愛美

今では私たちのまわりに当たり前に存在するコンピュータビジョン。コンピュータビジョンの技術が社会に普及し始めた当時のエピソードは、とても興味深いものでした。

また、「リアルとバーチャルを繋ぐゲートウェイ」という言葉も印象的ですね。今後も、様々なフィールドでコンピュータビジョンの技術が活用されていくのではないでしょうか?ユーザーの一人として楽しみにしています。

- WRITER PROFILE -

首都圏を中心に取材・執筆を行うフリーライター。福祉業界で働いていた経験を活かし、人の代弁者となり魅力を引き出せるような記事作成を目指している。

連絡先(Facebook)
このエントリーをはてなブックマークに追加

記事一覧