誰でも簡単に映像解析技術を利用できる、それをミライノフツウにしたい フューチャースタンダード CTO鈴木秀明

2017.04.03 記者:佐々木 美悠 編集・校正:やつづか えり 撮影・取材サポート:神谷 亮平 インタビュー

株式会社フューチャースタンダードCTOの鈴木秀明さんは、以前はNECのエンジニアとしてストレージの開発・製造に関わっていました。

今回は、株式会社フューチャースタンダードのオフィスにお邪魔し、鈴木さんが関わる映像解析技術の可能性や、スタートアップにおけるCTOの役割についてお話を伺いました。

このエントリーをはてなブックマークに追加

映像解析の機能をワンストップで利用できるクラウドプラットフォーム

開発している製品やその活用事例を教えていただけますか?

主な製品は映像解析のプラットフォームである「SCORER(スコアラー)」です。他には、開発者向けにブラウザベースのIDE(統合開発環境)を同梱して開発キット化した「SCORER SDK」や、監視カメラ向けのソリューション「SCORER Surveillance」があります。

大体、映像解析を行うシステムを作ろうとしたら、映像を撮影するカメラ、撮影した映像を処理するハードウェア、データを転送するネットワーク、映像解析のアルゴリズムが必要になります。従来は、それらのパーツを別々に開発・調達して組み合わせ、特注のシステムとして構築する方法が一般的でした。そのため、非常に高価なシステムになりがちだったんです。

しかし最近は、安価なカメラと「Raspberry Pi」などの小型で十分な計算能力を持ったコンピューターが容易に手に入るようになり、通信コストも下がりました。手軽に利用できるクラウドコンピューティングも普及しています。そして、アルゴリズムは、どんどんオープン化が進んでいます。

弊社はそこに着目しました。それらの汎用パーツを上手に組み合わせると、様々なニーズにもフレキシブルに対応可能になる、カスタマイズ性と低コストを両立した、映像解析システムを作ることができます。それが「SCORER」というプラットフォームです。

「SCORER」は、「Raspberry Pi」などのボード上でエッジ解析※1をするためのミドルウェアと、さらに高度な映像解析を担当するクラウド上のシステムで構成されます。

弊社では「SCORER」の有効性を自ら証明するため、映像解析システムの受託開発もしています。

例えば、ホテルのフロントに置ける小型のパスポートリーダーのシステムを納品しています。法令で義務付けられたパスポートの写真保管だけでなく、国籍番号や名前も自動で認識し、業務を楽にしてくれる装置ですね。

タイヤの溝の深さなど、色々な長さを採寸するシステムもあります。普通に長さを測ろうとすると、定規や巻尺を当てると思うのですが、映像だけで長さがわかると嬉しいケースというのは多々あります。接触しなくていいので、格段に手間が少なく、素早くできますからね。

これは受託ではありませんが、株式会社クレストさんと共同で、広告や店頭のディスプレイに対し、通行人がどの程度関心を示したかを数値化・分析するカメラ「Esasy(エサシー)」の基盤部分も開発しています。弊社の「SCORER」と、クレストのデータ可視化ツールを、BigQuery※2で繋いだシステムです。

「SCORER」の強みは何でしょうか?

製品の強みは、やっぱり短期間で安く開発できることですかね。

また、弊社はスタートアップであることも強みだと考えています。既存メーカーとのしがらみが少ないので、「自社系列のカメラしか採用できない」「競合他社のアルゴリズムは採用しにくい」といった、ビジネス上の制約が少ないのはメリットですね。誰とも平等に組みやすいというか。みんなウェルカムで、弊社と同様に映像解析システムを作っている企業にも、弊社のプラットフォームを利用して、沢山儲けてほしいと思っているくらいです。

スタートアップのCTO職に活かされる、大企業の経験とノウハウ

鈴木さんのこれまでのキャリアと今のお仕事について教えてください。

マサチューセッツの州立大学でコンピュータサイエンスや数学、物理などを学んだ後、ボストンで採用活動をしていたNECに入社しました。NECでは15年くらいエンタープライズ向けのストレージ製品の開発をやっていました。

AmazonのAWSにはS3というストレージのサービスがありますが、その裏はどんなサーバー構成になっているか、普通は気にしませんよね。私がNECで開発していたのは、技術的には、それに近いものでした。ですので、製品のどの部分が壊れてもデータだけは絶対に守るという高信頼性や、どれだけ負荷が高まってもうまくスケールアウトできて性能を自在に増やせるとか――、そういった設計・開発のノウハウをいろいろ学びました。

ですので、製品としては、高信頼かつスケーラブルなソフトウェアを、いかに早く創り上げるかということにフォーカスしてやっています。

特にCTO的な仕事としては、もちろんスタートアップなのでコードも沢山書いていますが、開発方針やマイルストーンを決める、ミドルウェアの選定やアーキテクチャのレビューなど俯瞰的な技術フォローをしています。前職の経験という意味では、エンジニアが陥りやすい“ハマりポイント”を見つけて上手に避け、開発のスピードを出すことにも取り組んでいます。あとは、オフショア開発もしているので、ちゃんと成果を出してもらうためのフォローとか。

なぜ転職されたのでしょう?

NECには沢山の優秀なエンジニアがおり、色々なことを学ばせていただいたのですが、ある時、自分一人で実践したいと思うようになり、最初はフリーランスへと転向しました。それから1年ほど、人工知能や画像処理の分野で活動し、オープンソースのプロジェクトにも参加していました。

ある日、人工知能の勉強会で出会った方に「画像処理もやっているならこんな会社でちょっとバイトしてみない?」と誘われて、今の会社でアルバイトを始めたんです。そうしたら、あれよあれよという間に2番目の社員になってしまった(笑)。

スタートアップならではの、CTOの役割はなんですか?

自分が知っている落とし穴を事前によく知らせることかな。NECでごく当たり前だったことって、実は長年培われたノウハウであって、先輩エンジニアから受け継がれてきたのだと思います。例えば、品質の考え方やバグのフィードバッグの仕方など、技術の中でも、比較的、変化のゆっくりした部分ですね。それをスタートアップの若い人達は知らないことが多いなと感じます。なので、ちゃんと伝えていく。知らないと、みんな見事に落とし穴を踏んでしまうんですよ。

それから、技術的に難しい課題に対面した際に、若いエンジニアは「できる・できない」の判断がつきにくいと思うんですよね。私から見て「そりゃあ筋が悪い、茨の道だ」と思う解決方法をすごく頑張ってしまったり、反対に、あと1日もやれば完成できるところまで来ているのに、本人にゴールが見えなくて停滞していたり。その状況を横から観察して、会話を通してうまく自己解決できるように導いたりします。

開発部門全体を見る、という立場としては、分かりやすい目標を作ることですかね。例えば、単に「この機能を作りましょう」ではなく、「あなたがこの部分を開発することによって、こういうユーザーさんが、こんな風に使うプロダクトになる」というところまで具体的にユースケースのイメージに落とし込む。そうすると、自分の担当部分の重要性も、自ら考えやすくなります。スタートアップは、とにかく仕事が多くて混乱しやすい、迷子になりやすいので、自分の取り掛かるタスクが明確になると、開発に集中しやすいと思います。

また、これからは人事評価にも着手していきたいです。評価基準としては大きく営業系と開発系があると思いますが、開発系はエンジニアでなければ評価基準は作りにくいと思います。CTOとして、そこをうまく作って回していきたいですね。

世の中の技術の進化で、2020年にはもっと面白い挑戦ができる

5年後、10年後の目標を教えてください。

まず会社をちゃんと存続させ、成長させることが目標です(笑)。その結果として、その辺にある普通のカメラでも、スマホでアプリをダウンロードするのと同じ感覚で、誰でも簡単に映像解析できてしまうということを目指しています。

その映像解析というのは何でも良くて、例えば、「漁師さんが海から帰ってきて、魚の数を数えたい」という時に船にカメラを設置したら、アプリによる映像解析で簡単に数えてGoogle Spread Sheetに自動入力してくれる……とか。「種を蒔いた植物の観察したい」という時に、量販店で手に入るようなWebカメラにアプリを入れれば、芽が出たり花が咲いたタイミングで LINE に通知してくれ、その日のタイムラプス動画を送ってくれるとか……。土の乾燥を検知して、自動で水やり、なんかもいいですね。

今現在でも、エンジニアなら趣味的にDIYでできたりするんですけどね。じゃぁ、小学生でも作れるか? というと難しいですし、非エンジニアな大人でもしかり。「数万円もする専用のスマートカメラしか解がない、しかも欲しい機能はない!」なんてことにもなります。そこを、「SCORER」 を活用していただくことで「誰でもできて当たり前」の世の中を実現できたらなと思います。

世の中の動きとしては、今後5年、10年で着目している技術は2つあります。

1つ目が、4G LTE の次に来る「5Gネットワーク」※3です。「2020年までに来る」と言われています。5Gでは、回線スピードは現状の100倍、遅延も1ms以下と、大幅に改善します。そうなると、いろんなものが、よりリアルに感じられるようになると思います。例えばAR(Augmented Reality : 拡張現実)系/MR(Mixed Reality : 複合現実)系のアプリであれば、もっと密に素早く現実世界と映像がインタラクションできるでしょう。VR(Virtual Reality : バーチャルリアリティ)での描写もよりリアルになるでしょう。カメラ映像も、やり取りしやすくなる。弊社としては、この流れを掴みたいところです。

2つ目は「準天頂衛星システム」※4です。日本独自のGPSを可能とする人工衛星ですが、なんとGPSの精度が数cmレベルまで向上すると※5。これも、2018年には衛星が4機体制になって、本格的に運用が始まります。ここまで精度が良くなると、現実世界の色々なモノと映像に写っているモノを、格段にリンクしやすくなる。すると、今まで高額な測定装置や大量の計算パワーが必要だった空間把握や状況把握みたいなことも、エッジ解析だけで楽に完結できちゃうのかなぁと。まだまだざっくりしたイメージですが、新しい挑戦ができるんじゃないかなと考えています。

技術の進歩は日進月歩なので、5年後、10年後には当然もっといろいろなことができるようになっていて、その将来を起点とした「一歩先のミライノフツウ」を目指したいと思います。

※1 この文脈での意味は、カメラなどのセンサーデバイスから受け取ったデータを、クラウド上で処理するのではなく、センサーデバイスの場所で即処理してしまう方法。
※2 BigQueryは、GoogleがGoogle Cloud Platform上で提供する大量のデータを保管・処理するためのサービス。
※3 What Is 5G? (PC Magazine)。5Gを活用したサービス創出に向けてパートナー企業との連携を促進 - 一般のお客様にも体験いただける5Gトライアル環境「5Gトライアルサイト」を構築 -(NTTドコモ 報道発表資料)。
※4 準天頂衛星システム(Wikipedia)NEC 宙への挑戦「準天頂衛星システム」
※5 鈴木さん:これまでも RTK(Real Time Kinematic)等を利用し、高精度の測位は技術的には可能でしたが、 専用センサーやベースステーションを必要とするなど、誰でもが気軽に利用できるものではありませんでした。 準天頂衛星システムにより、国内では、高精度の測位を誰でも簡単に利用できるようになるのではと期待しています。
佐々木 美悠

映像解析を活かした技術が、こんなにも未来の生活を便利にしてくれるんだと驚きを隠せません!また2020年以降、どんな技術が生活者に定着しているのか考えると楽しみでしょうがないです。

このエントリーをはてなブックマークに追加

記事一覧