AIベンチャー「グローバルウォーカーズ」×PIXTA| 機械学習用教師データセットの共同販売を開始
グローバルウォーカーズ株式会社とピクスタ株式会社は、ピクスタの運営する素材のマーケットプレイス「PIXTA」で保有する人物画像データを、グローバルウォーカーズの提供する機械学習・深層学習向け教師データ作成サービス「Annotation One」にて、クライアント企業の要望に合わせた教師データセットとして作成し、販売開始する。
業務提携に至った背景
この業務提携により、クライアント企業に対して、要望にあった人物を主とした「画像収集」とアノテーション(タグ付け)された「画像データ」をまとめて短期間で提供することができるようになる。また、商用利用可能な人物画像(特に日本人)の収集に課題をもたれている多くのクライアント企業にとっては、有効な教師データを短期間で収集することができ、機械学習・深層学習の開発スピードの向上につなげることが可能になる。
特に、日本人の顔画像においては肖像権の観点から、インターネット上にある人物画像などを使って機械学習・深層学習の教師データにすることが難しく、教師データとして利用できるほどのデータ数を集めることも難しいのが現状だ。「PIXTA」の画像は数多くの日本人の顔画像を保有し、商用利用が可能なため、これらの画像にグローバルウォーカーズによるアノテーションデータを付与することで、効率的に画像収集し、教師データとすることが可能になる。
クライアント企業は教師データとして利用したい画像収集を依頼すれば、短期間で教師データを取得することができる。また、AI開発プロジェクトにおいて継続的なアノテーション作業が必要なクライアント企業向けに、専用のアノテータ―を利用いただくことが可能なラボ型アノテーション「GWラボ」も用意している。GWラボはグローバルウォーカーズのミャンマー法人で運営しており、安価かつ熟練したアノテータ―による高品質なアノテーション作業を提供できる仕組みになっているという。
共同販売の概要
■機械学習・深層学習用データセットの共同制作・販売
ピクスタ社が運営する「PIXTA」が保有する人物を主とした画像素材を、機械学習・深層学習用教師データセットとして提供する。グローバルウォーカーズは自社で運営する教師データ作成のためのクラウドサービス「Annotation One」を利用し、ピクスタ社が提供する画像素材に、アノテーション(タグ付け作業)を施し、クライアント企業へ納品する。
■アノテーションイメージ ※画像提供:ピクスタ社「PIXTA」より
(1)外接矩形用データ(Bounding Box)
対象となる物体に対して外接矩形の情報を付与する。人物の場合は、顔・体・全身などのクラスごとに矩形を付与することができる。機械学習では幅広い分野で利用されている手法だ。自動運転、セキュリティ、製品の外観検査、農業、WEB上での画像による検索など多岐にわたる。
(2)領域分割用データ(Semantic Segmentation)
1画素単位でどの物体のカテゴリーの範囲であるのかを取得するためのアノテーション手法だ。自動運転、ロボティクス、医療診断画像など人体検知のほか、工業製品検査、土木建設現場などの高精細な情報を必要とする分野で多く利用されている。
(3)姿勢推定用データ(Key Point)
人物の骨格に合わせてポイントをアノテーションする。スポーツ・医療・ヘルスケア・駅空港などの分野で効果が期待されている。
今後の展開
クライアント企業からの要望に合わせた教師データセットのカスタマイズ販売を皮切りに、今後の展開として、汎用的に利用可能な両社オリジナルのデータセットのパッケージ展開も検討中だ。「PIXTA」の特徴でもある人物画像を用いて、自動運転、スポーツ、医療ヘルスケア、外観検査など多岐にわたるパッケージ展開も視野に、事業を展開していく予定だという。
※関連リンク:プレスリリース