DataRobot×NTTデータ |需要予測の精度向上を実現するTwitter集計データサンプルのPoC提供を開始
エンタープライズAIのリーダーであるDataRobot, Inc.(以下:DataRobot)は、7月9日に、株式会社NTTデータと、新たにデータパートナー契約(以下、同契約)を締結し、Twitter集計データサンプルの提供を開始したことを発表した。同取り組みは、NTTデータが2012年から全量Twitterデータを扱っていることから実現した。
メーカーや小売・流通事業者の多くは消費者トレンド把握のため、ソーシャルメディアなどの社外データ使って将来の需要を推定しようとしている。しかし、コストのかかる社外データの価値がはっきりとわからないまま導入することは難しく、さらに、AIで活用できるようデータをクレンジング処理するなどの加工技術が必要なことも負担となり、その処理したデータで予測モデルを生成することが難しい現状がある。
▲上写真:具体的な連携イメージ
同契約によりNTTデータは、DataRobotで使えるようにあらかじめ加工したTwitter集計データサンプルを一部無償で提供する。DataRobot利用企業は、DataRobot上でデータサンプルを手軽に取得し、AIを用いて需要予測モデルの検証を行い、早期にデータの本格活用に向けた検討を開始することができる。今後はさらに両社の技術を活用して、未来のトレンドや消費者ニーズを予測可能にする先進的な技術開発にも取り組んでいくという。
データパートナー契約締結の背景
メーカーや小売・流通事業者を中心に、売れ筋商品の見極めや在庫管理を行うため、自社データ(出荷、販売等の実績データ)に基づいて需要予測を行っている。しかし、消費者トレンドをタイムリーに把握するには消費者心理が強く表れるソーシャルメディアの情報が不可欠になってきている。
一方で、ソーシャルメディア上のデータを予測モデルに組み込む課題として、データのクレンジング処理、自然言語処理、特徴量抽出等のデータ加工の前処理を行うための技術的なハードルや高い初期構築コスト、同時に社内と社外両方の大量のデータを使ったAIモデルの構築が挙げられる。
このような課題に対して、DataRobotとNTTデータは同契約を締結し、DataRobot利用企業にデータの前処理を行ったTwitter集計データサンプルの提供を開始した。
データパートナー契約によって提供できる価値
NTTデータから、DataRobotで使えるように加工したTwitter集計データサンプルを提供することで、国内200社以上のDataRobot利用企業は、DataRobotのデータ共有・自動特徴量生成機能を通してDataRobot上でデータサンプルを手軽に取得し、従来課題とされてきたデータのクレンジング処理やコストの最小化を実現しながら、すぐにSNSデータを用いた需要予測モデルの検証が始められる。※1 また、自社内でAI予測モデルの精度向上に向けて効率的かつ、迅速に検証と評価を行うことができる。
※1 データ活用にあたっては、NTTデータとDataRobotの同意が必要となる。
■時間的メリット
DataRobotのプラットフォームからデータにアクセスする事で、煩雑な契約手続きが不要でデータの受け渡しにかかる時間を削減することができる。
■金銭的メリット
Twitter上の特定キーワードの話題量推移データ等のサンプルデータを無償で利用し検証する事で、データのビジネス的価値を定量的に評価し購入判断できる。
■技術的メリット
DataRobotが直接解釈可能な集計データ(構造化データ)形式で提供されるため、DataRobotによる自動特徴量生成機能を通して、容易に自社データとTwitter集計データサンプルを組み合わせたAIモデルを構築できる。また、オプションのデータ活用支援サービスを活用すれば、データサンプルではなく、より精度の高いモデルを構築するために必要となるデータの調達支援や検証支援を受けることができる。
Twitterデータについて
Twitterは、グローバルでの利用者数(mDAU※2)が1億9,900万人超を誇るSNS。他のSNSと比べると匿名性が高いことから、よりユーザーの本音が集まりやすく、かつ拡散力が大きいことが特徴。
NTTデータは、米Twitter社の最上位のTwitter Official Data Partnerとして全量Tweetデータ(Firehoseデータ)をリアルタイムに受領し、そのデータを顧客へ提供するインフラを構築している。NTTデータが「Twitterデータ提供サービス(インテグレーション)」を通じて提供するTwitterデータは、米Twitter社公認の商用利用可能な「Twitterデータ活用認定サービスプログラム」に基づき提供されるデータのため、公式かつ健全にビジネスに活用することが可能。
※2 mDAU:収益につながる日間アクティブユーザー数。数値は2021年4月発表。
※関連リンク:プレスリリース