1. Tomorubaトップ
  2. ブログ
  3. 第4話「コミュニケーションロボット」ーいま流行りの人口知能を使ったコミュニケーションでは一体何ができるの? 正しく知識を整理してAIを活用しよう!
第4話「コミュニケーションロボット」ーいま流行りの人口知能を使ったコミュニケーションでは一体何ができるの? 正しく知識を整理してAIを活用しよう!

第4話「コミュニケーションロボット」ーいま流行りの人口知能を使ったコミュニケーションでは一体何ができるの? 正しく知識を整理してAIを活用しよう!

趙徳鵬

近年では、深層学習の発達により、音声認識の精度が格段に向上しています。前節お話ししたコミュニケーションロボットを始め、AIを活用してコールセンターにおける顧客の大量の音声データを高度な音声認識と感情認識で企業の経営課題を解決する音声ビッグデータ・ソリューションなども存在します。音声データの収集が進んだことで音声認識の精度自体が大きく向上させる要因になったのではないかと考えられます。

では、技術的なお話をしてみたいと思います。音声認識によって音声を文章に変換するプロセスには、細かく分けて3つのステップが存在します。1つ目のステップが、音波を音素へと変換するステップです。音素とは、言語学・音韻論において、母語話者にとって同じと感じられ、また意味を区別する働きをする音声上の最小単位となる音韻的単位を指します。 「あ」は「a」、「か」は「k-a」として発音されますが音が空間中を伝わる時は全ての音が波として伝わります。その波をaやkなどの子音と母音の意味のある音素へと変換するステップが最初のステップです。

2つ目のステップがその音素を複合して単語へ変換します。音声認識は、音の波を音素、単語、文章へと変換していきますが、1つ目のステップの結果、コミュニケーションロボットが人と会話をする音素の並びが「r-o-b-o-t-o」だったとします。この場合、人の発する言葉を聞く能力が必要ということには、「ロボット」という単語が発話されたと解釈します。音声認識というのは、人の発する言語の理解が必要なのです。3つ目のステップが、単語同士の連なりを人工知能が理解してテキストなどに変換する技術のことを指します。

「wa-ta-si-wa-ro-bo-tto-de-su」という音素の列が入力された場合には、「わたしはろぼっとです」という日本語を出力することができます。この出力結果は、最終的に、「私はロボットです」という文章へと変換する必要があります。単語と単語の切れ目や、前後の単語との関係性を間違えると、「輪足しはロボットです」という文章や「渡しはロボット出す」という意味不明な文章になり意味が通じない文章になってしまいます。

 

このように音声認識技術は3つのステップを経て変換が行われますが、文章へと変換するステップです。音声認識では、それぞれ独立して実施できるものではなく、複合的なアルゴリズムによって文章点を確定させていく必要があります。ただ、未だ海外外国語の壁や方言の壁などたくさんの課題を抱えています。

趙徳鵬ロボットバンク株式会社

静岡文化芸術大学    生産デザイン学科卒業 カーデザイン
静岡大学大学院 工学研究科  工学 修士 
2015年に北京中関村に起業、APP開発中心、その後会社は大手ECサイトに売却 
2016年36krのグローバルビジネス優秀インキュベータに選出
2017年清華大学のグローバルビジネス優秀インキュベータに選出
2019年 月間5億PVを誇る、中国最大のベンチャー/ITメディア「36kr」36krspace
(米ナスダック上場)と 共同で初の海外インキュベーション拠点を設立 (日中ハイテク企業をつなぐ)
2020年 中国最大イノベーション大学 混沌大学日本支店設立(日中ハイテクイノベーション企業をつなぐ)
2022年  RobotBank当社設立 ロボティクスで実現するモノづくりDX、幸せライフスタイルDXを促進する

ロボットバンク株式会社

CEO

新規事業創出・オープンイノベーションを実践するならAUBA(アウバ)

AUBA

eiicon companyの保有する日本最大級のオープンイノベーションプラットフォーム「AUBA(アウバ)」では、オープンイノベーション支援のプロフェッショナルが最適なプランをご提案します。

チェックする場合はログインしてください

コメント0件


    おすすめブログ

    • 第2話「コミュニケーションロボット」ー案内ロボットとしての利活用は広がっている

      人工知能の発達と同時に社会情勢が大きく変化としてきており、労働人口が減少が慢性化してきております。そんな中サービスロボットが提供するサービスの品質が向上していることからサービスロボット全体の市場が拡大傾向にあります。また、その中でもコミュニケーションロボットが大きな成果を産んでおり非常にたくさんの場所で見かける様になりました。最近では、駅構内の案内やビルの案内、ショッピングセンター内の売り場の案内などいろいろな機会でそうしたサービスロボットが活躍する機会が増えてきています。コミュニケーションロボットは、会話が発生するさまざまな場面で人の代替え手段となり得るため、利活用の幅が大きく広がっています。例えば駅構内の乗換案内やショッピングセンターなどの店舗の案内、図書館や病院での各目的地の案内などたくさんの用途で有効的に活用されています。また、介護施設では、お年寄りのエンターテイメントとしてもクイズや余興やダンスなどを行うロボットとして利用されていたりします。市場が拡大していることも追い風になっています。旅のガイドや工場見学ガイドとしてコミュニケーシュニケーションロボットが利活用されるようになってきています。こうした

      趙徳鵬

      2年前

    • 第3話「コミュニケーションロボット」- 会話するための人工知能が複数搭載されている

      今日のお天気は?何気ない会話1つをとってもコミュニケーションロボットでは非常に複雑な処理がされています。人がロボットとバーバル(言語)コミュニケーションを実現しようとすると内部では様々な人工知能技術が用いられ処理されています。そこで今回は会話で必要とされる人工知能や必要となる能力について技術的に明らかにしていきたいと思います。AI受付・案内サービスロボット RakuRobot-MINIhttps://www.robotbank.jp/product/67.html2023年現在サービスロボットは市場拡大があるにせよまだまだ普及の途上にあります。そのためロボットを見ただけでは何ができるロボットなのか判別して頂く事が困難な状況です。コミュニケーションロボットですから会話が発生しないと機能を十分に発揮する事が困難であり、ロボットと人が会話を開始してもらう必要があります。設置されているコミュニケーションロボットが、会話ができるロボットとして社会に認知されていればよいですが、一般的には話しかけてもらうだけでも一苦労です。例えば、ロボットバンク株式会社が開発、販売するMiniという小型のコミュニケーションロボットがありま

      趙徳鵬

      2年前

    • 第1話「コミュニケーションロボット」ロボットと人の会話が会話できる

      ロボットといえば、真っ先に思い浮かべるのはコミュニケーションロボットではないでしょうか。 特に日本人の場合、ロボットといえばドラえもんのネコ型ロボットやガンダム、鉄腕アトム・・・などといった漫画のキャラクターのように、直立二足歩行で人々の心に寄り添ってくれるものを想像する人も多いと思います。ロボットとの会話や動きを通じて交流を楽しめるコミュニケーションロボットは、子どもの遊び相手やお年寄りの見守り、日々の寂しさを紛らわせるためなど、多様な用途に使えます。最近ではオフィスン会議室や商談コーナーの案内などにもロボットが活用されるようになってきています。人の発する言葉を理解して応答する、いわゆるバーバルコミュニケーションの能力は必須といっても過言ではないでしょう。そこでコミュニケーションロボットの特にバーバルコミュニケーションに必要とされる技術について取り上げます。バーバルコミュニケーションとは、言語で相手に伝達を行うコミュニケーションのことで、言語コミュニケーションとも呼びます。 バーバルコミュニケーションは、メールや手紙などの文章や、会話で発する言葉が対象となっていて、言葉自体の意味や話の内容が相手に伝達される

      趙徳鵬

      2年前