TOMORUBA

事業を活性化させる情報を共有する
コミュニティに参加しませんか?

AUBA
  1. Tomorubaトップ
  2. ブログ
  3. 第4話「コミュニケーションロボット」ーいま流行りの人口知能を使ったコミュニケーションでは一体何ができるの? 正しく知識を整理してAIを活用しよう!
第4話「コミュニケーションロボット」ーいま流行りの人口知能を使ったコミュニケーションでは一体何ができるの? 正しく知識を整理してAIを活用しよう!

第4話「コミュニケーションロボット」ーいま流行りの人口知能を使ったコミュニケーションでは一体何ができるの? 正しく知識を整理してAIを活用しよう!

趙徳鵬

近年では、深層学習の発達により、音声認識の精度が格段に向上しています。前節お話ししたコミュニケーションロボットを始め、AIを活用してコールセンターにおける顧客の大量の音声データを高度な音声認識と感情認識で企業の経営課題を解決する音声ビッグデータ・ソリューションなども存在します。音声データの収集が進んだことで音声認識の精度自体が大きく向上させる要因になったのではないかと考えられます。

では、技術的なお話をしてみたいと思います。音声認識によって音声を文章に変換するプロセスには、細かく分けて3つのステップが存在します。1つ目のステップが、音波を音素へと変換するステップです。音素とは、言語学・音韻論において、母語話者にとって同じと感じられ、また意味を区別する働きをする音声上の最小単位となる音韻的単位を指します。 「あ」は「a」、「か」は「k-a」として発音されますが音が空間中を伝わる時は全ての音が波として伝わります。その波をaやkなどの子音と母音の意味のある音素へと変換するステップが最初のステップです。

2つ目のステップがその音素を複合して単語へ変換します。音声認識は、音の波を音素、単語、文章へと変換していきますが、1つ目のステップの結果、コミュニケーションロボットが人と会話をする音素の並びが「r-o-b-o-t-o」だったとします。この場合、人の発する言葉を聞く能力が必要ということには、「ロボット」という単語が発話されたと解釈します。音声認識というのは、人の発する言語の理解が必要なのです。3つ目のステップが、単語同士の連なりを人工知能が理解してテキストなどに変換する技術のことを指します。

「wa-ta-si-wa-ro-bo-tto-de-su」という音素の列が入力された場合には、「わたしはろぼっとです」という日本語を出力することができます。この出力結果は、最終的に、「私はロボットです」という文章へと変換する必要があります。単語と単語の切れ目や、前後の単語との関係性を間違えると、「輪足しはロボットです」という文章や「渡しはロボット出す」という意味不明な文章になり意味が通じない文章になってしまいます。

 

このように音声認識技術は3つのステップを経て変換が行われますが、文章へと変換するステップです。音声認識では、それぞれ独立して実施できるものではなく、複合的なアルゴリズムによって文章点を確定させていく必要があります。ただ、未だ海外外国語の壁や方言の壁などたくさんの課題を抱えています。

趙徳鵬ロボットバンク株式会社

静岡文化芸術大学    生産デザイン学科卒業 カーデザイン
静岡大学大学院 工学研究科  工学 修士 
2015年に北京中関村に起業、APP開発中心、その後会社は大手ECサイトに売却 
2016年36krのグローバルビジネス優秀インキュベータに選出
2017年清華大学のグローバルビジネス優秀インキュベータに選出
2019年 月間5億PVを誇る、中国最大のベンチャー/ITメディア「36kr」36krspace
(米ナスダック上場)と 共同で初の海外インキュベーション拠点を設立 (日中ハイテク企業をつなぐ)
2020年 中国最大イノベーション大学 混沌大学日本支店設立(日中ハイテクイノベーション企業をつなぐ)
2022年  RobotBank当社設立 ロボティクスで実現するモノづくりDX、幸せライフスタイルDXを促進する

ロボットバンク株式会社

CEO

新規事業創出・オープンイノベーションを実践するならAUBA(アウバ)

AUBA

eiicon companyの保有する日本最大級のオープンイノベーションプラットフォーム「AUBA(アウバ)」では、オープンイノベーション支援のプロフェッショナルが最適なプランをご提案します。

チェックする場合はログインしてください

コメント0件


    おすすめブログ

    • 第2話「コミュニケーションロボット」ー案内ロボットとしての利活用は広がっている

      人工知能の発達と同時に社会情勢が大きく変化としてきており、労働人口が減少が慢性化してきております。そんな中サービスロボットが提供するサービスの品質が向上していることからサービスロボット全体の市場が拡大傾向にあります。また、その中でもコミュニケーションロボットが大きな成果を産んでおり非常にたくさんの場所で見かける様になりました。最近では、駅構内の案内やビルの案内、ショッピングセンター内の売り場の案内などいろいろな機会でそうしたサービスロボットが活躍する機会が増えてきています。コミュニケーションロボットは、会話が発生するさまざまな場面で人の代替え手段となり得るため、利活用の幅が大きく広がっています。例えば駅構内の乗換案内やショッピングセンターなどの店舗の案内、図書館や病院での各目的地の案内などたくさんの用途で有効的に活用されています。また、介護施設では、お年寄りのエンターテイメントとしてもクイズや余興やダンスなどを行うロボットとして利用されていたりします。市場が拡大していることも追い風になっています。旅のガイドや工場見学ガイドとしてコミュニケーシュニケーションロボットが利活用されるようになってきています。こうした

      趙徳鵬

      1年前

    • 第3話「コミュニケーションロボット」- 会話するための人工知能が複数搭載されている

      今日のお天気は?何気ない会話1つをとってもコミュニケーションロボットでは非常に複雑な処理がされています。人がロボットとバーバル(言語)コミュニケーションを実現しようとすると内部では様々な人工知能技術が用いられ処理されています。そこで今回は会話で必要とされる人工知能や必要となる能力について技術的に明らかにしていきたいと思います。AI受付・案内サービスロボット RakuRobot-MINIhttps://www.robotbank.jp/product/67.html2023年現在サービスロボットは市場拡大があるにせよまだまだ普及の途上にあります。そのためロボットを見ただけでは何ができるロボットなのか判別して頂く事が困難な状況です。コミュニケーションロボットですから会話が発生しないと機能を十分に発揮する事が困難であり、ロボットと人が会話を開始してもらう必要があります。設置されているコミュニケーションロボットが、会話ができるロボットとして社会に認知されていればよいですが、一般的には話しかけてもらうだけでも一苦労です。例えば、ロボットバンク株式会社が開発、販売するMiniという小型のコミュニケーションロボットがありま

      趙徳鵬

      1年前

    • 生物多様化保全のために、太陽光発電は何かできるか?

      長い間、化石エネルギーの開発と使用は、生物多様化に大きな脅威をもたらしてしまった。 エネルギー構造の調整を加速することは、生物多様化保全の根本的な解決案だと考えられている。 太陽エネルギーを代表とする新エネルギーは、その中に重要な役割を果たしている。この前の国連生物多様化会議に、中国から砂漠地帯に大規模な太陽光発電所を建設する計画を提案した。砂漠地帯に太陽光発電所を建設するには、水分蒸発を有効的に低減することで植木の回復に役立てて、砂を抑えることができる。今の太陽光発電による砂制御法では、追尾架台が広く利用されている。太陽光発電架台の開発と製造に12年間に取り組んでいるグレースソーラーは、砂漠地帯の極端な気候にも太陽光発電所が安定に運営できるように追尾架台の開発と革新に全力している。グレースソーラーは、AI技術を追尾架台に融合することで様々な複雑な地形や極端気候にも対応できるし、且つ市場主流の清掃ロボットと完璧的に組み合わせて、知能的な追尾及び知能的な運営が実現できる。その故、発電量を8%に向上できる。太陽光発電による砂を抑えるのは相当な時間がかかり、TÜV、ULなどの認証と風洞測定が整えたグレースソーラーの

      グレースソーラー

      2年前