すでにヒトと同じレベルに到達。音声認識技術の歴史と現在

2018.08.30 15:00
6,339
Mugendai

渡邊徹則

積み重ねた苦労のおかげです。

Siri、Alexa、Googleアシスタント、LINE Clovaなど、今や数多くの音声入力装置が登場しています。時間や天気を聞く、買い物をするといったことが、ただ｢声｣だけでできるなんて、あらためて考えたらSFの世界ですよね。

それにしてもこの音声認識技術って、一体どのような仕組みでどう実現したものなのでしょうか。IBMのWebメディアMugendai（無限大）にて、その歴史が紹介されていました。

記事によると、同社が音声認識の研究を始めたのは、なんと1960年代から。代表的な成果の一つとして｢電話会話音声認識｣があり、これは音質の低い電話回線の音声を対象に、人間同士の自然な会話を認識するためのシステムなのだそう。

具体的には、入力された音声信号がどの音に対応するかをモデル化した｢音響モデル｣と、自然な単語の並びをモデル化した｢言語モデル｣の2つから成り立っているそうで、近年ではこれにディープラーニングが導入され、その精度は格段に上昇。何と、人間と同じ程度の音声認識が可能になったそうですよ。

関係機関の予測によれば、音声を使ったショッピングは現在の20億ドル（約2200億円）から、2022年には400億ドル（約4兆4000億円）以上に成長すると見込まれているそうで、もしかしたらその頃にはキーボードやスマートフォンも使っていないのかもしれませんね。

音声認識技術の歴史と現状についてご興味のある方は、Mugendai（無限大）よりぜひ続きをお楽しみください。

Source: Mugendai（無限大）

すでにヒトと同じレベルに到達。音声認識技術の歴史と現在

Netflix映画『シティーハンター』ってなんでこんなにヒットしているの?

ライトアウターの持ち歩きは、6gのスタッフバッグで軽く&コンパクトに

音の良さに全振り。オーディオマニア向けのAndroidスマホ登場

【噂まとめ】iPhone 16のすべて。ついに真の全画面に?(5月17日更新)

油と熱をコントロール。煙を抑える焼肉グリル

もう限界。Windows 11にやめてほしいこと8つ

初登場時はボロカスに言われたけど...その後に成功したガジェットたち

700円の超ショートUSB-Cケーブルでカードリーダーやめました

いろんなゲーム機のソフトが30種類以上遊べる究極の携帯ゲーム機

VHSやブルーレイっていつまで見られるの? 寿命を調べてみた

知っていると便利! Googleマップの隠れ機能

もう限界。Windows 11にやめてほしいこと8つ

ベランダ掃除、これでいいじゃん。新作｢バケツのケルヒャー｣が手放せない

日本のスマホ市場ではiPhoneがダントツ。でも世界に目を向けると...

【噂まとめ】iPhone 16のすべて。ついに真の全画面に?(5月17日更新)

Anker PowerExtend (6-in-1) 電源タップ

キオクシア microSD 128GB

Apple AirPods Pro

Dyson スティック掃除機

Fire HD 10 タブレット

LATEST NEWS

人間同士が出会う前に、お互いのAI同士をデートさせたら効率的？

Mini LED採用で5,000ニトの高輝度テレビ、ハイセンスU9Nはいいぞ

｢このロボットは遠隔操作じゃありません｣というアピールの理由

紛失や破損は勘弁してよね…荷物の扱いが雑な航空会社ランキング

GIZMODO REVIEWS

Mini LED採用で5,000ニトの高輝度テレビ、ハイセンスU9Nはいいぞ

ライトアウターの持ち歩きは、6gのスタッフバッグで軽く＆コンパクトに

Netflix映画『シティーハンター』ってなんでこんなにヒットしているの？

音がクリアに、近くに聞こえる。Nothingのスケルトンな｢Ear (a)｣

無印良品の風を通す帽子なら｢帽子をかぶるとムレて暑い｣を解決