HOME/ AINOW編集部 /AI(スマート)スピーカーの仕組みやできること、AIの特徴を解説!
2022.11.21

AI(スマート)スピーカーの仕組みやできること、AIの特徴を解説!

 

IoTの普及によりスマートホーム化が進んでいるいま、AIスピーカー(スマートスピーカー)の人気が非常に高まっています。

Amazon EchoやGoogle Homeの発売により、ネットショップや店頭でAIスピーカーを見かけることが増えてきましたが、「AI×スピーカーで何ができるのか分からない」という疑問から、少し気になるだけで終わる人も多いでしょう。

本記事では、そんな方の疑問を解消するために、AIスピーカーの概要や仕組み、できることや筆者おすすめの使い方などを中心にご紹介しています。AIスピーカーに興味をお持ちの方は、おすすめのスピーカーも紹介しているので是非ご参考にしてください。

【この記事でわかること】※クリックすると見出しにジャンプします

AI(スマート)スピーカーってなに?

AIスピーカー

AIスピーカー(スマートスピーカー)とは、文字通り「AI(人工知能)」が搭載されたスピーカーのことを指します。

通常のスピーカーだと、外部デバイスからの入力をそのまま出力するだけですが、AIが搭載されることにより、ユーザーからの音声による呼びかけに応じた操作ができるようになりました。

これを可能にしているのが「音声認識」と「自然言語処理」の技術であり、SiriやAlexaのように人の発した声を分析し、音声に応じた様々なアクションをとることができます。

人工知能(AI)について詳しくはこちら

▼関連記事
・AI(スマート)スピーカー徹底比較!あなたに合ったAIスピーカーを紹介>>
・《2022年版》注目のAI製品15選|身近な製品から面白い製品まで紹介!>>

AIスピーカーでできること

音声認識を駆使したAIスピーカーですが、一体どのようなことができるのでしょうか?
ここでは、AIスピーカーにできることをいくつか紹介していきます。

AIスピーカーの主な機能として、

  • 動画・音楽の再生
  • カレンダーの確認・予定の追加と読み上げ
  • 家電の操作(操作に必要なデバイスは以下で紹介しています)
  • ネット検索
  • ニュースの読み上げ
  • 通話
  • アラーム、タイマー

などがあり、幅広い使い方ができます。

これらの機能を扱うことができるのも、AmazonやGoogleなどの国際的にプラットフォームを提供している企業がスマートスピーカーを開発しているからです。よって既存の自社サービスであるGoogleカレンダーやGoogle Chrome、Amazon Musicなどとの連携によりさらなる利便性の向上ができます。

AIスピーカーを使用するメリット

AIスピーカーを使用することのメリットとして、「QOLの向上」があります。

QOL = Quality of Life(生活の質)が向上する理由として、様々なことを音声のみで操作・検索できるためです

作業中に予定を入れるのを思い出したとき、作業を中断しなくてもカレンダーに予定を追加することができたり、家を急いで出る時に玄関先でリビングライトの消し忘れに気づいても音声でライトを消したりすることができたりなど、やり方次第で無駄な時間を省くことができます

AIスピーカーの技術と仕組み

AIスピーカーは、一体どのような仕組みで私たちの生活を便利なものにしているのでしょうか?

普段何気なく使用している方でも、どうやって人の声を理解してさまざまな処理、動作をしているのかを知っている方は少ないでしょう。

普段使用している・これから使ってみたいけどどのような仕組みで動いているのかを知りたい!という方のために、AIスピーカーの技術と仕組みを簡単に解説していきます。

AIスピーカーを会話可能にする2つの技術

AIスピーカーが人の声を理解し、様々な処理をするための核となる技術は主に2つで、それは音声認識自然言語処理です。

音声認識

音声認識とは、人間の発した声を分析してテキストに変換する技術のことです。コンピュータは人間の言葉をそのまま理解することができないため、音響モデルや言語モデルを用いて音声を解析・認識します。

私たちが普段検索や道を訪ねる時に利用しているSiriやAlexaに使われている技術が、まさにこの音声認識です。
音声認識技術は昔からある技術ですが、21世紀に入ってからアルゴリズムの向上とビックデータにより、AIが音声を認識する精度が上がり、日常的に使えるほどになったため普及していきました。

音声認識の仕組みとして大きく4つの段階があります。

  • 音響分析
  • 音響モデル
  • 発音辞書
  • 言語モデル
  1. 音響分析:まずは入力されたアナログの音声データをデジタルのデータへと変換し、コンピュータ内で扱いやすいように加工します。
  2. 音響モデル:音響分析によって加工されたデータは、これまでに収集されて蓄積されてきた膨大な音声データのパターンと照らし合わせて、どの音素に当てはまるのか判断します。
  3. 発音辞書:音素レベルで判別された音声は、次に膨大なデータベースと照らし合わせて単語にしていきます。例えば「K-O-N-N-I-T-I-W-A」という音素の列は「KO-N-NI-TI-WA」の組み合わせとなり、「こんにちは」の単語が出来上がります。
  4. 言語モデル:最後に、発音辞書によってできた単語を組み合わせて一つの文章を生成していきます。ここではユーザーがどのような文章の構成パターンで話しているのか、正確に予測しながら文章にしていきます。

▼音声認識についてもっと詳しく知りたい方は、以下の記事で解説しているのでチェックしてみてください!

 

自然言語処理

自然言語とは、普段私たちが使っている話し言葉や書き言葉のことをいいます。
この自然言語には時々、どういう意味?と尋ねてしまうような「曖昧性」が存在します。この曖昧性を持たせたままコンピュータに理解させるのは大変難しいため、自然言語をコンピュータが理解できるよう処理をし、内容を抽出・意味を解析する処理技術を自然言語処理(NLP)と言います。

自然言語処理の重要な仕組みとして「機械可読目録(機械可読辞書)」「コーパス」があります。

機械可読目録(MARC, MAchine-Readable Catalog)とは、書き言葉の情報を機械が理解できるようにする通信規格であり、辞書のような存在といえます。

次にコーパスとは、自然言語の使用方法を記録・蓄積した文書集合のことを指し、機会が自然言語を理解し使うための膨大なサンプルのようなものです。

この機械可読目録とコーパスを用いて、形態素解析、構文解析、意味解析文脈解析などの処理を行なっていきます。

ここでは簡潔に解説しているため、
▼自然言語処理についてもっと詳しく知りたい方は、以下の記事で解説しているのでチェックしてみてください!

以上の「音声認識」、「自然言語処理」がどのようにしてAIスピーカーで使われているのでしょうか?
大まかに、以下の流れで処理が行われています。

ーAIスピーカー処理の流れー
  1. 音声入力の待機(アレクサ / Hey Siri の呼びかけで音声入力の受付を許可)
  2. 入力された音声をデジタルデータへと変換する(音声認識
  3. データをクラウドに送る
  4. クラウド上でAIがデータを処理・解析する(自然言語処理
  5. AIからの返答を音声で出力する

AIスピーカーに使われる4つのAIと特徴

現在AIスピーカーを自社開発している主な会社はGoogleAmazonAppleLINEの4社です。そのため、搭載されているAIはこの4社それぞれが開発しているものとなっており、どれも異なるサービスを提供しています。

提供されているサービスが異なる以上、ユーザーによって使い勝手も大きく変わってくるため、どのような機能が使えるのか事前に確認しておくことをおすすめします。

ここではネットや電話などの、どのAIスピーカーでも利用できる機能を省き、異なる4種類のAIでできることを簡単にご紹介していますので、是非購入の参考にしてみてください。

①『Alexa』 – Amazon

Amazonが提供している『Alexa』は、Amazonが提供しているサービスを利用することができます。

Amazon Prime Video、Amazon Prime Music、 Kindleの読み上げ、Amazonでの注文から配達のお知らせなど、話しかけるだけでこれらのサービスを利用することができます。

②『Googleアシスタント』 – Google

Googleが提供している『Googleアシスタント』は、GoogleカレンダーやGoogleマップなど、Googleが提供しているサービスを利用することができます。

音声認識力が高く、個々の声を聞き分けて返答することを得意としており、それぞれの名前で応対することも出来ます。

③『Siri』 – Apple

出典:Apple

Appleが提供している『Siri』は、iPhoneやiPadなどの同じApple製品を遠隔操作できたりなど、連携に優れています。
もちろんAppleが提供しているサービスを利用することができ、Apple Musicから音楽を再生したりすることも可能です。

④『Clova』 – LINE

出典:LINE Clova

LINEが提供している『Clova』は、LINEと連携することができるAIアシスタントで、LINE上での電話やメッセージのやりとりをすることができたり、LINE Musicから音楽の再生を行うことができます。
他にも、童話や昔話の読み上げ、動物の鳴き声や楽器の再生機能等も備わっています。

AIスピーカーの選び方

①AIアシスタントの機能

上記でも紹介しているように、AIアシスタントには会社それぞれの特色が出ています。
AIアシスタントで選ぶポイントとしては、普段どのサービスを使って映画を観たり音楽を聞いたりしているのか、これからどのサービスを利用していきたいか。

他にも、普段iPhoneやMacを使っているなら機器同士の連携を考えて、Siriが使える「Home Pod mini」を。LINEを頻繁に使用するなら「Clova」。Google Pixelを使っているならGoogleが提供するAIスピーカーを購入するなど、普段から使っているデバイスや用途に合わせることでより一層便利に使うこともできます。

AIアシスタントで選ぶポイント

  • GoogleカレンダーやAmazon Musicなど、利用したいサービスが使えるかどうか
  • 欲しい機能があるかどうか
  • 普段利用するデバイス(スマホなど)と同じメーカーかどうか

②音質

AIスピーカーということでAI部分に重きを置かれがちですが、スピーカーであるということを忘れてはいけません。

数多くあるAIスピーカーにももちろん音質の差があります。
もし音質を重視したいのであれば、有名オーディオメーカーであるSony、Bose、Ankerなどが販売しているAIスピーカーを購入するのもおすすめです

これらのメーカーは、独自のAIアシスタントを開発しているわけではないため、自社のスピーカーにAlexaやGoogleアシスタントを搭載しています。

音質にこだわりたい!という方は、是非検討してみてください。

③音楽ストリーミングサービスの豊富さ

AIスピーカーのメイン用途の一つとして、音楽を聞くことは欠かせません。

製品ごとに利用できるストリーミングサービスも異なるため、すでに使っているストリーミングサービスと同期させて音楽を楽しみたいという方はここを知っておくことは必須でしょう。

Amazon Google Apple LINE
Amazon music × × ×
YouTube music × × ×
Apple music ×
Spotify × ×
AWA × ×
LINE music × ×

出典:AINOW編集部

AIスピーカーの使い方

AIスピーカーにはどのような使い方があるのでしょうか?

普段からAIスピーカー(Alexa)を愛用しており、本記事を執筆している私おすすめの使い方を含め、その一部を簡単にご紹介します!

音楽・動画の再生

スピーカーなので、もちろん音楽の再生が可能です。スマホと接続して再生することもできますし、「Alexa、音楽かけて」と話すだけであなたが利用しているストリーミングサービスと接続し、音楽を再生してくれます。

もちろん、好きな曲の再生、自作したプレイリストの再生なども可能です。

さらに、ディスプレイを搭載したAIスピーカーであればYouTubeやNetflixなどのサービスの利用、テレビ電話なども可能です。

天気・ ニュース情報の読み上げ

「Alexa、明日の天気は?」この一言だけで明日の準備、洗濯物をどうしようかなどを判断できるのはとっても魅力的です。

Alexa例)
ユーザー:「Alexa、明日の天気は?」
AIスピーカー:「明日、豊島区の天気は断続的に雨が降る予報です。」

他にも、「今日の天気は?」と尋ねると、設定した番組のニュースを数分の間流してくれます。
NHKやANNなどの国内テレビ局のニュースを始め、CNNなどの国外テレビ局のニュースを再生することもできます。

音声検索

AIスピーカーの醍醐味ともなる音声検索。手が空いていない状態でも、音声により素早く検索することができます。

「Alexa、◯◯◯ってどういう意味?」
「Siri、◯◯の電話番号は?」

など、様々な検索が音声により可能となっています。

IoT家電の操作

こちらもAIスピーカーの醍醐味の1つです。(※単体で家電の操作ができるAIスピーカーは一部です。)

LINE CLOVA Deskのように赤外線リモコン機能が搭載されているAIスピーカーでは、スピーカーに直接操作したい家電のリモコンを向け、任意のボタンを押すことで赤外線を記録させることができますが、これができるAIスピーカーはまだまだ少ないのが現状です。

しかし、これを解決してくれる商品が「スマートリモコン」です!

スマートリモコンは、リモコンの赤外線を記録させることでいくつものリモコンを1つにまとめることができるデバイスです。スマートフォンやAIスピーカーと連携させることで、遠隔操作が可能になるため非常にお勧めできます!

おすすめスマートリモコンは以下の2社

  • SwitchBot
  • NutureRemo

▼スマートリモコンについての詳細はこちらで紹介しています!
・AI(スマート)スピーカー徹底比較!あなたに合ったAIスピーカーを紹介>>

スケジュール管理

AIスピーカーは、スケジュールの管理にも優れており、スケジュールの確認から追加、その日の予定を自動で読み上げてくれる機能が備わっています。

「11月20日に美容室の予定入れて」
「明日は予定ある?」

などで予定の追加から確認を簡単にすることが出来ます。

また、AlexaであればAmazonで注文した商品の予定配達日時のお知らせなどまで通知してくれます。

予定を忘れていた場合でも、AIスピーカーの自動読み上げで思い出すことができるため非常に有難い機能の1つです。

アラーム・タイマー

最後にアラームとしての使い方です。

「明日の7:30に起こして」
「15分後に起こして」
「5分計って」

など、基本的なアラーム機能やタイマー機能が使えるため仮眠をとるときに起こしてくれたり、手が離せない料理中にタイマーをセットすることもできます。

著者おすすめの使い方

普段からAmazon Echo Show(Alexa)を愛用している私がお勧めする「朝のAIスピーカーの使い方」をご紹介します!

  1. 定型アクションを設定する(目覚まし)
    7:00にテレビをON
    7:15にアラームを起動
    7:30に寝室のライトをON
    7:40にニュースを再生
  2. 作業BGMを再生する(朝の作業)
    lofi hip hopを再生
  3. 1日の予定を確認

定型アクションとは、設定した日時に決まったアクションをするようにすることができるもので、Amazon Alexa アプリから登録することができます。

私の場合は、朝急な刺激で目覚めるのが嫌なので、最初にテレビをつけて、それでも起きなかったらアラームを鳴らす。それでも起きなければライトをつけるなどで徐々に刺激を強くして目覚めさせるようにしています。

これで間違いなく起きることができているので、朝が苦手な人は是非参考にしてみてください!

あなたに合ったAIスピーカー

仕組みや選び方、使い方などが分かっても数多くあるAIスピーカーの中から選ぶのは難しいかもしれません。

こちらの記事であなたに合ったAIスピーカー14選を紹介しているので、気になる方は是非ご覧ください。

まとめ

いかがでしたでしょうか。
本記事では、AIスピーカーの概要や仕組み、できることや使い方などを紹介していきました。

AIスピーカーを使い始めると、AIスピーカーがある生活とない生活とではQOLの差を大きく感じるほど、非常に便利なデバイスだということを分かっていただけることでしょう。

AIスピーカーを上手く活用して、一緒に暮らしを便利にしていきませんか?

無料メールマガジン登録

週1回、注目のAIニュースやイベント情報を
編集部がピックアップしてお届けしています。

こちらの規約にご同意のうえチェックしてください。

規約に同意する

あなたにおすすめの記事

生成AIで“ウラから”イノベーションを|学生起業家が描く、AIを活用した未来

特許技術×AIでFAQを次のステージへ|Helpfeel

GPUの革新からAI時代の主役へ|NVIDIA

あなたにおすすめの記事

生成AIで“ウラから”イノベーションを|学生起業家が描く、AIを活用した未来

特許技術×AIでFAQを次のステージへ|Helpfeel

GPUの革新からAI時代の主役へ|NVIDIA