新型レクサス「NX」に搭載されている「音声認識」(エージェント)については、私的には納車当時からいろいろ試してみたのですが、当初はまったく使い物にならないレベルで、しばらく使用することなく放置していました。
音声認識機能については、先代レクサスNXやRXなどでも使用されていましたが、誤認識やレスポンスの悪さから、すでに使用していない方も多いのではと思います。
しかし、今回、2023年2月更新の「OTA」アップデート後に更に改善されているということで、OTAアップデート当日は「それほど大きな改善はないなぁ」と感じてしましたが、どれほど改善されているのか改めて確認するために土日の空いている時間で数時間、時間をかけて向き合ってみました。
新型NX以降の新世代マルチメディアシステムにおいて、どのような「音声認識」ができるかは、レクサスの公式Webページにまとめられています。
当初はここまで詳しく解説されていなかったと思いますので、途中で大幅に加筆/修正されたものと思います。
https://lexus.jp/total_care/connected/navigation/agent.html

*コネクテッドサービス「エージェント」:ー「ナビ検索・ナビ操作」より
数時間検証してみたところ、結論からすると、初期バージョンに比べると「格段に良くなっています」!
特に、上記サイトに掲載されている事例はおおむね認識することができました。
ただし、認識できるコマンドと話し方を理解する必要があると感じました。
これから納車される方は、まずは、どんなことができるのか、またどのように発言すれば認識してくれるかを公式Webサイトで学ぶ必要がありますので、一通りチェックしておきましょう。
さて、2023年2月のアップデートで大きく変わったと感じたのは「2段階」で車両(以後、AI)が認識するようになったことです。
例えば、「ヘイ、レクサス。東京駅の近くで空いている駐車場探して」と発音した場合です。
初期(2022.11月〜)や中期(2022.6月〜)では、こういった音声はなかなか認識してくれませんでしたが、2023年2月(以降、新バージョン)では、「カタカナ混じり」でAIが認識した用語をまず表示してくれるようです。
画面では「トウキョウトの近くでアイテルチュウシャジョウ探して」と認識に苦労している様子が伺えます。

従来だと、「東京都の近くで駐車場?」(そんなものは存在しない)と認識して、AIがフリーズして長時間応答がなく、我々ユーザーに「ああ、こりゃダメだ」と思わせていたものと思います。
それが、新バージョンですと、もう1度画面表示が切り替わり、正確に「東京駅の近くで空いている駐車場探して」と認識してくれます! 「東京都」が「東京駅」だと認識を改めたわけですから、これは一体どういうロジックかわかりませんが、これには驚きました。

次に、「ヘイ、レクサス。品川駅の近くで空いている駐車場探して」と発音した場合・・・
まず画面には、「シナガワエキフレアイビルチュウシャジョウ探して」と表示されました。
当方の発音がイマイチなのかもしれませんが、「シナガワエキフレアイビル」と謎の認識をしていることにも驚きがあります。
大部分がカタカナなので、従来のバージョンでは、この段階でAIが「思考停止」し、フリーズするか、見当違いな結果を表示していたものと思います。

この後自動的に画面が切り替わり「品川駅の近くで空いている駐車場を探して」と正確に認識しました!
「フレアイビル」がどういうロジックで「近くで空いている」に変換されたのかも謎が深まりますが、これはかなりすごい!(やればできる!)

最後に使用頻度が高い「自宅に行きたい(自宅に帰る)」ですが・・・
これもまずはこんな感じで、「キタクに行きたい」と、とんでもない認識です。こりゃ、当初は使い物にならないと感じたわけです・・・(北区に行きたいと認識しているのか?)

これも画面が切り替わり、無事に「自宅に行きたい」に変換してくれました!
多少認識に時間はかかりますが、変な目的地を検索するという結果にはならず、大成功です。

この他にも
「近くの○○○○」と発声する場合の音声認識は、認識率が格段に良くなっていることがわかりました。
「近くのスターバックス」
「近くのタリーズ」
「近くのファミレス」
「近くのドラッグストア」
上記のように、著名なチェーン店名も、新バージョンでは難なく認識することができたので、馴染みのない旅行先で立ち寄り場所を探すときには「近くの○○○」はなかなか有効と感じます。
(「近くの○○○○に行きたい」 という必要はなく、「近くの○○○○」だけで良いのは便利ですね)
・・・ということで、2023年2月のアップデートにおいて、ようやく音声認識機能が実用的になってきたと感じました。
ただ、これは繰り返しになりますが、「認識されるコツ」や「話し方」がありますので、上記のページおよび、レクサス開発陣の「TEAM LEXUS BLOGS」をご参照の上、トライしてみてください。
特に初期納車された方は、ぜひ新バージョンの音声認識を試していただければと思います。
当方が現時点での望む、今後の要望としては次のことができるようになってほしいです。
■音声での目的地検索のオン/オフ
誤作動の原因は無限のパターンがある「目的地検索」と思いますので、この機能の「オン/オフ」ができれば、誤認識は相当減らせるのではないかと思います。もしくは音声検索で検索できるエリアを限定するとか・・・
ユーザーが感じるストレスの原因は「AIが誤認識」→「見当違いな目的地を検索」が主要因と思いますので・・・
流石に、東京で音声検索して、四国エリアの目的地を目的地候補として表示するのはあまり現実的ではないように思います。
■次のインターチェンジで降りたい
都市部に限らないと思いますが、ナビで示されたインターチェンジの手前で一般道に降りたい場合もしばしばあると思います。
このような場合、一度インターチェンジを降りても、再度高速道路に乗ることを支持されたり、高速道路走行のままであったりしますので、「自分はここから一般道で走行したい」意識を伝えることができればとても役立つと思います。これこそが音声認識ならではの機能と思いますので、ぜひ実現してほしいと思います。
■次のインターチェンジで乗りたい
上記のケースとは逆のパターンです。
都市部ではインターチェンジ間の距離(間隔)が短いことも多いです。料金の問題や渋滞の有無など、もう1つ先のインターチェンジまで「下道で行きたい」と思うこともしばしばあると思いますが、これを手動でナビに反映させるのは結構たいへんです。これが音声認識で対応してもらえるととても便利と感じます。
■ルート検索後の「一般道優先」/「有料優先」の切り替え
これはかなりニーズが高いと思うのですが、途中でルート検索方法を変更したいケースです。(高速道路を走行中、料金節約のため、一般道に降りるケースも含む)現状では、音声認識での変更方法はなさそうです。任意で下道に降りたのに、再度有料道路に乗ることを指示(案内)されることに不満を持つ方は結構いらっしゃるのではないかと思います。
■ドライブセレクトモードの変更
新型NXではドライブモードセレクトスイッチが付いているので問題ありませんが、「RX」、「RZ」では非装備ですので、ぜひ音声認識でドライブモードセレクトスイッチの切替替えがスムーズに(かつ「素早く」)できるようになってほしいです。
■効果音の変更(AIが認識しているかどうかの見分け方)
AIが「認識しているのか」「考えているのか」の区別が未だつきにくいです。
「無音(無反応)」の時間は、最新バージョンでもまだ気にあるところですので、AIが「調べているのか」、「エラーなのか」がまだまだシチュエーションが分かりづらいと思います。人間なら「表情」や「あいずちの有無」でわかるのですが、AIだとそのあたりがさっぱりわからないので、せっかく目の前に14インチディスプレイがあるのですから、これを補う方法が欲しいものです。
また、対話終了後の効果音(ビープ音?)も、「OK」なのか「キャンセル」なのか今ひとつ判然しないときがあるのも残念に感じます。
■使用頻度が高い発音例の表示
レクサスオーナーがよく使うもしくは全国的に人気の高い「用語」を「ヘイ、レクサス」のあとに14インチディスプレイに自動的に画面表示してくれると良いなぁと思いました。(やはり、「どうやって対話すれば良いのか」はつい忘れてしまいますので・・・)
■パノラミックビューモニター中の音声認識
パノラミックビューモニターを「オート」にされている方は、徐行走行中に、「PVM」の画面になっていることが多いと思いますが、音声認識はこのときには受け付けられません(カメラ関係の音声のみ認識)
個人的には、このような低速度域だからこそ、音声認識を行う余裕があると感じますので、「PVM」の画面のときも音声認識を受け付けてほしいと思いました。
■音声の個人ごとの学習機能
個人ごとに発音の癖があると思いますので主要なフレーズをあらかじめ実際に発声して認識率を高めるなど「学習機能」をもたせてほしいと思います。「ドライバー認証」の際に、その情報が呼び出されるのであれば認識率もより高められるのではないかなぁと感じています。
「TAZUNA」コンセプト移行後、運転席のタッチディスプレイから手の届かない範囲(画面の左隅など)にボタンやスイッチが配置されている部分がありますので、こういった部分の操作を「音声認識」で置き換えたり、ワンクリック(タップ)ではできないことを、「音声認識」で置き換えることがとても有用と思います。
手元のステアリングスイッチでできることは音声認識でやる必要はないようにも思いますので、ユーザーが「こうしたことをやってほしい」と販売店やメーカーに意見を伝える仕組みがあれば良いなぁと感じます。
音声認識機能はぜひ今後も操作改善が望ましい「TAZUNA」を補うツールとして進化していってほしいですね。
しかし、今回、2023年2月更新の「OTA」アップデート後に更に改善されているということで、OTAアップデート当日は「それほど大きな改善はないなぁ」と感じてしましたが、どれほど改善されているのか改めて確認するために土日の空いている時間で数時間、時間をかけて向き合ってみました。
新型NX以降の新世代マルチメディアシステムにおいて、どのような「音声認識」ができるかは、レクサスの公式Webページにまとめられています。
当初はここまで詳しく解説されていなかったと思いますので、途中で大幅に加筆/修正されたものと思います。
https://lexus.jp/total_care/connected/navigation/agent.html

*コネクテッドサービス「エージェント」:ー「ナビ検索・ナビ操作」より
数時間検証してみたところ、結論からすると、初期バージョンに比べると「格段に良くなっています」!
特に、上記サイトに掲載されている事例はおおむね認識することができました。
ただし、認識できるコマンドと話し方を理解する必要があると感じました。
これから納車される方は、まずは、どんなことができるのか、またどのように発言すれば認識してくれるかを公式Webサイトで学ぶ必要がありますので、一通りチェックしておきましょう。
さて、2023年2月のアップデートで大きく変わったと感じたのは「2段階」で車両(以後、AI)が認識するようになったことです。
例えば、「ヘイ、レクサス。東京駅の近くで空いている駐車場探して」と発音した場合です。
初期(2022.11月〜)や中期(2022.6月〜)では、こういった音声はなかなか認識してくれませんでしたが、2023年2月(以降、新バージョン)では、「カタカナ混じり」でAIが認識した用語をまず表示してくれるようです。
画面では「トウキョウトの近くでアイテルチュウシャジョウ探して」と認識に苦労している様子が伺えます。

従来だと、「東京都の近くで駐車場?」(そんなものは存在しない)と認識して、AIがフリーズして長時間応答がなく、我々ユーザーに「ああ、こりゃダメだ」と思わせていたものと思います。
それが、新バージョンですと、もう1度画面表示が切り替わり、正確に「東京駅の近くで空いている駐車場探して」と認識してくれます! 「東京都」が「東京駅」だと認識を改めたわけですから、これは一体どういうロジックかわかりませんが、これには驚きました。

次に、「ヘイ、レクサス。品川駅の近くで空いている駐車場探して」と発音した場合・・・
まず画面には、「シナガワエキフレアイビルチュウシャジョウ探して」と表示されました。
当方の発音がイマイチなのかもしれませんが、「シナガワエキフレアイビル」と謎の認識をしていることにも驚きがあります。
大部分がカタカナなので、従来のバージョンでは、この段階でAIが「思考停止」し、フリーズするか、見当違いな結果を表示していたものと思います。

この後自動的に画面が切り替わり「品川駅の近くで空いている駐車場を探して」と正確に認識しました!
「フレアイビル」がどういうロジックで「近くで空いている」に変換されたのかも謎が深まりますが、これはかなりすごい!(やればできる!)

最後に使用頻度が高い「自宅に行きたい(自宅に帰る)」ですが・・・
これもまずはこんな感じで、「キタクに行きたい」と、とんでもない認識です。こりゃ、当初は使い物にならないと感じたわけです・・・(北区に行きたいと認識しているのか?)

これも画面が切り替わり、無事に「自宅に行きたい」に変換してくれました!
多少認識に時間はかかりますが、変な目的地を検索するという結果にはならず、大成功です。

この他にも
「近くの○○○○」と発声する場合の音声認識は、認識率が格段に良くなっていることがわかりました。
「近くのスターバックス」
「近くのタリーズ」
「近くのファミレス」
「近くのドラッグストア」
上記のように、著名なチェーン店名も、新バージョンでは難なく認識することができたので、馴染みのない旅行先で立ち寄り場所を探すときには「近くの○○○」はなかなか有効と感じます。
(「近くの○○○○に行きたい」 という必要はなく、「近くの○○○○」だけで良いのは便利ですね)
その他、「地図にコンビニを表示する/非表示にする」のも音声認識でできるようになっているのは、普段都市部で生活していて、週末にゴルフに行かれる方などは便利と思いました。
(これを運転中にタッチパネルで操作しようと思うと、タズナから手が離れて落馬しそうになります…)
・・・ということで、2023年2月のアップデートにおいて、ようやく音声認識機能が実用的になってきたと感じました。
ただ、これは繰り返しになりますが、「認識されるコツ」や「話し方」がありますので、上記のページおよび、レクサス開発陣の「TEAM LEXUS BLOGS」をご参照の上、トライしてみてください。
特に初期納車された方は、ぜひ新バージョンの音声認識を試していただければと思います。
当方が現時点での望む、今後の要望としては次のことができるようになってほしいです。
■音声での目的地検索のオン/オフ
誤作動の原因は無限のパターンがある「目的地検索」と思いますので、この機能の「オン/オフ」ができれば、誤認識は相当減らせるのではないかと思います。もしくは音声検索で検索できるエリアを限定するとか・・・
ユーザーが感じるストレスの原因は「AIが誤認識」→「見当違いな目的地を検索」が主要因と思いますので・・・
流石に、東京で音声検索して、四国エリアの目的地を目的地候補として表示するのはあまり現実的ではないように思います。
■次のインターチェンジで降りたい
都市部に限らないと思いますが、ナビで示されたインターチェンジの手前で一般道に降りたい場合もしばしばあると思います。
このような場合、一度インターチェンジを降りても、再度高速道路に乗ることを支持されたり、高速道路走行のままであったりしますので、「自分はここから一般道で走行したい」意識を伝えることができればとても役立つと思います。これこそが音声認識ならではの機能と思いますので、ぜひ実現してほしいと思います。
■次のインターチェンジで乗りたい
上記のケースとは逆のパターンです。
都市部ではインターチェンジ間の距離(間隔)が短いことも多いです。料金の問題や渋滞の有無など、もう1つ先のインターチェンジまで「下道で行きたい」と思うこともしばしばあると思いますが、これを手動でナビに反映させるのは結構たいへんです。これが音声認識で対応してもらえるととても便利と感じます。
■ルート検索後の「一般道優先」/「有料優先」の切り替え
これはかなりニーズが高いと思うのですが、途中でルート検索方法を変更したいケースです。(高速道路を走行中、料金節約のため、一般道に降りるケースも含む)現状では、音声認識での変更方法はなさそうです。任意で下道に降りたのに、再度有料道路に乗ることを指示(案内)されることに不満を持つ方は結構いらっしゃるのではないかと思います。
■ドライブセレクトモードの変更
新型NXではドライブモードセレクトスイッチが付いているので問題ありませんが、「RX」、「RZ」では非装備ですので、ぜひ音声認識でドライブモードセレクトスイッチの切替替えがスムーズに(かつ「素早く」)できるようになってほしいです。
■効果音の変更(AIが認識しているかどうかの見分け方)
AIが「認識しているのか」「考えているのか」の区別が未だつきにくいです。
「無音(無反応)」の時間は、最新バージョンでもまだ気にあるところですので、AIが「調べているのか」、「エラーなのか」がまだまだシチュエーションが分かりづらいと思います。人間なら「表情」や「あいずちの有無」でわかるのですが、AIだとそのあたりがさっぱりわからないので、せっかく目の前に14インチディスプレイがあるのですから、これを補う方法が欲しいものです。
また、対話終了後の効果音(ビープ音?)も、「OK」なのか「キャンセル」なのか今ひとつ判然しないときがあるのも残念に感じます。
■使用頻度が高い発音例の表示
レクサスオーナーがよく使うもしくは全国的に人気の高い「用語」を「ヘイ、レクサス」のあとに14インチディスプレイに自動的に画面表示してくれると良いなぁと思いました。(やはり、「どうやって対話すれば良いのか」はつい忘れてしまいますので・・・)
■パノラミックビューモニター中の音声認識
パノラミックビューモニターを「オート」にされている方は、徐行走行中に、「PVM」の画面になっていることが多いと思いますが、音声認識はこのときには受け付けられません(カメラ関係の音声のみ認識)
個人的には、このような低速度域だからこそ、音声認識を行う余裕があると感じますので、「PVM」の画面のときも音声認識を受け付けてほしいと思いました。
■音声の個人ごとの学習機能
個人ごとに発音の癖があると思いますので主要なフレーズをあらかじめ実際に発声して認識率を高めるなど「学習機能」をもたせてほしいと思います。「ドライバー認証」の際に、その情報が呼び出されるのであれば認識率もより高められるのではないかなぁと感じています。
■できないことでも聞き取った内容は表示して欲しい
現時点では機能的にできないことでも、画面上では聞き取った対話は表示して欲しいと感じます。
例えば、運転席からは「助手席の窓を開けて」の音声は認識しないようなのですが、そもそも音声を聞き取っていないのか、その機能ができないのかがわかりません。
この場合、「運転席側からはその操作はできません」と言ってくれれば納得すると思います。
「TAZUNA」コンセプト移行後、運転席のタッチディスプレイから手の届かない範囲(画面の左隅など)にボタンやスイッチが配置されている部分がありますので、こういった部分の操作を「音声認識」で置き換えたり、ワンクリック(タップ)ではできないことを、「音声認識」で置き換えることがとても有用と思います。
手元のステアリングスイッチでできることは音声認識でやる必要はないようにも思いますので、ユーザーが「こうしたことをやってほしい」と販売店やメーカーに意見を伝える仕組みがあれば良いなぁと感じます。
ユーザーが今何をやりたいかをAIが感じ取ってくれるのであれば、大変魅力的に感じます。
車の中ということもあり、やりたいことはある程度限定されると思いますので、今後も「音声認識」の機能が進化していくと、更に魅力を増していくように思います。
音声認識機能はぜひ今後も操作改善が望ましい「TAZUNA」を補うツールとして進化していってほしいですね。
この記事へのコメント
ドラパン
周回遅れどころか・・・・
iモード携帯と最新iPhoneくらい、違いますよね。
メルセデスやBMW等の音声認識を試すと、あまりのレベルの違いに驚くと思います。
日本の技術が欧州勢に大きく遅れていることの証明でしょう。
なんとかならないものでしょうか。
鋼太郎
それにしても、どこのメーカーも物理スイッチを廃して、タッチパネルに集約、コストダウンしようとする流れは、個人的に非常に嬉しくないです。少なくともそれはハンドルから手を放さなくてもいいように音声コントロールなどのサポートを十分やってからにして欲しいですね。
サポートできたとしても、同乗者とかいたら例え家族でも「ヘイ、○○」とか言いたくないアップデートできてない人間ですので、ボタンはこの先ずっと残して欲しいですし、音声認識にしても、こちらから呼びかけるのでは無く(車の側から指示をうかがうカタチの)「ピッと鳴ったら~」をなくした「ピッ」だけの音声受付とかも残して欲しいです。
ともひろ
一昨年カローラスポーツを購入した会社の若い子も使い物にならないと言っています。ようやく使い物になる音声認識になりそうで何よりです。
にゃさぎ
ほぼ同じ量空くので、高さが揃って見栄えが良い!
手動だと揃えるのが中々大変なので、少し換気したい時に使えます。
換気効率は対角開けに劣りますが…美しく換気できますw
なまっくす
なるほど、全部の窓の高さが揃うんですね!
まさにそれは人間ではできないので、機械化・AI化の恩恵ですね!
そのように人間だとできない、難しいという機能の拡充を望みます。
>全部の窓を少し開けてが意外と便利でオススメです。
>
>ほぼ同じ量空くので、高さが揃って見栄えが良い!
>手動だと揃えるのが中々大変なので、少し換気したい時に使えます。
>換気効率は対角開けに劣りますが…美しく換気できますw
なまっくす
音声認識は、世界的な有名企業でもなかなか開発が進んでいないようですから、トヨタ/レクサス陣営も苦しいとは思いますが、車内利用に特化してより認識度を高めていけばさらに実用的になると思います。
ユーザーの気持ちに寄り添った反応をしてくれる日は来るのでしょうか・・・
> レクサスHSの音声認識、酷かったですね。レクサスの店舗に行くときしか活用出来ませんでした。オーナーズデスクが人力検索で優秀だったため気になりませんでしたが。
> 一昨年カローラスポーツを購入した会社の若い子も使い物にならないと言っています。ようやく使い物になる音声認識になりそうで何よりです。
なまっくす
お気持ちよくわかります!
クルマの場合はやることも限られますし、過去の行動からある程度AIが推測してくれても良いのでは・・・と思うのですがまだまだその領域には達していないですね。これは海外メーカーが先行しそうです。
物理スイッチ廃止の流れは加速していますが、そのうち少しずつ復活するおようにも思います。
AIとの対話ですが、対人間のように、ご意見いただいたような仕様になると更に使いやすくなりますよね!今は「命令(指示)」に従ってある程度きまった内容を認識するという仕様ですので・・・
>こちらの意図を汲んでくれるのでは無く、機械に合わせて工夫するというのは、便利さによって退化した現代人にとって新鮮と言いますか、なんとなく20年以上昔のYahoo!検索のような懐かしさを感じました。(笑って済ませていい話じゃありませんけど)
>
>それにしても、どこのメーカーも物理スイッチを廃して、タッチパネルに集約、コストダウンしようとする流れは、個人的に非常に嬉しくないです。少なくともそれはハンドルから手を放さなくてもいいように音声コントロールなどのサポートを十分やってからにして欲しいですね。
>
>サポートできたとしても、同乗者とかいたら例え家族でも「ヘイ、○○」とか言いたくないアップデートできてない人間ですので、ボタンはこの先ずっと残して欲しいですし、音声認識にしても、こちらから呼びかけるのでは無く(車の側から指示をうかがうカタチの)「ピッと鳴ったら~」をなくした「ピッ」だけの音声受付とかも残して欲しいです。
なまっくす
実は最近の欧州車の実情を知らず、やはりそれほどの格差ですか!
メルセデスのMBUXがその後どれだけ進化したのか一度チェックしてみないとダメですね。
もしかして日本語が難しくて英語だとすんなり認識しているとか(そんなわけないですかね?)
いずれにせよ、まだまだスタートラインに立ったレベルかと思いますので、ぜひギアをあげて進化していってほしいですね。
>音声認識は、欧州勢に遠く及びませんよ。
>周回遅れどころか・・・・
>iモード携帯と最新iPhoneくらい、違いますよね。
>
>メルセデスやBMW等の音声認識を試すと、あまりのレベルの違いに驚くと思います。
>
>日本の技術が欧州勢に大きく遅れていることの証明でしょう。
>なんとかならないものでしょうか。
なまっくす
オーナーズデスク、今の利用頻度はどうなんでしょうね〜
当方は年に1度使用するかどうかの頻度まで下がっていますし、予約系は使ったことないです。
クレジットカードでもプラチナ、ゴールドなどでは専用デスクがありますが、一般的な方は使用していないようにも思いますね。
よほど時間がない方や経営者の方などは使用しているのでしょうか・・・
今後、AIも更に進化していき、検索エンジンを置き換える存在とも言われていますし、オーナーズデスクも詳細的には不要となるのかもしれませんね。
>オーナーズデスクでも昔からレストラン、ホテルの予約にやたらこだわっていますが富裕層などはほんとに使ってるのでしょうか。自分は一生使わない案件です。エージェントがパワーアップしたらオーナーズデスクも使わないですね。