話題のスマートスピーカーで本当に音楽が楽しめるのか徹底検証した

f:id:tamaranche:20180208101434p:plain

最近話題のスマートスピーカーでは、音楽が楽しめることがウリの一つになっている。しかし一音楽好きとして、本当にスマートスピーカーで音楽が楽しめるのかと疑問を感じる部分もあったので、独自に検証と考察を行ってみた。

本エントリーの構成は以下の通りである。

はじめに

毎年恒例、日経MJが選ぶヒット商品番付の2017年版では西の大関に選ばれたAIスピーカー(本エントリーでは「スマートスピーカー」に統一)は、確かに2017年を象徴するデジタルデバイスといえる。このスマートスピーカーはインターフェースが音声ということもあり、「音楽と親和性が高く音楽消費の起爆剤になる」と一部では期待されていたりもする。

Amazon Mucic副社長のスティーブ・ブームは、Amazon Alexa/EchoとAmazon Musicの連携について以下のような可能性に言及している。

jaykogami.com

子供はAmazon Echoで、Alexaに歌詞を言って、好きな曲をリクエストしています。人はアーティスト名や曲名を知らなくても、歌詞を覚えている時がありますよね。Alexaは歌詞の一部分を聞けば、その曲を再生してくれます。Alexaを軸にどんな音楽体験が提供できるかを常に考えています。グループリスニング、新たなリスナー層、アンビエント・リスニング、オンデマンドと、あらゆるチャンスが考えられるからです。

また以下の記事では著名な音楽評論家が集まり、スマートスピーカーが音楽ライフを大きく変える可能性についても触れられている。

realsound.jp

僕もスマートスピーカーには持論があって。スマートスピーカーって、ウォークマン以来の転換点になるかもしれないと思っているんです。何故かと言うと、音楽プレイヤーのテクノロジーはウォークマンiPodiPhoneスマートフォンと発展してきたんですけど、基本的にはそれらは全て耳元で音楽を聴く「パーソナルミュージック」としての音楽体験のイノベーションなんですよね。つまり、何を聴くかを自分で選ぶ、音楽を聴きたいという欲求がある人が周りを気にせずに聴くためのテクノロジーだった。でも、スマートスピーカーはそうじゃないですからね。リビングで音楽を聴く「ファミリーミュージック」のイノベーションだと思っているんです。だから、リラックスできるBGM的、最大公約数的な音楽がより生まれやすい状況にもなるし、親と子供が音楽を共有する機会も多くなる。おそらく、2021年以降はそんな時流が生まれそうな気がします。

冒頭に書いたように、私はこれらの論調にいささか懐疑的である。

音声入力は確かにこれから普及するインターフェースであろう。しかしスマートスピーカーと音楽の組み合わせは、音楽の再生手段が一つ増えるだけだ。Amazonは自社プロダクトを売りたいから大げさな話をしているだけである。音楽評論家はそれらを無批判的に受け入れすぎである。

これが私のスマートスピーカー×音楽に対する見解である。これはUXに関わる仕事をするものとして、人々の音楽体験の有り様をできるだけ冷静に脳内シミュレーションした上での見解である。

しかしながら使いもせずに憶測だけで結論付けるのは私の信条に反する。実際に使えば新しい発見があるかもしれない。確かにこれは音楽の新しい楽しみ方だと思えるかもしれない。

というわけでGoogle Home Miniを購入した。Google Home MiniはGoogle Homeの廉価版であり、スピーカー性能以外の違いはない(以降はすべてGoogle Homeと称する)。このGoogle Homeは、Google Play Music以外にSpotifyとも接続できる。

世界で7000万人以上が有料会員となっているSpotifyは現時点ではもっとも進化しているストリーミングサービスといえる。使い比べればわかるが、リコメンド等の機能は他サービスよりかなり洗練されている。Spotifyの優位性をより具体的に知りたい方は、私が昨年執筆した以下の記事をご覧いただきたい。

tamaranche.hatenablog.com

もちろん、Google Home×Google Play Music、あるいはAlexa×Amazon Musicという選択肢もある。ただ、新規参入のこれらサービスが今のSpotify並みに洗練されるにはあと2~3年は要するのではないだろうか。つまり2018年現在、スマートスピーカー×音楽の最先端を体験するならGoogle Home×Spotifyがベストでは、と考えた次第である。

このGoogle HomeSpotifyを使って、スマートスピーカー×音楽の実力を測るいくつかのテストを行った。これは主に再生装置としての性能テストである。この検証を受けて、スマートスピーカーが本当に私たちの音楽ライフを変える可能性があるのか、現時点での結論を出してみたい。

ちなみにGoogle Homeへの呼びかけはすべて「OK Google、○○かけて」のフォーマットで行っている。途中で登場するカギカッコ付きのアーティスト名、アルバム名、曲名、歌詞、キーワードなどはすべてこのフォーマットの○○に当たる部分である。

なお、私はプログレの影響を受けた音楽ブロガーなので基本的にエントリーはいつも大作主義で長大である。本エントリーは比較的コンパクトにまとまったが、それでも16,000字超ある。記事はブックマークするなどして、細切れで読んでいただいた方がいいだろう。

検証1:アーティスト名から再生する

アーティスト名は音楽聴取の検索軸として最もポピュラーである。そこでまず、スマートスピーカーにおいてアーティスト名からの再生がどの程度うまくいくのかテストしてみた。

Google Home音声認識は優秀という話は以前から聴いていたが、実際その認識精度はかなり高い。例えば「アンド・ユー・ウィル・ノウ・アス・バイ・ザ・トレイル・オブ・デッド」という長いアーティスト名でもきちんとAnd You Will Know Us By The Trail Of Deadの曲を再生してくれる。海外アーティストだからといってネイティブの発音に合わせる必要もない。Oasisは「オエイシス」ではなく「オアシス」できちんと再生してくれる。

ただし実は長いアーティスト名より短すぎるアーティスト名の方が再生が難しい。例えば「ゼッド」を何度試してもZeddは再生されない。時々Enuff Z’nuffが再生される以外はエラーになる。「シーア」ではSheena And Rockets が再生され、3回目のトライでやっとSiaがかかった。滑舌が悪い人には厳しいアーティスト名といえる。

P!nkを期待して「ピンク」と指定しても、残念ながら再生されるのはPink Floydである。「トー(toe)」や「サン(Sunn O))))」のようなさらに極端に短いアーティストになると、エラーが返ってくるだけだ。このように音声入力に不向きなアーティスト名が存在する。

さて、音楽好きならアーティスト名と同じセルフタイトルのアルバムが存在することはご存じだろう。この場合Google Home×Spotifyはどちらを優先するのだろうか。

結論からいえばアーティスト名よりもアルバム名が優先される。「メタリカ」と指定した時に再生されるのはアルバム『Metallica』の1曲目”Enter Sandman”である。Metallicaの場合は代表作&代表曲なのでまだいいが、「モトリー・クルー」は不人気作『Motley Crue』の1曲目"Power To The Music"を再生してしまう。(個人的には本作は彼らの最高傑作のひとつと思っているが…)

ただ実は法則性はハッキリしない。「テイラー・スウィフト」の場合、デビューアルバム『Taylor Swift』の1曲目”Tim McGraw”が再生されるわけではなく、最新作『Reputation』の1曲目”…Ready For It?”が再生される。つまり、必ずしもアルバム名がアーティスト名より優先されているわけでもないようである。

さて、日常会話ではアーティストを略称で呼ぶことも多いだろう。スマートスピーカーが気軽に話しかけられるフレンドリーなデバイスであるならば、略称でもある程度再生してほしい。そこで略称からの再生もいくつか試みた。

レッチリ」でRed Hot Chilli Peppers、「マニックス」でManic Street Preachers、「リンキン」でLinkin Parkがきちんと再生された。このあたりは予想通りではあるが「アクモン」でArctic Monkeysが再生されたのは驚いた。「ガガ」では、1回目はKARAを再生したが、2回目はLady Gagaを再生された。

また「ドリカム」「ワンオク」「モンパチ」「9ミリ」「エレカシ」「ミッシェル」「ジュディマリ」といった日本人アーティストも問題なく再生することができた。

ただ、Guns N' Rosesを期待して「ガンズ」といってもL.A.Gunsしか再生されない。Rage Against The Machineを期待して「レイジ」も残念ながら倖田來未の"0時前のツンデレラ"が再生される。当然ながらドイツのRageが再生されるということもない。

人名におけるファーストネームとなるとさらに意図した再生は難しい。「ポール」でポール・マッカートニーを再生してくれるのは多くの人の期待通りだと思うが、「ジョン」でジョン・レノンを再生してはくれない。再生されるのはジョン・メイヤーである。「マイケル」といって期待しているのは当然マイケル・ジャクソンだが、再生されるのはジョージ・マイケルである。いずれにしろ、アーティスト名が人名の時は、フルネームでの指定が無難である。

ところで「レイジ」を指定すると 倖田來未の"0時前のツンデレラ"を再生するとあるが、よく考えるとおかしな話である。

というのも、Spotifyには1年以上の私の再生履歴が残っており、Rage Against The Machineを聴いた履歴はあっても、 倖田來未を聴いた履歴はないはずである。にも関わらず、「レイジ」というキーワードを「0時」と理解し、必ず倖田來未の"0時前のツンデレラ"を再生するというのは、ようするに再生履歴など見ていない、その人の音楽的趣向はまったく反映されてない、ということでもある。

これは正しくアーティスト名を指定した時も同様で、好みに合わせて曲が変わることはなく、いつも同じ曲が再生される。Spotifyには実は 「This is:Michael Jackson」 「This is:Taylor Swift」 といった、そのアーティストの曲ばかりを集めた 「This is:~」シリーズのプレイリストが存在する。これが存在する場合には、このプレイリストの1曲目を再生する。このプレイリストが存在しない場合には、そのアーティストの「人気の曲」の1曲目がかかる。

もちろんこれはスマートスピーカーというよりSpotifyAPIの問題だろう。だがいずれにしろ、 Google Home×Spotifyには機械学習もパーソナライズも存在しない。単なる音声入力装置である。しかもそれは、今までの指を使った入力装置よりも遥かに精度が低い。皆が期待しているであろう「あなたの好みを察知してスマートスピーカーが自動的に音楽を選んでくれる」というのは、現時点では実現していない。

検証2:アルバム名から再生する

続いてアルバムを指定した時の再生状況を検証した。音声入力に限らず、アルバム名をいきなり指定するような選択方法は実はあまり多くないはずである。

というのも、例えばiPhone/iPodでライブラリからアルバムを指定するときは、まずアーティストを選び、そこからアルバムを選択するはずである。正式なアルバム名は覚えておらずジャケットの印象で覚えていることも多い。同名タイトルも含めて膨大に存在するアルバム群を、アルバム名だけでピタリと探し当てるのは音声入力に限らずそもそも困難である。

そこでここではややハードルを下げて、主に「アーティスト名+アルバム名」で指名したときにどこまでうまく再生できるかを検証してみた。

結論からいえば、多くの場合は問題なく再生された。「ケンドリック・ラマーのダム」と指定すれば『DAMN.』を再生してくれるし、「ビートルズアビーロード」と指定すればちゃんと『The Abby Road』を再生してくれる。また、数字を日本語読みしても大丈夫である。「アデルのにじゅういち」と指定すれば『21』を再生してくれるし、「ブルーノマーズのにじゅうよん・ケー・マジック」と指定してもきちんと『24K Magic』を再生してくれる。

また一部の洋楽には邦題が付いているがこれも大丈夫である。「エアロスミスの野獣生誕」と指定すればアルバム『Aerosmith』が再生され、「クイーンの世界に捧ぐ」では『News Of The World』が再生され、「ピンクフロイドの狂気」では『The Dark Side Of The Moon』が再生される。Spotify側のデータベースで邦題の登録がされているものは大丈夫と考えていい。

次にアルバム名と同名の曲が存在する場合どちらを優先するか検証してみた。結果からいえば、曲ではなくアルバムが優先されるようだ。

アリアナ・グランデのマイ・エブリシング」と指定しても楽曲"My Everything"ではなくアルバム『My Everything』の1曲目"Intro"が再生される。「メタリカのマスター・オブ・パペッツ」と指定しても楽曲"Master Of Puppets"ではなく、アルバム『Master Of Puppets』の1曲目の"Battery"が再生される。

しかしこれはある特定の曲を指定したい時にはやっかいな仕様である。というのも、アルバム名と曲名が同じで、かつそれが1曲目でない場合は、曲を指定して再生させることが不可能になるからである。

次に別の角度からの検証をした。まずリリース順の指定である。残念ながらこれは成功しなかった。「ビヨンセの 1枚目のアルバム」と指定しても、エド・シーランとのデュエット曲"Perfect Duet"が再生され、「デヴィッド・ボウイの5枚目のアルバム」と指定しても、『Ziggy Stardust』ではなくデビューアルバム『David Bowie』が再生された。このような指定の仕方だと、アーティスト名だけ拾って再生するようである。

アルバムのリリース順など、そもそもデータとして保持していない情報を指定して再生させることは無理がある。そう考えてデータとして保持しているリリース年での指定を試みた。しかしこれもすべて失敗した。「ケイティ・ペリーの2013年のアルバム」と指定しても同年リリースのアルバム『Prism』が再生されることはない。

一方「〇〇のベストアルバム」という指定の仕方は比較的成功しやすい。QueenThe PoliceABBABlurFoo FightersU2マライア・キャリーマイケル・ジャクソンエルトン・ジョンビョークなどはきちんと再生された。ただし、ビリー・ジョエルGreen Dayなどのようにベストアルバムが存在するのに再生してくれないケースもあるので完璧ではない。

同様の指定の仕方で「〇〇のライブアルバム」も試してみたところ、Deep Purple、Kiss、ブルース・スプリングスティーンダニー・ハサウェイなどのライブの名盤がきちんと再生された。ただし同じく名盤と言われるThe WhoCheap TrickMotorheadThin Lizzyボブ・マーリーなどはすべて失敗に終わった。

このように、アルバムの指定はそれなりには使えるが、課題はかなり多い。スマートスピーカーだからこそ期待したい曖昧検索はほぼ使えないレベルであり、成功確率は「アルバム名を正しく覚えているか」ということにかなり依存している。TheやAの有無や「てにおは」など多少の違いは吸収してくれるが、アルバム名をまったく覚えていない場合や誤って覚えている場合にはスマートスピーカーでの再生は不可能になる。

例えばColdplayの『Mylo Zyloto』は「マイロ・ザイロト」と読むが、「マイロ・ザイトロ」と間違って覚えてしまっている人は再生させることができない。また読み方がよく分からないアルバムも再生できない。英語ではないSigur Ros 『Ágætis byrjun』 『()』やエド・シーラン『+』『×』『÷』のようなタイトルのアルバムは、音声入力には不向きである。

私自身は音声入力によるアルバム再生の不便さから、むしろアートワーク(ジャケット)の重要性を再確認した。人は案外アルバム名ではなくてアートワークのイメージでアルバムを覚えているものだ。このような観点からも、アルバムを指定した再生は音声入力よりも視覚インターフェースの方が圧倒的に有利といえるだろう。

検証3:曲名から再生する

アーティスト、アルバムとくれば次は曲だが、これまでの話からどういうふるまいをするか、概ね想像できることだろう。

まず、アーティスト名を含まず曲だけを指定した場合、同名異曲がほとんどなければほぼ意図通りにかかる。「スメルズ・ライク・ティーン・スピリット」と指定すればきちんとNirvanaの”Smells Like Teen Spirit”が再生されるし、「ホワット・ドュー・ユー・ミーン」と指定すれば、きちんとジャスティン・ビーバーの"What Do You Mean?"が再生される。アルバム名同様、TheやAの有無、複数形/単数形の違いくらいであれば、だいたいは吸収してくれる。

印象論にはなるが、全般的にアルバム名を指定するよりも意図した曲がかかる確率は高い。ただし「イマジン」と指定しても、ジョン・レノンの"Imagine"は再生されず、なぜかベリー・バサルテというスペインの女性シンガーによる"Imagine"のカバー曲がかかる。昔から知られている有名な曲はカバー曲が存在することが多いので、アーティスト名を覚えているのならば、曲名だけでなくアーティスト名も指定した方が確実なのは言うまでもない。

カバーだけでなく、同名異曲が多く存在するケースもやはりアーティスト名を指定しないと希望の曲はかかりにくくなる。

「ハッピー」と指定すればファレル・ウィリアムズの"Happy"をかけてくれるが、「エブリシング」を指定しても、Misiaの"Everything"ではなく、The Juliana Theoryというロックバンドの"Everything"が再生される。「ウィズアウト・ユー」はマライア・キャリーのカバーバージョンの"Without You"が再生され、「ダイヤモンド」ではリアーナの"Diamond"ではなくGalaxyというアイドルの"大声ダイヤモンド"という曲が再生され、「シャングリラ」では電気グルーヴの"Shangri-La"ではなくチャットモンチーの"シャングリラ"がかかる。全体的に「そのキーワードを含むもっとも人気がある曲」という法則に思えるが、確実にそうでもなく、何が再生されるかは事前に予想しにくい。

ではアーティスト名を組み合わせて指定すれば確実かというとそれも完璧ではない。なぜなら最近は同じアーティストの同じ曲でもバージョン違いがあることが珍しくないからである。例えば「ダフト・パンクのゲット・ラッキー」ではアルバムバージョンではなくRadio Editバージョンが再生される。「フローレンス・アンド・ザ・マシーンスペクトラム」では、Florence + The Machineの"Spectrum(Say My Name)"のCalvin Harris Remixが再生される。「エックス・ジャパンのエンドレス・レイン」では、なぜかライブバージョンの"Endless Rain"が再生される。

実は曲を指定してから音楽を聴き始める際には、その曲の再生が終わった後に何が再生されるのか、という点も体験として重要になる。

曲は多くの場合、3~5分程度で終わるが、その後どういう風に音楽が流れてほしいか意識して選択することも多いのではないだろうか。もう少し具体的には、曲を指定して音楽を聴き始める時、その曲を聞き終えたときに期待していることは、以下の5パターンに分かれる。 

  1. その曲だけ聴いて終わる
  2. その曲から続けて似たようなタイプの曲をランダムに聴く
  3. その曲から続けてアルバムの順に音楽を聴く
  4. その曲から続けてアルバムをシャッフルで聴く
  5. その曲から続けて同じアーティストの他の曲を聴く

このうちスマートスピーカーでできるのは2だけである。1はできず、自動的に似た曲がかかる。これは大きな問題ではないが、3、4、5の使い方をしたい場合には、曲が終わってすぐに次の曲を指定しなければならない。当然ながら、視覚インターフェースで再生する場合には1から5のすべてが実現できる。

これを十分と捉えるか、不十分と捉えるかは、人それぞれの音楽の聴き方に左右されるだろう。ただ少なくとも、曲を起点とした音楽体験においてもスマートスピーカー×音楽には大きな制約があり、人によっては再生手段としては「あまり使えない」と判断される可能性は高いのではないか。

検証4:歌詞から再生する

冒頭で引用したAmazon Music副社長スティーブ・ブームによれば、Alexaは歌詞の一部を伝えるだけでその曲をかけてくれる機能があるらしい。これまで調査したように、融通が利くとは言い難いスマートスピーカーの特性を考えると、歌詞という膨大な文字情報の中から、特定の曲を見つけ出して再生することなどが本当に実現できるのだろうか?手元にあるのはAmazon Echoではないが、Google Home×Spotifyで同様のことができるか確かめてみた。

ふとQueenの"Bohemian Rhapsody"の一節、"Mama, just killed a man"という歌詞が思い浮かんだので、「Mama, just killed a man」と下手な英語で試してみた。1回目は失敗し、やはりと思って二回目を試したら、驚いたことにきちんとQueenの"Bohemian Rhapsody"が再生された。

他の一節でも再生されるのかと思い、同じく"Bohemian Rhapsody"から「Galileo, Galileo, Galileo Figaro」と試したところ、やはり"Bohemian Rhapsody"が再生された。「Slip inside the eye of your mind」と指定すればOasisの"Don't Look Back in Anger"が再生され、「There's a fire starting in my heart」と指定すればAdeleの"Rolling In The Deep"が再生された。これは成功すると結構テンションが上がる。

なお、歌詞による再生は曲を再現しようとメロディを付けたり癖のある言い方をすると失敗しやすい。これは、曲の一節をメロディも含めて覚えているわけではなく、単に歌詞のテキストデータとマッチングさせているだけだからだ。

" I might be too much but honey you're a bit obscene"という歌詞を「アイ・マイト・ビー・トゥー・マッチ・バット・ハニー・ユア・ア・ビット・オブシーン」と丁寧に指定すれば正確にGuns N' Rosesの"Rocket Queen"を再生してくれるが、アクセル・ローズ気取りで「アマービートゥーマチバハニユアビドブスィ~ン」と歌い方まで真似て指定しても失敗する。

洋楽の主要なアーティストが概ねうまく行ったので、日本人アーティストも試してみた。まず最近配信されたばかりの宇多田ヒカルの"First Love"の冒頭の一節から「最後のキスはタバコのFlavorがした」を指定したが、残念ながら何度やっても台湾映画のサントラ曲"最後的浪花 - Zui Hai De Ma Wei"が再生されてしまう。

途中でFlavorという英語が入っているから難しいのかと思い、梅沢富美男"夢芝居"の歌詞の一節から「男と女あやつりつられ」と指定したが、言葉自体は正確に認識してくれたが、利用できる曲がないと言われてしまった。梅沢富美男の"夢芝居"はSpotifyで配信されているので、歌詞が正確に認識できるのであればきちんと再生されるはずである。

もしかして日本人アーティストはすべてダメなのかと思い、Spotifyでは再生回数が最も多い日本人アーティストONE OK ROCKで、1000万回以上と最も再生されている"The Beginning"の一節から、「でも譲れないもの握ったこの手は離さない」と指定したところ、これはきちんと再生された。ONE OK ROCKでは600万回近く再生されている"Clock Strikes"の一節から「永遠なんてないと言い切ってしまったら」を指定してもやはり成功した。

次にhideの"ピンクスパイダー"の「君は嘘の糸張りめぐらし」「ケバケバしい君の模様が寂しそうで」「捕らえた蝶の命乞い聞かず」のいずれも試したが、正確に言葉は認識しているものの"ピンクスパイダー"が再生されることはなかった。

続けて、BOOWYの"MARIONETTE"から「もてあましてるFrustration」「嘘を呑み込み静かに眠ってる」「灼けつく日陽しが俺達を狂わせる」を試したがいずれもダメだった。ちなみに曲名が含まれているから「鏡の中のマリオネット」はいけるだろうと思ったが、これも再生されなかった。

同じくエレファントカシマシの名曲"今宵の月のように"の冒頭から「くだらねえとつぶやいて」、スピッツの名曲"ロビンソン"の冒頭から「新しい季節はなぜかせつない日々で」、Dreams Come Trueの名曲"Love Love Love"のサビから「LOVE LOVE 愛を叫ぼうを」のいずれも試したが、失敗に終わった。

そんな中、Superflyの名曲"愛をこめて花束を"の冒頭「二人で写真を撮ろう」は再生された。ここである仮説が頭をよぎった。日本人アーティストのほとんどはSpotify上では再生数が少なく、人気曲でも数十万回に留まっているが、"愛をこめて花束を"は200万回以上再生されている。そこから「もしかして100万回以上再生されている曲のみ再生されるのでは?」という仮説が閃いた。

まず、ONE OK ROCKで120万回再生されている"Take What You Want"の一節から「過ぎ去った嵐の後の静けさに」と指定したところ再生されなかった。続いて170万回再生されているMAN WITH A MISSIONの"Seven Deadly Sins"の一節「彷徨い問う者も戸惑い乞う者も」を試したがやはり再生されなかった。また100万回以上の再生数があるX Japanの"Endless Rain"の一節から「ふるえる身体を記憶の薔薇につつむ」もやはり駄目だった。

もしかしたら200万回以上再生が基準なのではと思い、250万回くらい再生されているピコ太郎の"PPAP"から冒頭の「I have a pen」と指定したところ、これはきちんと再生された。

このように、歌詞による再生がうまく行くどうかには、再生数が影響しているように思える。ただ、日本人アーティストの多くは再生回数がかなり少なく、邦楽は歌詞からの再生があまり使えないと思っておいた方がいいかもしれない。

さて日本人から離れて、洋楽でも200万回未満の再生回数の曲は再生されないのか試してみた。洋楽で200万回以下の再生回数というのは結構マイナーになるのだが、結果からいうと、200万回未満どころかそれ以上でも再生されないことが多かった。これは曲が見つからないケースと、似たような歌詞や曲名を持つより有名な曲がかかってしまうケースに分かれたのだが、いずれにしろ、歌詞からの再生というのは、再生回数が多いメジャーな曲に限られる、と考えておいた方がいい。

これらを総合的に踏まえると、歌詞から再生は成功すると楽しいが、成功確率は低い。またそもそも、曲名を覚えていない以上に、歌詞をきちんと覚えていないことも多くはないだろうか?そう考えると、歌詞からの再生は画期的ではあるが、そんなに使い道がある機能ではないように思える。

検証5:テーマやジャンル名から再生する

音声インターフェースの特性を冷静に考えれば「音楽を正確に再生することには不向き」とすぐに想像できるだろう。私たちはアーティスト名、アルバム名、曲名、歌詞を正確に覚えていないことが多いし、アルバムや曲には同名異曲が存在する。非選択式の音声インターフェースで、その中から一つを探し当てるのはそもそも困難である。

そのため上記のような、アーティスト名、アルバム名、曲名、歌詞できちんと再生できるかどうかを検証するというのは、最初からできないと分かっているのにテストをさせて「ほら、できないじゃないか」と指摘するような意地悪な行為であったかもしれない。「OK Google、大変申し訳ございません」と一言謝っておくべきだろう。

実際のところ、スマートスピーカー×音楽で期待している人の多くは、「指定した音楽を正確に再生すること」ではなく、「曖昧な要求から好みの音楽を再生してくれること」ではないだろうか。そういう意味では、ジャンルやテーマのような曖昧な指定でどのくらい気の利いたリコメンドをしてくれるかが、スマートスピーカーの真価を問う検証となる。

まず試みたのは漠然としたテーマ、あるいは楽曲の種類による再生である。

まず「クリスマスソング」と指定したところ、ケリー・クラークソンの"Underneath The Tree"が再生された。日本人にはあまり馴染みがないかもしれないが、著名アーティストによる立派なクリスマスソングである。ただし、クリスマスソングがランダムに再生されるわけではなく、他の曲が再生されることを期待して再び指定をしても、またこの曲からスタートする。これは厳密にはクリスマスソングを探し当てて再生しているのではなく、『クリスマスソング・洋楽』というタイトルのプレイリストが検索にヒットし、その1曲目が再生されるからである。

考えてみれば当然のことである。曲に「クリスマス」といったメタデータが含まれていない限り、縦横無尽にクリスマスソングを抽出するような検索は不可能である。曲名やプレイリストのタイトルなど、メタデータの代わりになるなんらかのテキストで代替するしかない。

そんな基本特性を理解しながら、続いて「ドライブの曲」と指定したところ『ドライブ×ロック!Drive×J-Rock!』というプレイリストがヒットし、ユニコーンの"SAMURAI 5"が再生された。ドライブのプレイリストは他にも多く存在するのだが、なぜかこれに固定される。これまでの検証でも分かる通り、個人の聴取履歴は一切反映されず、私が日本の音楽をあまり聴かない、という傾向は一切考慮されない。

また「楽しい曲」と指定すると、Aphex Twinの"4"が再生された。Aphex Twinを知る人ならわかると思うが、彼の作品には不気味な曲はあれど楽しい曲など存在しない。この曲も楽しいどころか不穏な空気すら流れる実験的な楽曲である。これは『Something New by くるり』というプレイリストがヒットし、その1曲目が再生されるからなのだが、なぜ「楽しい曲」でこのプレイリストが再生されるのかは謎である。

さらに「オシャレな曲」と指定したところ、Walk The Moonの"Shut Up And Dance"が再生された。この曲がオシャレかどうかはさておき、ヒットしたプレイリストは『ドライブを100万倍盛り上げてくれるオススメ10選(行き道)~洋楽編~VOL.1』である。マッチングするキーワードがタイトル内に存在しないこのプレイリストがなぜ再生されるのか、これもやはり謎である。

法則性は掴めないが基本的にはプレイリストを探しにかかる、という特性を掴んだので、パーティー向きの曲が集まったプレイリストの再生を期待して「パーティーの曲」と指定した。しかしこれで再生されたのはBloc Partyの"Flux"であった。

また春に相応しい曲を集めたプレイリストを期待して「春の曲」を指定したが、枝豆みどりというアーティストの"無言歌集第5巻第6局イ長調 Op.62「春の歌」"という曲が再生された。また「朝の曲」ではドミトリー・カバレフスキーの"6つの前奏曲とフーガOp.61:ト長調「夏の朝の芝生」"が再生された。

このように、テーマと似た名前のアーティストや曲が存在すると、プレイリストよりもそちらを優先してしまうようだ。ともあれ、曖昧なテーマの指定は何が再生されるのか予想しにくく、期待したテイストの音楽が再生されることも少なく、ほとんど使い物にならない。

次に、ジャンルを指定する検証を行った。まず「ジャズ」と指定すると『X-Over Jazz』というジャズを集めたプレイリストを再生した。なぜこのプレイリストなのかは謎だが、ひとまずジャズっぽい音楽は再生された。次に「ロック」を指定すると、またまた『ドライブ×ロック!Drive×J-Rock!』が再生された。ロックという幅広い音楽を指定しながら、なぜピンポイントでこのプレイリストを再生するのだろう。

「ヒップホップ」では、プレイリスト『こたつとヒップホップ』が再生され、あっこゴリラの"ゲリラ×向井太一"が再生された。確かにヒップホップだが、洋楽のヒップホップが再生されると思っていたため、意外な結果であった。

「メタル」を指定したところ、Judas Priestの"Breaking The Law"を再生した。これは多くのメタルファンが納得する選曲だろう。ただこの指定だと「This is:Judas Priest」のプレイリストを再生し、ずっとJudas Priestを聴くことになる。

さらにジャンルを絞って「デスメタル」を指定したところ、真島昌利の"ですメタル"という曲が再生された。「ブラックメタル」では、ILL Billというヒップホップアーティストの『Black Metal』というアルバムが再生された。

また「シューゲイザー」では藍井エイルの"シューゲイザー"という歌謡曲っぽい曲が再生された。「EDM」では、『EDM潮電音』という台湾で作られたプレイリストが再生された。EDMのプレイリストは多いが、なぜこれを指定するのかはやはり謎である。

次に「オルタナティブ」を指定したところ、私が自分で作った『Alternative』というプレイリストが再生された。このように自分のアカウントで作ったプレイリストがある場合にはそれを優先してくれるようだ。ということは、事前にプレイリストを作っておき、それをスマートスピーカーで指定する、という使い方が可能である。

実際、私自身が作った『誰もが知ってる洋楽』『ONE OK ROCK好きにおススメの洋楽』『J Rock Of My Life』を指定したところ、どれも私が作ったプレイリストを再生してくれた。プレイリストを日ごろから作っている人は、スマートスピーカーで自分好みの曲を再生させることができる。

ただ「ポストロック」では私が作った『Post Rock』というプレイリストではなく『ジャズとポストロック』というSpotifyが提供しているプレイリストが再生された。つまり、スマートスピーカーで再生するには他に存在しないユニークなプレイリスト名にしておく必要があるということである。

このように、いくつかの条件をクリアすれば、曖昧なテーマやジャンル名から自分の好きな曲を意図してかけることはできそうだ。ただ、プレイリスト作成を事前にしておくなどが前提の話でもあり、「曖昧な指定で気軽に好みの曲を勝手にかけてくれる」という状況からは程遠い状況ともいえる。

私の結論

さて、上記のような検証を行った上での私の結論は、以下の通りだ。

スマートスピーカーは私たちの音楽ライフを特に変えない」

理由は大きく2つある。まず機能不足である。上記検証でも分かるように、現時点では再生装置としてそもそもかなり役不足である。

音声による音楽再生の最大のメリット(もしくは期待ポイント)は、スピードとリコメンドだ。しかし、スピードを殺すほどに失敗率が高く、個人の好みやトレンドを考慮したリコメンドは一切ない。そもそも一連の音楽体験の中で曲を選択するのは数分から数十分に一度の行為である。元々「面倒くさい作業」でもないのに、わざわざ融通の利かない音声入力を選択する必然性がない。

この機能的欠落が、愛用する人をかなり限定する。まず聴きたい音楽や好みがハッキリしている音楽マニアや音楽好きはスマートスピーカーの対象から外れるだろう。物珍しさでしか使い道がない。

もしスマートスピーカーで音楽を聴き続けるとしたら、音楽にあまりこだわりがない層である。「楽しい曲」と指定してAphex Twinの不気味な曲がかかり、「パーティーの曲」と指定してBloc Partyというよく知らない外人の曲がかかってもあまり気にしない人たちである。(Bloc Partyは有名なアーティストだが、日本では音楽にこだわりがない人が聴くタイプのアーティストではないだろう)

しかしながら、この手の人はそもそも音楽にそれほど興味がない。頻繁に音楽は聴かないし、他の娯楽が侵食すればすぐに音楽の座は奪われてしまう。そんな人たちが、スマートスピーカーが存在するだけで音楽を頻繁に聴くようになるとは考えにくい。彼らはスマートスピーカーがないから今まで音楽を聴かなかったのではない。単純にそもそも音楽がそれほど好きじゃないだけである。彼らがスマートスピーカーの登場で「ウォークマン以来の転換点」などという現象を巻き起こすとはなかなか考えにくい。

ここでも少し触れたが、スマートスピーカーが音楽ライフを変えない最大の理由は、UX上の問題である。

スマートスピーカーが多く設置される場所はおそらくリビングだろう。しかしリビングに設置された時点で、音楽聴取におけるスマートスピーカーの存在はかなり限定的になる。

スマートスピーカーが音楽ライフを変える」と主張する人の考えは、「スマートスピーカーがある→音楽を聴く」というロジックなのだろう。しかしこれは逆である。「音楽が聴きたい→スマートスピーカーがあれば使うかも」である。

冷静に考えてみよう。家族と共有している親子4人家族では、リビングでTVを付けたまま、それぞれがスマホを見たり、家庭内の用事を片付けたりしているシーンが思い浮かぶ。このような状況ではスマートスピーカーの有無に限らず、そもそも音楽は聴かれない。なぜなら音楽の趣味がそれぞれバラバラだからだ。このようなリビングにスマートスピーカーが置かれたからといって突然「みんなで音楽を聴こう!」とはならない。お父さんがBlack Sabbathをかけて娘から「何この変な音楽」と言われるのがオチである。

また、私自身は夫婦2人暮らしで、それぞれ音楽が好きで、それなりに趣味が共通する部分もある。さらにいえば、購入して3カ月となるが、天気、気温、近所のお店の開店時間、その日の予定など、毎日のようにGoogle Homeに話しかけており、比較的継続して使っている方ではないかと思う。

そんな私たちですら、音楽をかけたことは一度しかない。クリスマスだけである。しかしそれも上記検証のように、プレイリストの特性上同じ曲順で再生するために、一度再生しただけに留まっている。

LINEのスマートスピーカー、Clova FriendsのCMでは、実際にスマートスピーカーを使って音楽を楽しむシーンが描かれている。


【CM】LINE Clova Friends ライン クローバフレンズ ④ 内田珠鈴 ねお

確かに、ダンスしながら音楽を聴きたいのであれば手が使えないので、スマートスピーカーは最適な再生手段になりえるだろう。しかし、部屋で友人とダンスするというこんな限定的なシチュエーションが、いったいどれほどの人にどれほどの回数で訪れるのだろうか?

このようにユーザー体験を具体的に想定していくと、スマートスピーカーを使って音楽が再生できることを楽しめる条件というのはかなり限られている。この限られたシチュエーションが存在する、音楽にそれほどこだわりがない集団というのが、現在のスマートスピーカー×音楽のメインターゲットである。しかしながらこのターゲット設定で音楽消費が加速するとは到底思えないわけである。

先日、AppleスマートスピーカーHome Padがいよいよ日本に上陸するというニュースが一斉に報じられた。このHome Padの優位性は、圧倒的な音質にあるようだ。

wired.jp

ここでも、市場ニーズを読み違えているように思えてならない。そもそも音質にこだわるユーザーは、スマートスピーカーではなく、ハイエンドなスピーカーで音楽を聴くのではないだろうか?しかも音質を気にするような様な「こだわり派」の期待に応えることは、現状のスマートスピーカー×音楽の再生機能ではほぼ不可能である。

もちろん私が検証したのはGoogle Home×Spotifyだけだが、おそらくHome Pad×Apple Musicも似たり寄ったりの性能だと私は考えている。なぜならこれはスマートスピーカーの性能の問題ではなく、メタデータとリコメンドエンジンの問題だからである。

現状のスマートスピーカーで音楽を再生するカラクリは、基本的にキーワード検索である。スピーカーが音声を認識し、それをテキスト化し、そのテキストとマッチングするアーティストやアルバム、楽曲を見つけてきて、一番最初に検出された曲をかける、という仕組みである。

こういう仕組みだから、アーティスト、アルバム、楽曲などに機械的メタデータしか含まれていない現状では、テーマやジャンルといった要求に対して高精度で結果を返すことができない。マッチする情報が曲やアルバム、アーティストのデータに含まれていないから当然であろう。そして個人の再生履歴を反映するリコメンドの精度も低い、もしくは機能していないために、結果的には画一的で頓珍漢な曲しか再生できない。

本エントリーで「AIスピーカー」と呼ばず「スマートスピーカー」と呼ぶことにこだわっているのもこの部分である。現状、「AI」というほどの機械学習機能は備わっていないただの音声入力装置だからである。(少なくとも音楽に関しては)

私の推測であるが、おそらくApple Musicにもこういったメタデータの設定はないはずだ。そしてリコメンド性能に関していえば両ストリーミングサービスを使っている私の経験でいえば、現状のApple MusicはSpotify以下である。だからきっとHome Pad×Apple Musicというのは、Google Home×Spotify以下に奇妙な結果をよく返してくるのでは、というのが私の予想である。(AppleがHome Pad用の特別なデータのチューニングを行った場合、この予測は外れるだろう)

このように、スマートスピーカー×音楽で良質な音楽体験というのは、少なくとも現状ではかなり難しい。

冒頭で引用した記事には、スマートスピーカーウォークマン以来のイノベーションになりうるという音楽評論家の熱い意見が書かれている。だがこれは過剰評価が過ぎるだろう。そもそもウォークマンスマートスピーカーでは、音楽体験に与える影響は別次元という程に違う。

ウォークマン登場以前、音楽はリビングなどの限られた場所でしか聴くことができなかった。それがウォークマンの登場によって人々はあらゆる場所で音楽を聴くことができるようになった。音楽を聴く場所が変わり、タイミングが変わり、動機が変わり、聴き方が変わった。つまりプロダクトによってユーザー体験そのものが大きく変わったのである。それ故にウォークマンイノベーションになりえた。

一方で音楽聴取におけるスマートスピーカーの存在はどうだろう。確かに音声で再生できるようになった。しかし音楽を聴く場所が変わるだろうか。タイミングが変わるだろうか。動機が変わるだろうか。聴き方が変わるだろうか。

いうまでもなく、何も変わらない。今と音楽の聴き方は変わらない。リビングで音楽が聴きたくなった時、そこにスマートスピーカーがあれば再生手段が一つ増える。ただそれだけのことである。プロダクトによってユーザー体験そのものが変わるような、ダイナミックな変化は起きない。ユーザの体験を大きく変えずにイノベーションになどなりえない。つまりスマートスピーカーは、ウォークマンとは比べ物にならない些細なプロダクトである。(少なくとも音楽に関しては)

このように結論付けると、私がスマートスピーカーそのものに対して否定的な見解を持っているとも思われるかもしれないがそうではない。むしろ今後私たちの生活を大きく変える可能性を秘めた注目すべきデバイスと思っている。

例えば、Micsosoft、GoogleAmazonFacebookAppleの覇権争いの観点で見れば、元々はPCでスクリーンに向かっている時間の奪い合いであった。これがスマートフォンの登場によってスクリーンの数と時間が増えて戦線は拡大した。そして彼らが次に狙うのはスクリーンに向かっていない時間である。その先鞭となるプロダクトがスマートスピーカーである。

PCやスマートフォンの中でなければ消費者との接点が持てなかったのに、スマートスピーカーがリビングに置かれることで、空気のようにそこに存在し、声を発するだけで接点を持つことができるようになる。生活者のユーザー体験の中にある広大な未開な地が開拓されるわけである。これは視覚から聴覚への戦線拡大をも意味している。最前線はやがて脳内に進行し、思考時間の奪い合いに発展するだろう。

スマートスピーカーは、そんな未来を予見させる重要なデバイスである。しかし一方でこれは始まりであり、きっかけに過ぎない。

そして、そんなスマートスピーカーにとっての音楽再生機能とは、ひとまず目の前の興味を引くための「疑似餌」に過ぎないものだ。だから機能としては中途半端だが、それでいいのだ。どんな理由でも、リビングに置いてくれれば、今の段階では良いのである。

そんなAmazonGoogleAppleらの思惑に対し、スマートスピーカーが「音楽の未来を変える!」などと大げさに捉えることは、ぶら下げられた疑似餌を見て「我々の食糧問題がすべて解決する!」と喜び勇むお魚さんのようでもある。一般消費者がそうなってしまうのは仕方がないが、ITや音楽などの専門家や専門メディアであるならば、テクノロジーに対する人々の軽率な判断や行動を戒める有名な言葉「我々は短期的に技術を過大評価し長期的に過小評価してしまう」を思い出し、もう少し冷静に捉えた方がいいのではないかな、などと思ってしまう次第である。

というわけで、Appleの参入で2018年も俄然盛り上がりを見せるスマートスピーカー市場に冷や水をぶっかけながらフォローもあまりせず、本エントリーを終えたい。

※文中にも明示したように私が検証したのはあくまでGoogle Home×Spotifyだけである。しかもこれは2018年1月時点のものだ。他サービスでは問題が少ない、その後進化してかなり使えるものになったということがあれば、再検証をする可能性がある。