2019年11月8日金曜日

【第144回】 NHKスペシャル「AIでよみがえる美空ひばり」を観て(その1)

 ~ AIが「感動」を生み出す世界初の挑戦 ~

視線第132回・133回でご紹介したAIが東大合格できるかというプロジェクト「東ロボくん」では、英語の基本的な問題を解くのに、500億語の英単語が読み込まされ、19億文勉強させる必要がありました。これらはディープラーニング(深層学習)の多くで必要とされる「教師データ」と呼ばれるものです。教師データに人間の偏見(バイアス)が入り込む危険性があることも指摘されています(視線141回)。また一方で、「10~20年後に、日本の労働人口の約49%が就いている職業において、AI(人工知能)やロボットに代替することが可能」というシミュレーション(視線112回)ものように、人間がAIに職業を奪われる不安もあります。では、人間はAIとどのように関わっていけばいいのでしょうか?

9/29放映NHKスペシャル「AIでよみがえる美空ひばり」を観ました。これは、NHKやレコード会社に残る音源や映像をもとに、AIで美空ひばりを蘇らせて新曲を披露するというプロジェクトです。「ゲームや未来予測、金融などの分野では人間を圧倒するAIにとって、残されたフロンティアは、芸術すなわち人間の心の領域 ― 感動 ―である」という世界初の挑戦。新曲の作詞・秋元康、衣装・森英恵、振り付け・天童よしみが担当、これにAIプログラマー、CGデザイナー、3D投影の第一人者が加わります。亡くなった人をデジタルで甦らせることに賛否両論はありますが、蘇った美空ひばりの歌声に感動して涙すると共に、人間とAIの関わり方について大きなヒントを得たような気がしました。

新曲は全国から応募のあった200曲から1か月をかけて秋元康を中心に選びました。若手作曲家のポップス調の曲です。これに秋元が「川の流れのように」を作詞したニューヨークのカフェで詞を書きました。曲のイメージに合わせて、衣装は最後の10年間すべての衣装を担当した森英恵が作り、髪型は25年間担当していたメイクさんが似た女性の髪を結い、これらをCGに落とし込みます。歌うときの表情は、映像開発チームが顔の50か所が連動して動くシステムを開発し、膨大な映像を教師データとして顔の動きの法則をAIが学びました。問題は新曲を歌うひばりの振り付けです。専属の振付師はいなかった上、客の反応により自由自在に動いていたため、AIには予測不能。そこで、ひばりに憧れレコードやビデオを擦り切れるまで研究していた天童よしみが、モーションキャプチャーを付け、ひばりになりきって実際に歌い、その動きをCGに落とし込みました。

何といっても最難関は、「神秘の声」「七色の歌声」と呼ばれた、ひばりの歌声を再現することです。初音ミクを生み出した歌声合成ソフト「ボーカロイド」を使って、ヤマハのエンジニアが挑戦しました。実在した歌手本人の歌声を再現して再現することは、難易度が格段に高くなります。

・濁音を含め50音それぞれに4オクターブのすべての音を当てはめる(これだけで5000を超える)

・ビブラートの度合い 長・中・短の3種類を加える

・ファルセット(弱々しく息漏れさせた裏声)の強・中・弱の3種類を加える

・それぞれの音の次にどの音が続くか(ア→ア、ア→イ、ア→ウ…)の順列組み合わせを行う

これらは天文学的な数となり到底手作業は無理なので、ボーカルのみの音源を教師データとして、ディープラーニングでAIが自ら学習を繰り返します。さらに、1秒当たり100に分割し、どう歌うかをグラフと楽譜を照らし合わせながら解析し、ひばりの歌い方のルールを探します。人間が書けるルールは高が知れていますが、AIならば、何千万という条件分岐が可能とのこと。

 この挑戦の続きは、次回にお話しいたします。


トゥルースアカデミー代表 中島晃芳

トゥルースアカデミー
http://truth-academy.co.jp/