Notebook LM
大規模言語モデル(LLM)やAIというとOpenAIのChatGPTが代表的なものになっていますが、いわゆるBig Tech各社もそれぞれしのぎを削っている分野であり、GoogleではGeminiというLLMの開発が進められています。そのGeminiを使ったアプリケーションの一つにNotebook LMというものがあり、昨年6月に日本語にも対応して提供が開始されています。
このNotebook LMというのは「AI を活用したリサーチや執筆する際のアシスタント」とされていますが、様々なテキストやPDF、URLなどを入力として与えると、それらの内容をまとめてくれたり、内容に関する質問に答えてくれるというものです。これは私がブログ記事を書く時にあちらこちらの記事を調べてまとめ上げる手順でも役に立ってくれそうです。
しかし、私が面白いと感じてご紹介したいと思ったのは、音声概要という機能です。
音声概要では、「2 人の AI ホストによる深掘り型の活発なディスカッション」という形式で、ソースの主要なトピックが要約されます。
ということで、与えた資料についての対話形式のポッドキャストを作成してくれるというもので、非常にそれっぽい会話のやり取りでそのまま公開しても良さそうなものです。ただ、今のところは英語でのみ作成可能というのが残念なところで、早く日本語でもできるようにならないものかと今から待ち遠しく思っています。
実際にどのようなものができるのかというと、試しに私のブログの前回の記事、「姫路城入城料 市民以外2.5倍に」のURLだけを与えて作ってみたものがこれです。
https://wolverion.com/audio/姫路城:市民以外入城料2.5倍へ.mp3
いかがでしょうか。語り口や間のとり方、抑揚の付け方などは極めて自然で、数年前までの合成音声と比べても隔世の感があります。途中何度か謎の番号を読み上げるところは機械っぽく、フィンガープリント的な感じでわざと入れているのかとも思えますが、それ以外はまったく不自然なところはありません。
内容的にも私が記事に書いていないことにまで話題を膨らませていて、あの程度の記事で10分以上語ってしまうというのはむしろ私にはできないことです。この調子でブログ記事を書いてそれをポッドキャストにして配信したら面白いのではないかとも思いましたが、どうでしょうか。Notebook LMの無料版では1日に作成できる音声概要は3つまでとなっており、過去の記事をポッドキャストにしていくというのは難しそうですが、これから先のもので試してみるというのはいいかもしれません。とはいえ、そんなに需要があるとはそもそも思っていませんが、やはり日本語でないとダメでしょうね。