Skip to content

【TALQu × Portal2】AIに、平和な世界を。投稿!

  • 裏話
  • portal2

📅 公開

🔄 更新

⏱️11 min read

Haruqa誕生祭2021 の記念動画として、「AIに、平和な世界を。」という動画を投稿しました!

ニコ動

YouTube

今回も、この動画に関する裏話を 少し たくさんお届けします。


AI群雄割拠時代、到来。

今回、動画内で声の出演をしてくれたのは、 TALQu という、 深層学習系TTS というツールです。
作者はおなじみ(?)のHaruqaさんです。

(ここにリンクがほしいんだけど執筆時点では未公開)

ここ数ヶ月はAIと名を打ったツールが次々と登場し、時代の流れを感じていました。
そんな中、個人開発されたのが、この TALQu というものです。

実際の話し方的なものは、このツイートの動画を見ていただけているとわかりやすいかもです 。

企業から個人から、もうAIが止まらないですね。ご多分に漏れず、私もガンガン使っていきますよw

TALQu × Portal

実は、この構想自体はかなり昔から(TALQuの開発中ぐらい)からアイディアを持っていました。
実際、クローズドテストにも参加させていただき 、実現可能性を探りつつ、時期を見計らっていました。

ただ、難点としては、 Portalネタ自体、Haruqaさんご本人が既にやっている というのがありましてw

ネタかぶりは不味いと、Haruqaさんに確認 & 許諾をいただきました。
この節はありがとうございます。

おかげて、私の構想がまた一つ(想定外の広がりをしつつ)実現しました。
…一体何がどうなったのかは、このあとお話していきますね。


TALQu のお話

先述の通り、クローズドテストとから参加させて頂いている本ツールですが、
実はガッツリと使ったのは今回が初めてです。

そして、今回の動画(Twitterのやつと合わせると2本目)を作るまでに、いくつかわかったことがあるので、
軽くメモをしておきます。何かの参考になれば幸いです。

セットアップ関連 (特にGPU利用の場合)

GPUを使ってTALQuを動かすというオプションが(少なくとも、クローズドテストでは)ありますが、
これを使うにはいくらかソフトが必要になります。

READMEを読まない私が詰まった部分はこれです↓

CPU版と比較して、追加で必要になるツールは下記のとおりです。バージョン指定にも気をつけてくださいね。

  • Visual C++ ビルドツール
  • NVIDIA CUDA Toolkit (10.2)
  • NVIDIA cuDDN (v8.1.0 for CUDA 10.2)

インストール方法は参考サイトを見ていただければOKかと思います。

ちなみに、CUDAをv11系にしても動かないことは確認済みです。自分はこれで30分は溶かしました。

実際の使用感

比較対象は CeVIO AI としたかったんですが、まだ手元にない(IAとOИEのトークパッケージまち)ので、
従来のCeVIOやVOICEROID、SSYQuなどとの比較になります。

ツールとしてはシンプルで、迷うことは無いと思います。
仮に迷うポイントが有るのであれば、下のボタン ですかね?

  • 再生 : とにかく新規生成
  • もう一度再生 : 一度「再生」で生成した音声を再生
  • 今聞いたものを保存 : 「再生」で生成した音声を保存
  • 停止 : 止まる(はず)
  • wav保存 : 再度、音声を生成し、保存

となっていました。
まあでも大丈夫です。一度触れば誰も理解できるはずです。

音声の生成速度は、比べてはいけません。早くはないです。
スペックにも依るとは思いますが、従来のTTSとは違う。ということは念頭に置く必要があります。
それでも、出てくる音声には 夢を感じました。 これはリアルな感想です。

コツ

これは途中から気づいたコツみたいなものです。
多分意図していない部分もある気がしないでもないので、もしかしたら これはバグ技かも・・・?
個人的には仕様であってほしいお気持ちがありますが…

→ 仕様みたいでした。やったぜ。

発音アルファベット

多分UTAUをご利用の皆様にはおなじみのあれです。ちなみに自分はさっぱりわかりません
が、これだけは覚えておけば表現が広がる2つをご紹介。

  • N → 「ん」を発音
  • Q → 「っ」を表現

素人解説ですし、正しいという保証は無いですが、これで通じてくれると嬉しいです…!

あの短い動画でも、これで救われた箇所が数箇所ありましたw

イントネーション

イントネーションを制御することはできない仕様 なのが、このTALQuです。
なので、目的のイントネーションがほしいときは工夫が必要です。

今回の動画編集で、私が編み出した(?)技を2つご紹介。

1) 単語だけで出力

困ったら、単語単位で出力 してみると良さそうです。
運が良ければ、そのフレーズがそのまま使えます!

2) 再生成してみる

これがバグ技疑惑の所以。

機械学習でのTTSなので、出力結果も毎回微妙に変わります!
なので、ちょっとこだわりたいセリフが有るのであれば、もう一回生成してみると良さそう です。
若干イントネーションが変わって、もしかしたらピタッとハマるセリフ音声ができる…かも?

私は密かに、これの技を「セリフガチャ」と命名しました。

ただし、このガチャ、過去には戻れない ので注意です。
「さっきのほうが良かったわぁ…」 って言っても、もとには戻れませんw
ちょっとでも気に入ったのがあれが、保存しておくのをおすすめ します。

TALQu とこれから

まだまだ発展途上だと思っていますし、もっと気づくことがこれから出てくると思います。
これからも、バリバリ使ってみて、何か気づいたら裏話でも書こうと思います!


実況シリーズとしてのお話

おまたせしました。想定外の広がりを見せてしまった、と豪語したシリーズとしてのお話です。

元々の構想は、単発だった

大前提として、元々の構想は単発の予定でした。

SSYQuのRaft実況のようなノリを想定していました

そもそも、Raftの場合は実況者杯参戦1 。というのがあったので単発の色がより濃く出てしまいましたが、
Portal2も、同じようにできればいいかなーと思っていたりしました。

ですが、いざゲーム素材とにらめっこすると、「単発では終われないなぁ」 というぐらい
長いシナリオが待っていました。
どうしてそうなったかって?言わずもがな、いつもどおりの 完全初見プレイ ですのでw

予告編…?

誕生祭に合わせるのであれば、予告編を作って、「次回作にご期待」(逃) というプランも考えました。
が、どうプロットを打っても、しっくり来るものが出てきませんでした。

合わせて、季節柄、花粉症ってやつが襲って来やがり まして、
作業は愚か、ほとんど思考すら回らない(酸欠状態になるので)になってしまい、
8割方あきらめムードが漂っていました。

某フェルトアニメと花粉症

唐突に話が変わりますが、今期話題の某フェルトアニメ を毎週欠かさずチェックしています。
無論、思考が回らない状態でも動画を見ることは辛うじてできるので、無理矢理にでも見ていました。

そのアニメのシークバーにふと目が行きました。2:40。CMなどを含めると、3分ジャストという尺です。

ここで唐突に閃きました。3分なら、いくら辛い内容でも、頑張れば見れるのでは?
そうです、これが、本動画が3分ピッタリで収まっている 理由です。

まあ3割ぐらいは脚色しているのであれですが、、、w

今後のシリーズ

動画の最後にちゃっかり次回予告なんかつけているから、次のパートが出てくると思ってしまいますが、
実は、次回パートの投稿予定は未定です!

他に作りたい動画がストックしており、ちょっと手が出せない状態なんですよね…w
(週間JC3、Rising World、モトブログ…)

あ、進捗はこちら↓

ですが、TALQuのクセが掴めてきたのもあり、体制が整い次第やっていければと思います。
やる気は、皆さんのコメントやいいね、評価次第です!どしどしお寄せください(ダイマ)


まとめ:結局見切り発車でGO

本当は、来月から新しい企画をやりたいなー と思ったり思わなかったりしていたのですが、
ここで急に新シリーズ開幕なので、ちょっと延期かな?というお気持ちです。

いつものことながら、見切り発車でGO して、本当に終われるかが不安で不安でしょうがないですが、
はじめてしまったものは最後までやりますよ。がんばりますw

…暫くの目標、1年で1チャプターを想定中…完結まで何年かかることやらw
(もしかしたら、週間JC3が終わり次第、週間投稿に格上げかも…?)

ただ、これだけは言えます。「私がやりたいようにやらせてもらいます」。以上。

ということで、次回をお楽しみに~


  1. 実況者杯17はどうしたって?HAHAHA色々と忙しくて参戦できなかったっすわ申し訳……

← 新しい記事へ前の記事へ →
  • Powered by Contentful
  • based gatsby-starter-gcn by @ryanwiemer