【AIきりたん】え、人じゃん│NUTORINO(音声合成エンジン)調声の進化について

NUTORINO(音声合成エンジン)調声の進化について

何はともあれ、まずは聞いてください。

 

すごくないですか?これ…。VOICEROIDなんですよ…?

 

※2020/4/12追記 なんと、自分でも使ってしまいました。
感想も記事として書いてみたので良ければご覧ください。

【AIきりたん】僕が耳コピした譜面を歌ってくれました。│素人がNUTORINO使ってみた感想

 

いろいろざっくり紹介します。

 

「何がすごいの?」と思われる人もいらっしゃると思いますので、
聞きかじりで情報量の乏しい僕が、何とか紡いだ言葉で説明していきます。
間違いがあったら教えてください。秒で直します。

 

VOICEROIDとは?

 まずは、冒頭に出てきたVOICEROIDについてです。こちらはそのまま引用いたします。

株式会社エーアイが開発した人間的で自然な音声合成を実現することができる高性能音声合成ソフトウェアです。
コーパスベース音声合成機能に加え、微妙なフレーズ(イントネーション)の調整やスピード調整、音声ファイルの作成などを行うことができます。(株式会社エーアイのサイトはこちら)

株式会社AHS ウェブサイトより引用

上記の通り、「性能音声合成ソフト」のことです。

 

ちょっとわかりづらいと思いますのでもう少しかみ砕くと…
【人の声を収録してデータ化し、入力されたテキストを読み上げてくれるソフト】
なのですが…
ただ読んでくれるだけでなく、漢字の読みはもちろん、アクセントや、韻律、
読むスピードまでも調整できてしまいます。
どんな文字列でも読むことができて、かつ人が言っているように読んでくれる
なんともすごいソフトです。
企業様の紹介動画がありましたので、そちらをご覧ください。

 

VOICEROIDは、ニコニコに投稿されているゲーム実況動画でよく見られますね。
しかしそれ以外にも、宅配の再配達の電話音声やバスの車内案内などなど…。
実は社会に広まっているんです

 

それ以外の特徴として、
  •  かわいいキャラクターデザイン
  •  声優さんを起用(有名な方も多いですね!)
というのも人気の秘訣、でしょうか。

 

次に、今回動画に出てきている「東北きりたん」についてご紹介です。

 

「東北きりたん」ってどちら様?

 

キャラクターの東北ずん子、東北イタコ、東北きりたん三姉妹のうちの
三女に当たる、東北のご当地キャラクターです。
ちなみに長女がイタコ、次女がずん子です。
→東北ずん子公式HPはこちら
東北に本籍がある団体であればこのキャラクターが無料で使用できるんです。
※HPに利用に関するQ&A記載があるので興味があればお目通しあれ!
なんとまぁ太っ腹なんでしょうか…。
そして、東北きりたんにはボイスもついております。
よって、VOICELOIDもあるんですね。
→ VOICEROID+ 東北きりたん

 

僕の”東北きりたん”のイメージ

 

僕はVOICELOIDに詳しいわけではなく、
とりわけきりたんを知っていたわけでもなく、
「ゲーム実況動画に解説としてよく出てくるなぁ…」
「いろんなキャラクター掛け合いしてるなぁ…」
くらいにしか思っておりませんでした。

 

『数あるVOICELOIDのキャラクターの一人』くらいの認識でしょうか。
あとは、音声合成支援ツール(?)である”UTAU”を使用して
つくられた曲がニコニコ動画でランクインしているときは
チラチラ聞いていた気がします。
→東北きりたん・東北イタコのUTAU音源はこちら
この記事も初めてVOICELOID~とかUTAU~とか
調べて書き上げているくらいには疎いです…。

衝撃の走った2/28

この日に、いつもの感じで、
「あ、ブルーバードだって。なつかしっ!」
と思って再生しただけでした。

 

電撃走りましたね。はい
まさに、「え、人じゃん。」でした。
「いつもは音と音のつながりがビミョーなVOICELOIDが
こんな流暢に歌っているのか!?」
ここでのポイントは、
歌を歌うことに特化した「VOCALOID」ではないのに
こんなに流暢に歌っていること、です。
何をしたらそんなに流暢に歌えるの!?と思い、
この記事を書くのと同時にいろいろ調べたんですね。

 

”AIきりたん”という新境地

調べてみると…
研究者向け音声合成検証用東北きりたん歌唱データベース」というものがあり、
そのデータを、SHACHさんという方が作成したNEUTRINOというフリーウェアを
用いて作成したものだといいます。

………。

はい、もうだめ。頭パンク状態です。

 

正直、専門用語全く分からないので、NEUTRINOの概要をそのまま引用します。

NEUTRINOはニューラルネットワークを用いた歌声シンセサイザーです。本ソフトウェアはフリーウェアです。楽譜から発声タイミング・音の高さ・声質・声のかすれ具合などをニューラルネットワークで推定します。上記の推定されたパラメータを元にvocoderで音声を合成します。本ソフトの名称はまだ聞いたことのないような楽曲・ジャンルを開拓してほしいという思いを込めて名付けました。あなたの創作・発見の一助になれれば幸いです。

NEUTRINO HPより抜粋

詳しい使用感について参考にさせていただいたサイトを掲載します。
くろ洲の音声合成備忘録
この方、先ほどの「ブルーバード」の動画を投稿した投稿主でもあります。

 

どうやら、譜面?楽譜?を投げるだけで、ほぼほぼ無編集でも
きりたんがその通りに歌ってくれるのだそうです。

イントロ、1番→オペレーション+調声2番→オペレーションのみCメロ、3サビ→オペレーションもなし
と、だんだん手放しになっていきます。
ちなみにメインボーカル:NEUTRINO
サブボーカル(錆を歌ってるほぼ聞こえないの):CeVIO(ONE)
下ハモ:Sinsy(m01083j)と、
3種の学習系歌声合成カバーだったりする

AIきりたんで『ブルーバード』カバー 動画説明文より抜粋

後半に行くにつれて無編集になっていくと書いてあります。
…ちょっともう一回聞いてみましょうか?
うーん…
最初に聞いたとき、僕、そんな感じ一切しなかったなぁ。

NEUTRINOのはSHACHIさんが公開したオフラインで動くAI歌声合成ソフト。AI、もといニューラルネットワーク(NN)ベースの歌声合成で、楽譜情報から「中の人ならどういうタイミング/ピッチ/声質/声のかすれ具合で歌うか」をはじき出して、それをvocoderで音声化する。

くろ洲の音声合成備忘録 記事より抜粋

ということで、ここに AI の文字が。
ニコニコ動画のタグには「AIきりたん」が。
今現在でも、たくさんの楽曲が投稿されています。
むしろ投稿スピード上がってない…?
「AIきりたん」タグの検索結果
このような形できりたんが世の中を席巻し始めるとは思いませんでした。
ちょっとしたムーヴメント、ですよね。
これをどう活用するかなどについては音声学、言語学あたりで
より進められていくのだと思いますが…
言語学をかじっていたものとしてはとても興味深く見ておりました。
いや、聞いていたという方が正しいかな…?
といっても、音声言語学は基礎の基礎の講義しか受けておらず、
聞きかじりの知識しかないのでちんぷんかんぷんですが…。
どの職業・仕事にもテクノロジー、もといAIが入り込んでいき、
今の職が消えていくかもしれないといわれている昨今、
どのように社会が変化していくか、本当に見通せません。
コロナウイルスの今後と同じくらい見通せません。
…着地点が見えなくなってきましたが、
AI、どれだけ広がるか楽しみになっちゃったということで、
この記事は締めましょうか。
ありがとうございました!



少しでもビビッと来たらぜひシェアください!

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

ABOUT US

アラサーに足を突っ込んだ、転職すでに2回もした一般男性です。 趣味であるゲームや動画・配信視聴などから様々な機会・出会い・交流に恵まれて、何とか生きてます。その経験も踏まえて、日々思うことや気になることを中心に少しアウトプットしていこうと思っておりました。 最近、iPhoneに機種変更してウキウキしてます。(イラスト:おいしいさかな さん)

カテゴリー