mic-1132528_640
1: しじみ ★ 2018/12/14(金) 14:59:47.35 ID:CAP_USER
名古屋工業大学 国際音声言語技術研究所と音声合成を柱とするベンチャー企業テクノスピーチは12月12日、これまでの歌声合成とは一線を画す、元の歌い手の声質、癖、歌い方といった特徴を捉えた歌い方をディープラーニング技術などの適用で実現した。約2時間分の音声データで学習し、日本語、英語、中国語に対応する。

 名古屋工業大学の徳田恵一教授を中心とするチームはこれまで、隠れマルコフモデルを使った統計的手法により、音声合成のOpen JTalk、歌声合成のSinsyを開発し、提供してきた。テクノスピーチはこれらを発展させた商用製品CeVIO Creative Studioの開発にも携わっている。今回の新技術はこれらを新たな次元に推し進めるものと言える。

 名古屋工業大学とその出身者によるテクノスピーチの共同研究は、2019年3月に開催される日本音響学会2019年春季研究発表で公開される。

 Sinsyと同じく、人手による調整がされていない「ベタ打ち」の歌詞付き楽譜データをMusicXML形式で与えるだけで、元歌手の特徴を再現する。

今回のデモはCeVIOで歌声を提供している、さとうささら、IAが使われていることから、CeVIOの将来バージョンまたは後継製品で使われることも予想される。

 故人である三波春夫さんをバーチャルシンガーにした「ハルオロイド・ミナミ」がCeVIOに対応する歌声として製品化しているが、この新技術を使った、本物と区別がつかない仮想三波春夫による「世界の国からこんにちは」を期待したいところだ。

http://image.itmedia.co.jp/news/articles/1812/14/koya_cevio2.png
http://image.itmedia.co.jp/news/articles/1812/14/koya_cevio3.png

※記事の音源はこちらのlinkから聞けます
https://www.techno-speech.com/news-20181214a

ITmedia NEWS
http://www.itmedia.co.jp/news/articles/1812/14/news089.html
デモ

技術革新前(ベタ打ち・未調整)

技術革新後(ベタ打ち・未調整)
68: ニュースソース検討中@自治議論スレ 2018/12/14(金) 21:36:42.75 ID:CVtH+kTm
これはすごい

38: ニュースソース検討中@自治議論スレ 2018/12/14(金) 17:34:02.09 ID:wbl7tKne
大分自然になってるな

16: ニュースソース検討中@自治議論スレ 2018/12/14(金) 15:36:03.83 ID:8ic6hxxY
確かに改善されてる

26: ニュースソース検討中@自治議論スレ 2018/12/14(金) 16:11:14.70 ID:FkSCCH2M
下手なアイドルよりマシじゃんw

165: ニュースソース検討中@自治議論スレ 2018/12/18(火) 05:26:35.35 ID:fUQFMUye
聞いてみたが、この程度なら今のボーカロイドでもできるのでは?

170: ニュースソース検討中@自治議論スレ 2018/12/18(火) 13:04:30.51 ID:2SgZRwEI
>>165
ボーカロイドは相当深く習熟した人間が1曲ごとに調整しないと

128: ニュースソース検討中@自治議論スレ 2018/12/16(日) 10:13:47.55 ID:wNjUUHlA
調整無しでこれかよw
かなり自然に聞こえる

29: ニュースソース検討中@自治議論スレ 2018/12/14(金) 16:41:19.60 ID:lwQLsE88
人工知能で調教するわけか

5: ニュースソース検討中@自治議論スレ 2018/12/14(金) 15:11:57.57 ID:zqrUINbs
すごいAIオペラ歌手も出てきそうだ。

105: ニュースソース検討中@自治議論スレ 2018/12/15(土) 12:46:07.22 ID:oh4oi3f1
>>5
生身の歌手がその場で歌うのを聴く事が喜びなわけで...

112: ニュースソース検討中@自治議論スレ 2018/12/15(土) 18:13:17.35 ID:ANcki7LB
第九のコーラス隊も要らなくなるな。PCを200台並べてスピーカーを繋げばOKだもの。

114: ニュースソース検討中@自治議論スレ 2018/12/15(土) 19:03:06.45 ID:5W4ySsDu
>>112
コーラスは人間だからできる部分を無視できないのでAI歌手では当分無理かな
ハーモニーはAIには分からない人間の感覚が為せる技なので

3: ニュースソース検討中@自治議論スレ 2018/12/14(金) 15:07:02.20 ID:ZaBW70oa
音楽がpcで完結する時代か

150: ニュースソース検討中@自治議論スレ 2018/12/17(月) 00:35:11.68 ID:0o4vadW6
>>3
そういう音楽には何の価値も無い時代に突入だな
益々下手でも生歌の価値が上がる時代になるんだろう

13: ニュースソース検討中@自治議論スレ 2018/12/14(金) 15:25:23.79 ID:T76M4baI
作詞作曲も人工知能がするようになれば、AI社会で音楽産業も消える分野だな。

84: ニュースソース検討中@自治議論スレ 2018/12/15(土) 03:59:06.02 ID:wLubU6Xs
>>13
どうしてこうAIを勘違いする奴が減らないのだろうか

86: ニュースソース検討中@自治議論スレ 2018/12/15(土) 06:15:15.26 ID:SfMgzUoo
>>84
ある程度知識がないと、昔手が届いた範囲のAI、
今AIと呼ばれているもの、未だ遠い究極のAI、それぞれが
大きく違うものだと言う事はわからないから、しかたないよ

AIより意味が狭い「機械学習」を使う方が少しましになるかもしれない

136: ニュースソース検討中@自治議論スレ 2018/12/16(日) 13:12:39.44 ID:xBqunPUO
合成の精度を非常に上げることができるという点でディープラーニングはめっちゃ使えるという良い研究結果だな
ただこれだけの精度を出すために、再生(再現)する時にも計算処理が大きくなっているようで、GPUを使っても
それなりに処理時間がかかるとのこと。これが今のネック。
ユーザーとしてはいきなりトライ&エラーの修正回数が激減している状態から始められると思うのでトータルでは
メリットが圧倒的に上回ると思う。

155: ニュースソース検討中@自治議論スレ 2018/12/17(月) 06:19:15.90 ID:i91sOYNM
機械ロボ音が消えてるな
これ消すのにものすごく苦労するんだ
簡単処理でリアル音声ぽく出来そうで何より
早く出せ
ただし雑魚い声のヤツ元声に使うなよ

20: ニュースソース検討中@自治議論スレ 2018/12/14(金) 15:43:26.60 ID:AY/0Xv6P
初音ミク脂肪のお知らせ

45: ニュースソース検討中@自治議論スレ 2018/12/14(金) 18:31:13.41 ID:Q+qmcmfR
>>20
あれは人間に近づけるのとは少し違う方向で生き残るかもしれん。
ヴィジュアルでメカっぽいキャラクターや獣っぽいキャラクターがあるのと同様に

15: ニュースソース検討中@自治議論スレ 2018/12/14(金) 15:32:52.51 ID:2JS2kN/7
>>1

新技術、すごいな
でも現行技術の方が、機械機械してて、かわいいな

140: ニュースソース検討中@自治議論スレ 2018/12/16(日) 20:36:20.64 ID:xBqunPUO
初音ミクは実のところ職人芸で成立してる方式だからね
今回は開発環境問題をAIとマシンパワーで解決できたので
来年にものすごい音声合成ブームがもう一度来るでしょうな

129: ニュースソース検討中@自治議論スレ 2018/12/16(日) 10:43:48.85 ID:PtJVV4Fj
初音ミクが売れるまで、VOCALOIDのサンプル音声で
プロの歌手を使うのは難航した。仕方が無いので
クリプトンフューチャーメディアはアニメ声優を起用し
アニメキャラクターが歌っているかのような演出をした
案の定これには硬派な業界から反発を受けた

そもそも芸能人は自分を機械で置き換えされるのを嫌う
芸能界も低コストの人工アイドルが増えれば
予算を削減されて、中抜きできなくなる

ホリプロの伊達杏子が鳴かず飛ばずだったのに
門外漢の初音ミクが大ヒット
芸能界にとって面白くないのは当たり前

初音ミクを超えようとするなら
初音ミク以上に強烈な逆風を覚悟すべき

19: ニュースソース検討中@自治議論スレ 2018/12/14(金) 15:38:50.36 ID:vtJhUzJz
生身の人間がオートチューンガリガリにかけて
機械が素材元の歌手に近づけようと音を外す。

面白いもんだな。人のやることって。

28: ニュースソース検討中@自治議論スレ 2018/12/14(金) 16:26:36.01 ID:zS3UHi4Y
死んだ歌手の歌声も再生できるのか
過去の音声だからテープレコーダーのプッチプチのザラザラのやつしかないけど、それも再現されるのかな

42: ニュースソース検討中@自治議論スレ 2018/12/14(金) 17:55:44.82 ID:AYts/VpI
エルビスがいまの歌をうたったら  というのが成り立つわけか
ジミヘンやジャニスやジョンレノンが最新曲をかばーしたらとか

18: ニュースソース検討中@自治議論スレ 2018/12/14(金) 15:38:18.41 ID:f5iyRyNw
亡くなった声優のボイスロイドのほうが最優先

33: ニュースソース検討中@自治議論スレ 2018/12/14(金) 16:59:21.71 ID:ZHHPsKBh
野沢雅子そのままの音声合成を作るべき
そうすれば今後100年はDBは安泰

31: ニュースソース検討中@自治議論スレ 2018/12/14(金) 16:53:00.85 ID:ZaBW70oa
おねだりする猫なで声とか
人を圧倒するドスの利いた声とか
そういう人間を有無を言わさずコントロールする声も出せるようになりそう

35: ニュースソース検討中@自治議論スレ 2018/12/14(金) 17:09:11.88 ID:PtAohB+e
これすごいな
好きな歌手に色々な歌わせることができるのなら、そういうの買っても良いな

39: ニュースソース検討中@自治議論スレ 2018/12/14(金) 17:34:19.95 ID:YEAp7q9X
下ネタで悪いんだけど
アイドルの普通の声から喘ぎ声を再現

55: ニュースソース検討中@自治議論スレ 2018/12/14(金) 19:31:44.78 ID:T00t8HWR
>約2時間分の音声データで学習

データ量としてはかなり少ない印象だわ。これ例えば盗聴して音声データから音源作って
本人になりすまして第三者に話しかけるとかできそうだな。名探偵コナンのボイスチェンジャー
みたいな感じで。

82: ニュースソース検討中@自治議論スレ 2018/12/15(土) 02:45:33.60 ID:jVGloool
途中で息を吸う音もあるけどそれも歌い方の癖として学習してるって事?

64: ニュースソース検討中@自治議論スレ 2018/12/14(金) 20:49:39.83 ID:C+DvT4fb
声優の仕事がマジでなくなりそうだな
どうすんだこれ

67: ニュースソース検討中@自治議論スレ 2018/12/14(金) 21:02:25.98 ID:r6smViI5
譜面がある「歌声」を再現できたとしても、
「声当て」やら「芝居」を再現するのは難しいと思うけれどな。

51: ニュースソース検討中@自治議論スレ 2018/12/14(金) 19:12:11.19 ID:nB655Hi1
日本語の萌え声だけ聞いて「おっ」と思ったけど、他の言語はダメダメだな。
やっぱり人間の喉の構造を物理シムするくらいでないと同じにはならないな。

93: ニュースソース検討中@自治議論スレ 2018/12/15(土) 09:27:22.98 ID:bqL14OdX
いくら技術が優秀でも萌えキャラつけて売った時点で終了
下品なオタクのおもちゃになるだけ

107: ニュースソース検討中@自治議論スレ 2018/12/15(土) 12:56:38.11 ID:npPQ9vYR
これは技術の正しい使い道

115: ニュースソース検討中@自治議論スレ 2018/12/15(土) 19:18:18.06 ID:ogAjzV8/
よくはなってると思うが判別できないは言い過ぎじゃない?w

70: ニュースソース検討中@自治議論スレ 2018/12/14(金) 21:41:55.18 ID:gCyBMDPW
まだ違和感あるけどもう一息

102: ニュースソース検討中@自治議論スレ 2018/12/15(土) 12:16:26.92 ID:hh2Jzy0u
人が歌うより透明感が数段上と感じた

36: ニュースソース検討中@自治議論スレ 2018/12/14(金) 17:26:25.04 ID:WRDWNHIl
まじでわからなくなる

62: ニュースソース検討中@自治議論スレ 2018/12/14(金) 20:35:28.18 ID:PL+dVo92
何も知らずにBGMとして流されてると
合成音声とは気付けなそう

23: ニュースソース検討中@自治議論スレ 2018/12/14(金) 15:51:21.39 ID:qfduTsno
こりゃ数年以内に判別不可能になりそうだな


転載元:https://egg.5ch.net/test/read.cgi/scienceplus/1544767187/
このエントリーをはてなブックマークに追加

人気記事ランキング

    おすすめ記事(外部)

     

    コメント

    コメントフォーム
    評価する
    • 1
    • 2
    • 3
    • 4
    • 5
    • リセット
    • 1
    • 2
    • 3
    • 4
    • 5
    • リセット