XCrossing - Podcast in Tech

エピソード

[ep 91] 環境音から声を分離するAIツール「Voice Isolator」を使ったら、日本語じゃない言語を話し始めた

2024.07.31

生成AIで音声コンテンツが気軽に作れるようになった。しかし環境音などノイズの分離や、他の言語への翻訳などは便利な半面、注意も必要に

* ポッドキャスト・サービスで聞く

Listen on YouTube Listen on Listen
Listen on Spotify Listen on Apple Podcasts RSS Feed

* ここで聞く

View on Zencastr

View on Zencastr


00:47 ElevenLabsが公開した「Voice Isolation」(環境音バリバリの音源から人の声だけ分離する音声生成AI)を試してみた


01:51 <Voice Isolationした音源> ※USJのレストランで収録したもの


02:46 環境音がパッとなくなるところを聞くと、簡単にできるのはいいかも


03:33 が、現状では自分の声が違う言語を話したり、実際には話していない単語をしゃべっているという結果に


04:08 韓国語・ヨーロッパ系の言語に聞こえる部分から日本語にモーフィング


05:49 英語ではない言語でやると、isolateというよりは別物。音声含めて"生成"されていることを実感


08:15 Voice Isolatorのクオリティが上がったら、インタビューや対談、会議などユースケース広がりそう


09:21 TED Talksの動画に追加された新機能:講演者が話す言語と違う言語で(映像内の本人が)話しリップシンクする


11:43 違う言語にしたとき、本来の言語で伝えていた細かいニュアンスはどうなるか


13:35 これは技術で可能にしているものというような注意書きが必要になるかも


18:28 AIよりもコンテンツを英語化するほうが文化破壊で、仕事を奪われるという翻訳家の話


22:14 TED Talksの例は、発信したいコンテンツを持つ人たちが多くの人たちに伝えるために技術を使うユースケース


24:26 音楽のリミックスと、二次創作を許可して流通させる仕組み(クリエイティブコモンズ)


取り上げた情報へのリンク:

* ElevenLabs「Voice Isolator」 [https://elevenlabs.io/voice-isolator]

* TED Talksスピーカーの言語を切り替えられるデモ動画 [https://youtu.be/s3RKTMSq-LA]

* 複数言語に切り替えられる実際の動画 [https://www.ted.com/dubbing/lera_boroditsky_how_language_shapes_the_way_we_think]

* ローカルな文化にとっては生成AIより英語の方が脅威 [https://x-crossing.com/ep30.html](XCrossing ep30)

More Episodes

XCrossing Official Twitter

XCrossing website

Our Profile

テック業界で働く3人が、テクノロジーとクリエイティブに関するトピックを、視点を行き交わしながら語り合います

及川 卓也: プロダクトマネジメントとプロダクト開発組織づくりの専門家。自己紹介エピソード ep 1, ep 2

関 信浩: アメリカ・ニューヨークでスタートアップ投資を行う、何でも屋。自己紹介エピソード ep 52

上野 美香: マーケティング・プロダクトマネジメントを手掛けるフリーランス。自己紹介エピソード ep 53

About XCrossing

XCrossing(エックス・クロッシング)。英語で「スクランブル交差点」を意味します。趣味も、世代も、住んできた街も違う3人が、スクランブル交差点で出会うように、様々な話題を行き交わせる、おしゃべりの交差点です。今日のエックス・クロッシングであなたが出会うのは、どんな話題でしょう。