XCrossing - Podcast in Tech

エピソード

[ep 72] ポッドキャストツール「LISTEN」の有料版を使い始めてみて、改めて音声と文字の関係を考えてみた

2024.03.20

専用ツールより性能が高いので、LISTEN有料版を文字起こしツールとして使ってみている話から、文字と音声とリアルで得られる情報の違いなどを話しました

* ポッドキャスト・サービスで聞く

Listen on YouTube Listen on Listen
Listen on Spotify Listen on Google Podcasts Listen on Apple Podcasts RSS Feed

* ここで聞く

View on Zencastr

View on Zencastr

00:54 ポッドキャストサービス「LISTEN」を有料版で使用中


02:15 B2B向けの会議音声文字起こしサービスよりもLISTENのほうが良いクオリティ


03:04 利用ユーザーからフィードバックを得て猛烈な勢いでクオリティが良くなっているB2Cサービスのいい例


04:30 文字起こし自体の精度向上、話者分離、Whisperの使いこなし


07:51 日本語と英語が混ざった話になっても、英単語として文字起こしされている


08:31 文字起こしの冒頭に「今回の話題は●●です、文字起こしには以下の登録済み単語を優先してください」


09:40 文字起こしする段階でメタデータをしっかり入れておくことで精度を高めているのでは


11:05 話されていることの内容と理屈が通っていつつ、抽象的で一般化できそうな見出しがついている


13:11 目で見る・目で読むものと、耳で聞くという使い分け


17:27 音で情報を取得するほうが人間にとっては自然で負担が少ないらしい


20:09 言語の習得は音から入るほうがいいよという研究結果


22:40 顧客インタビューでは、言いよどんだり、スピード速くなったりするときはそこに何が意味がある


27:16 コミュニティとして広がるポテンシャルを持つ「LISTEN」


28:22 mixi 20周年:"人がいないからいい


エピソード内で取り上げた情報へのリンク:

* ポッドキャストサービス「LISTEN」 [https://listen.style/]

* LISTEN開発者 近藤さんをゲストにお迎えして語り合った回(ep37) [https://x-crossing.com/ep37.html]

* 「audiobook.jp」で実現する「聴く文化」の創造!学習にも娯楽にも活用できるオーディオブックとは [https://sogyotecho.jp/otobank-ueda-interview/]

* 多言語の習得は「音」から 脳領域特定、文法理解早く [https://www.nikkei.com/article/DGXZQOUF251YP0V20C24A2000000/]

* 約7割の人は「目」より「耳」からのインプットが得意 企業の人材育成における、学習手段の「格差」の問題点 [https://logmi.jp/business/articles/329236]

More Episodes

XCrossing Official Twitter

XCrossing website

Our Profile

テック業界で働く3人が、テクノロジーとクリエイティブに関するトピックを、視点を行き交わしながら語り合います

及川 卓也: プロダクトマネジメントとプロダクト開発組織づくりの専門家。自己紹介エピソード ep 1, ep 2

関 信浩: アメリカ・ニューヨークでスタートアップ投資を行う、何でも屋。自己紹介エピソード ep 52

上野 美香: マーケティング・プロダクトマネジメントを手掛けるフリーランス。自己紹介エピソード ep 53

About XCrossing

XCrossing(エックス・クロッシング)。英語で「スクランブル交差点」を意味します。趣味も、世代も、住んできた街も違う3人が、スクランブル交差点で出会うように、様々な話題を行き交わせる、おしゃべりの交差点です。今日のエックス・クロッシングであなたが出会うのは、どんな話題でしょう。