投稿者「家主」のアーカイブ

究極の?文字起こしツール(続編)

無料で、パソコン初心者でも簡単に使え、かつ実用的な文字起こし(テープ起こし)のツールはないか、と尋ね尋ねて三千里。前の記事の続編になります。

マイクで喋ったものをテキスト化するのはすでに当たり前になっています。

ここで触れるのは、すでにある録音データを自動で文字化する機能に関してです。

前の記事では、推奨候補は「IBM Watson Speech to Text Demo」「YouTube」の利用であるとの結論に達しました。

ここでは、それ以外の方法について、その後わかったことを追記しておきます。

1.Googleドキュメントを使う方法

上記2つの方法以外で実用的価値の高そうなものに、Googleドキュメントがあります。

Googleドキュメントを使って自動文字起こしをする場合、音声データを、マイクを介さずに直接Googleドキュメントに送り込む入出力デバイスが必要です。MacとWindowsとでは若干異なります。

Macの場合:soundflowerのダウンロード  ただしsoundflowerは(ネット上にはまだありますが)開発は終了し、現在BlackHoleという有料アプリとなっています。

Windowsの場合:特別なアプリを導入しなくても、パソコン内に「ステレオミキサー」というデバイスがあればそのまま使えます。ただしない場合もあるのだそうで、そのときにはやはりドライバのダウンロードが必要です。

結論として、Googleドキュメントを使うのであればWindowsが有利と言えるでしょう。どちらの場合もブラウザはGoogle Chromeが条件となっています。

2.YouTube法をもっと便利に(1)

YouTubeを使う方法について、前の記事では「ビデオ編集がネックだ」といいました。しかしその後、ビデオ編集ソフトを使わなくてよい方法を見つけましたので、それでやってみましょう。グッとハードルが下がるはずです。

◆ TunestoTubuでYouTubeにアップロード

https://www.tunestotube.com/

にアクセスします。原文は英語ですが、Google Chromeを使って右クリックすれば日本語で読めます。

YouTubeにアップするわけですから、Googleアカウントでログインします。

 

この画面で、「ファイルをアップロードする」をクリックして、最初に音声ファイル、次に画像(適当なダミーでよい)をアップします。

作業はそれだけ。勝手にYouTubeにデータを上げてくれます。

容量の上限は50Mbとのことです。大まかに1Mb=1分と考えておけばよいでしょう。Google Speech-to-Textが月60分を超えると有料になることを考えると、リーズナブルではないでしょうか。

3.YouTube法をもっと便利に(2)

 もうひとつ、かなり画期的なアプリをご紹介します。

 YouTubeで「文字起こし」をクリックすると、テキスト化されたデータが見られるわけですが、「ここを修正したい」という場合、そのテキストをコピーしてエディターなどで修正作業をするしか方法はありませんでした。しかし「Vrew」というアプリケーションはそれを可能にしてくれます。

つまり、音声を聞きながら、この箇所が間違っているという場合、その場で修正が可能なのです。動画であればその場で字幕が修正できますし、音声データのみであれば、その場で修正を加え、その結果をテキストデータとしてダウンロードすればそれでおしまいというわけです。

このアプリケーションはパソコンにダウンロードすることが必要です。ただ、作業はきわめて簡単です。

多彩な機能を持ちながらこのアプリも無料。MacとWindowsの両方に対応しています。

これから日本を背負う人のための国語試験

 問題

次の短文にある、○の部分に適切な漢字を入れなさい

1.すべて国民は、○権を尊重しなければならない

2.政治の基本にあるのは○権である

3.政党は○権の擁護を目指して設立される

4.○権は国民の命より重要である

     ・

     ・

     ・

     ・

     ・

     ・

 解答

 すべての○の中に入る漢字は、

である。

 

問題制作:自由民主党安倍信者会

究極の?文字起こしツール THE Ultimate Transcription Tools

 無料で、時間制限・字数制限がなくて、アカウント登録や個人情報入力不要で、アプリのダウンロードなど面倒なことをせずに、マイクからの入力もでき、既存の音声ファイルからも自動でテキスト化ができて、PCでもスマホでも使える、そんな文字起こしツールがほしい〜
 などと、あつかましくも怠惰で横着で贅沢な要求をするあなた!

 そんなあなたにぴったりの究極の文字起こしツールを用意しました。

 推奨の価値のある上位3つのツールを、比較しながら紹介します。

 この3つは、いずれも無料、登録不要、字数制限なし、PC・スマホ共用(Webベース)、特別なアプリ不要です(数字は評価順位)。
 3のYouTubeだけは音声ファイルのみ対応です。

  簡便さ(順位) 精度(順位) マイク入力 音声ファイル
1.IBM Watson Speech to Text Demo
1 1
2.TextFromToSpeech 1 3
3.YouTube 2 2

 

 

 

 

        目次
【解説】  
  1.IBM Watson Speech to Text Demo
  2.TextFromToSpeech
  3.YouTube
【文字起こしテスト】  
  音源:五木寛之トーク(YouTubeより)
  IBM Watson Speech to Text Demo の使い方(動画)
  文字起こし結果比較
  ・原文
  IBM Watson Speech to Text Demo による文字起こし
  ・TextFromToSpeech による文字起こし
  ・YouTube による文字起こし
【総評】  

 

【解説】          

1.IBM Watson Speech to Text Demo

 IBMのクラウドサービスWatsonが提供する Speech to Text のサービスです。
 本格的利用のためには会員登録(無料)してAPIを扱うことになりますが、「APIってなに?」というレベルの私たちには少々ハードルが高く、困難です。
 このサイトは文字起こしのデモページにすぎませんが、それでも「簡単に文字起こしをやりたい」という要求には十分応えてくれます。
 英語表記のページですが特に難しいことはありません。
 Google Chromeを使えば、マウスの右クリックで日本語に翻訳して、そのまま利用することができます(他のブラウザでは翻訳はできても正しく動かないようです)。

 マイク入力、音声ファイル解析の両方で使えます。

《扱える音声ファイル》mp3, mpeg, wav, flac, opus

 

2.TextFromToSpeech
 このサイト、詳しい説明がないため制作主体がはっきりしません。
 説明の日本語がかなり怪しいところからすると、外国製で、日本語に翻訳している模様です。
 総評のところで述べますが、使い勝手は上記1のWatson並みによいものの、日本語の解析に難があり、特殊な語彙はお手上げのようです。
 マイク入力、音声ファイル解析の両方で使えます。Google Chrome 推奨。

《扱える音声ファイル》mp3 のみ確認済み(mpeg, m4a, wav は不可)

 

3.YouTube
 YouTubeは2006年にGoogleに買収され、現在はGoogleの子会社となっています。
 自動的に字幕を生成する機能がついていますが、これはGoogleの技術。
 字幕以外に、さらに「文字起こし」機能が付け加わりました。つまり、YouTubeに音声ファイルをアップロードさえすれば、その音声は自動的にテキスト化されていくということです。
 ただし音声ファイルフォーマットのままではアップロードできず、その音声ファイルを使った動画をアップロードする必要があります。
 したがってビデオ編集ソフトを使い慣れている人にはきわめて簡単な作業ですが、そうでない人には少しハードルが高いかもしれません。
 ただビデオ編集をする必要はなく、単に音声ファイルを動画のシーケンスの中に貼り付けるだけですから、初歩の初歩さえわかっていれば簡単に作業できます。

 YouTube動画部分の右下、「・・・」に「文字起こしを開く」があります。実際にお試しください。

【文字起こしテスト】

 音源:五木寛之トーク(YouTubeより)

 これの音声のみを取り込み、音源としました。

 

IBM Watson Speech to Text Demo の使い方(動画)

 

 

文字起こし結果比較

原文
きょうは蓮如という実にこう不思議な、かつ魅力的でしかも現代的な人物についてお話しをしてみたいと思います。あの、皆さん方ですね、日本の偉大な宗教家といいますか一般によく知られている3人の偉いお坊さんの名前を挙げよという風に言われますと、まぁどういうふうに挙げますか、一般には法然、それから親鸞そしてその道元と、こういうその日本の宗教界に非常に大きな足跡を残した3人の名前がすぐに思い浮かんでくるんじゃないかと思うんですね。しかし求道者としてのこの3人の足跡とは別に、日本の大衆に、そしてその現代の私たちにまで生活の中で大きな影響を与え、かつその社会に対して強い変化と刺激を与えた人物という風に考えてみますと、ちょっと視点が違ってまいります。まずもう皆さんよくご存じの空海ですね。空海ブームというものが一時ありまして、ずいぶん私たち空海の名前を子供までが覚えるという時期がありました。それから日蓮という大変大きな存在があります。それに付け加えてといいますか、その中で私が最も興味を持っているのがこの蓮如という人物なんですね。この蓮如は一般には蓮如上人という風に言われるんですけれども、実は蓮如がいちばん深く影響を及ぼした日本の各地方では蓮如さんというような言い方でですね、あたかも慈父あるいは懐かしいおじいさんおばあさんを語るような口調で親しまれ続けてきた人物なんです。この蓮如という人は1415年ですね、15世紀の初めに京都に生まれました。で、なくなったのが15世紀の終わり1499年といわれますから、もう間もなく没後500年ということになる人物なんです。

1.IBM Watson Speech to Text Demo

今日は蓮如というに不思議なかつ魅力的でしかも現代的な人物についてお話しをしてみたいと思います皆さん方ですね日本の偉大な宗教家といいますか一般によく知られている3人の偉いお坊さんの名前を挙げようというふふに言われますとどういうふうに上げますか一般には法然それから親そしてその道元と。こういうその日本の宗教に非常に大きな足跡を残した三人の名前がす ぐにいい思い浮かんでくるんじゃないかと思うんですねしかしいい求道者としてのこの3人の足跡とは別に。日本の大衆にそしてその現代の私たちにまで生活の中で大きな影響を与えかつその社会に対して強いその変化と刺激を与えた人物というふうに考えてみますとちょっと支店が違ってまいりますまずもう皆さんよくご存じのええ空海ですね。ええ空海ブームというものが一時ありましてずいぶん私たち空海の名前を子供では覚えるという時期が[抜け]それから日蓮という大変大きな存在があります。それに付け加えてといいますかその中で私が最も興味を持っているのがこの連鵺という人物なんですねええ。この連系は一般には蓮如上人というふうに入れるんですけれども実は02が一番深く影響をもたらした日本no各地方では蓮如さんというような言い方でですね。あたかもGIFあるいは懐かしいおじいさんおばあさんをかかるような口調で親しまれ続けてきた人物なん[抜け]この例によっていう人は千四百十五年ですね十五世紀の初めにいい京都に生まれますでなくなったのが十五世紀の終わり千四百九十九年といわれますからもう間もなく没後五百年ということになる人物なんです

2.TextFromToSpeech
今日は 蓮如 不思議な魅力的で 日本の偉大な 宗教家を取ります 知られている三人の偉いお坊さんが名前をあげようと どういう風にあげますか 一般には忘年 それから 診断 こういう その日本の主張 会場に大きな足跡を残した3人の名前がすぐに思い浮かんでくるんじゃない 求道者としても この三人の足跡とは別に 日本の大衆にそしてその現代の私たちにまで 大きな影響を与え というふうに考えてみますとちょっと もう 皆さんよくご存じの 空海 口が入りまして ずいぶん私達 それか それに付け加えてとりますか 私が持ってるのが この れんげ 逸話 悪影響を及ぼした 栄養 何かかけて あるいは おじいさんおばあさんを語るような口調で 出なくなったのが 1409 お前はくそね 500年ということ 500年と言う 私たちもな 受けております 中井貴子 蓮如 が実にそのたい

3.YouTube(改行は省略しています)

今日は蓮如という実技こう不思議なかつその魅力的でしかも現代的なあの人物についてお話をしてみたいと思いますあの皆さんがたですね日本のその偉大な宗教家と言いますか一般によく知られている3人の偉いお坊さんの名前を挙げようという風に言われますとまあどういうふうに上げますか一般には豊年それから親鸞そしてその同源とこういうその日本の宗教界に非常に大きな足跡を残した3人の名前が数に思い浮かんでくるんじゃないかと思うんですねしかし求道者としてのこの3人の足跡とは別に日本の大衆にそしてその現代の私たち今で生活の中で大きな影響を与え勝つとの社会に対して強い変化と刺激を与えた人物という風に考えてみますとちょっと視点が違ってまいりますまずもう皆さんよくご存知の空海ですね空海ブームというものが一時ありましてずいぶん私たち空海の名前を子供まではあの覚えるという時期がありましたそれから日蓮という大変大きな存在がありますそれに付け加えてと言いますかその中で私が最も興味を持っているのがこの連量という人物なんですねこの蓮如は一般には蓮如上人というふうに会えるんですけれどもあの率は練乳が一番深く影響を及ぼした日本の各地方ではベン予算というような言い方でですねあたかもその自負あるいはその懐かしいおじいさんおばあさんを語るような口調で親しまれ続けてきた人物なんですこのレンギョウという人は1415年ですね15世紀のはじめに京都に生まれましてで亡くなったのが15世紀の終わり1499年と言われますからもう間もなくその没後500年ということになる人物なんですね

 

【総評】

 いかに簡単に、かつよい結果を出すか‥‥と各ツールを調べていくと、いずれも一長一短。なかなかこれと決めがたいものがあります。

 しかし上で見たように、特別な準備をしなくても楽に文字起こしのできるツールが、AIの進歩とともに続々と登場してきました。

 最終的に私がお勧めするのはIBM Watson の Speech to Text で、しかもこれはデモページです。

 本格的に作り込めば、新しい語彙を覚えさせたり簡単に修正したりという作業もできるようですが、かなりのコンピュータの知識が必要で、私のような素人には今のところ手が出ません。

 簡単という点では TextFromToSpeech が Watson と同じ程度に簡単なのですが、いかんせん、変換の精度が悪すぎます。これは性能の向上を待って利用したいと思います。

 YouTube を利用する方法は私自身最近になって気がついたもので、すでに使っている人があるかもしれません。唯一のハードルは、音声ファイルそのものではなく動画として作り直さなければならないというところ。それができる人なら、きわめて簡易な方法ではないかと思います。

 その他の方法についても少々。

 よく知られている Google ドキュメントで文字起こしをするのは、Google Speech to text というAI を使うわけですが、既存文書ファイルから直接自動的に読み込ませようとすると、音声信号の入出力を受け持つアプリ、Soundflower(Mac の場合)や、Virtual Audio Cable(Windows の場合)といったオーディオデバイスの導入が必要になります。しかも作動中は音声をモニタリングすることができません(現時点で私が知り得た限り)。

 また、当然ながら Google のアカウントが必要であり、Google ドキュメントの使い方もある程度わかっていないと簡単には使えません。

 スマホでは、Speechy というアプリ(iPhone/Android)が自動での文字起こしをやってくれます。ただし無料版は7分以内という制約があり、かつ有料版のレビューでは不安定などの声も聞かれ、やや信頼性に欠けるのが難といえます。

 ともかくここまでの結論は、(現時点での)究極の文字起こしツールとして IBM Watson Speech to Text Demo、またはYouTubeの利用を押しておきます。

(この記事には続編があります)

過剰潔癖の行く末は?

 外出にマスクはもちろんのこと、行く先々で手を消毒し、帰宅するとまずうがいをし、手を洗い、玄関のドアノブも消毒する。
 いや待て、それから服を着替えたら、服についているウイルスは家の中に飛び散るだろう。
 となると、玄関を開ける前に服を脱ぎ捨てて、その服は捨てるか1週間ほど放置するか。そしてまずシャワーを浴びて全身を清めたら、初めて汚染されていない服を着る。そうしないとウイルス感染を防ぎきれない。
 さらには、室内の手を触れたかもしれないあちこちをエタノール消毒しなければならない。外で使ったスマホもそのままでは部屋に持ち込めないから消毒だ。

続きを読む

誰がめいわく駐車をするのか

 一見さりげなく立っていて、どこにでもよく見かける看板。

 しかしこれほど不思議な看板はない。

 「駐車をしないでください」ならわかる。

 「違法駐車をしないでください」「不法駐車をしないでください」もわかる。法律で決まっていることだから、という明確な理由があるから。

 しかしこの「めいわく駐車」はわからない。 続きを読む