自宅でオンライン講座を学ぶ際、自分の好きなタイミングで視聴できるのが大きな魅力ですが、私は手書きでメモを取るのが苦手なため、動画の内容を、文章作成ソフトを使用して、聞いたままを全て手入力して保存していました。
しかしこの方法では、文字の打ち間違いや聞き逃しがあるたびに動画を何度も巻き戻して再入力しなければならず、非常に手間と時間がかかることに悩んでいました。
そこで、AIを使った文字起こしができないかと考え、初めにGoogleドキュメントの音声入力を試してみましたが、頻繁に停止したり誤認識が多く、結局手動で入力することになってしまい使い物になりませんでした。
そんな時、YouTubeのある動画で「Google AI Studio」というサービスを知りました。
このサービスは、Googleの「Gemini」モデルを無料で試すことができるのですが、この中の音声データを自動的に文字に変換してくれる機能を利用することで、効率的に文字起こしができるのです。
そこでさっそく「Google AI Studio」を使って文字起こしをしてみることにしました。
私がこのサービスを選んだのは、Googleアカウントがあれば新たにアカウントを作る必要がないのと、無料で時間制限や回数制限などなしに使えるからなのですが、実際使ってみると、非常に精度が高く、かなり正確に文字起こしをしてくれることがわかり感動しました。
ただし、動画などのファイルがないと「Google AI Studio」での文字起こしはできないのですが、データがあればそれを「Google AI Studio」にアップロードして、「Run」をボタンをクリックするだけで数分で文字起こしができますので、かなり短時間で文字起こしをすることができます。
聞いたところによると、100万トークンまでのコンテキストウィンドウを使用することで、約1時間の動画の文字起こしが可能らしいのですが、実際に使ってみたところ、30分くらいの動画でも最後まで文字起こしができないこともあるのが残念でした。
しかし、今まですべてを手打ちで文章化していたのを考えると、かなりの効率化がはかれます。
さっそく「Google AI Studio」を使用していくつか動画の文字起こしをしてみましたので、今日は私なりの使い方を書いてみようと思います。
1. まず「Google AI Studio」にアクセスします。
https://aistudio.google.com/app/prompts/new_chat
2. そしてGoogleアカウントを持っている方は、アカウントにログインします。
(持っていない方は、新しくアカウントを作成する必要があります。)
3. サイトにアクセスすると、チャットのプロンプトを入力する画面が表示されますので、ここに音声ファイルの文字起こしを依頼する内容を入力します。
例えば「この動画を一語一句文字起こししてください」といった感じです。
4. そして右下の「Run」をクリックして文字起こしを始めます。
たったこれだけの作業で数分でAIが文字起こしをしてくれます。
ここからは私なりの使い方になります。
5. 「Google AI Studio」で音声を文字起こしした文章には、文字と文字の間に無駄な空白が入っていたり、句読点がないため、そのままだと非常に読みにくいのですが、このテキストをすべてコピペしてChatGPTに入力し、「この文字起こしの文章から、無駄な空白を削除してください。また句読点を入れてください。」といった指示を入力します。
こうすることで文章がかなり読みやすくなります。
また文字起こしによっては「え」や「あ」などの無駄な言葉が入っている場合がありますが、ChatGPTに、「この文章から「え」や「あ」などの無駄な言葉を削除してください」といった指示を入力すれば、かなり読みやすくなり、修正も最小限に抑えることができます。
あとは自力で修正していくだけです。
今日はこの方法を使って文字起こしをしていましたが、以前に比べて格段に楽になりました。
誤字などの修正のためにもう1度動画を見ることになりますが、文字と音声との両方で学べるため、身に付きやすい感じがしました。
皆さんも文字起こしをされる時には、是非「Google AI Studio」を使ってみてくださいね。
この方法を使うことで、作業の効率化ができるかもしれませんよ。
最後までお読みくださりありがとうございました。