きりんのブログ -18ページ目

きりんのブログ

妻がブログを始めたのでいろいろとネタを提供するも、ある時から「よーわからん」ということで、解説とか書き始めました。

毎年子どもたちが楽しみにしているクリスマス。
毎年プレゼントを何にするかで悩ましいようで、妻も「そろそろ終わりにしたいなぁ…。どうしょう…。」どうやって終わりにするのか悩んでいたので。

私「新型コロナ感染症対策で今年から日本にいけなくなりました。アフターコロナ禍はおとうさん、あ母さんにプレゼントを買ってもらってください。」でいいのでは?

妻「そうかぁ、そうしよう」
私「うちは海外からのサンタクロースで、他の家にサンタさんが来ても、それは日本在住のサンタさんが来てくれているということで。」

という話になりましたが、結果はどうなるのか。
9月14日(月)19時06分頃。
インターホンが鳴って妻が出ると、インターホンのモニターに佐川急便の配達員の方が。
何か荷物が届いたのかな? と思ったら、『車のルームランプがつきっぱなしですよ』と知らせてくれた。本当に忙しい中ありがとうございます。

Google Cloud Platform  Speech To Text API を使って会議の録音データの文字化に挑戦してみました。

 

インターネットで「音声データのテキスト化」を調べていたら、「Google Cloud Platform  Speech To Text API」というものを使えばできる!というような広告が出てきた。

グーグル先生のAIならそりゃもう優秀な認識率で仕事の自動化もすぐにできそうだと思いリンクを踏んでみました。

 

https://console.cloud.google.com/getting-started?hl=ja

 

ここ7年ほどは原始人的な仕事しかしていなかったので脳みそも相当退化してしまっているようで、実際に利用できるようになるまで2日ほどかかってしまいました。

「speech to text 使い方」で検索すると、解説をしてくれているページがいくつかありますが、うまく動かない。。またしばらく原始人的な仕事をしていると思い出せなくなるのではないかと思い備忘録としてメモしておきます。

 

Google Cloud Platform とても魅力的と言いますか、ハードを準備しなくても、ちょっと使ってみたいときに安く使えるところがとてもありがたい。

しかも開始から3か月間、約300ドル分がお試しできます。そして、speech to text APIは毎月60分分のデータまでは無料で使えるようなので使ってみるしかない!

 

speech to text API へは下の写真の赤丸のところをクリックすると・・・。

 

メニューが出てきますので

APIとサービスのところにカーソルを合わせて「ライブラリ」をクリック。

 

するとAPIライブラリが表示されるのでその中から「speech to text API」をクリックします。

そして、下の方にスクロールしていくと、「チュートリアルとドキュメント」の項目があるので、lern more をクリック

そこに書かれている内容を順番に進めていくと、途中から何のためにそれをやっているのかよくわかりませんでしたが、

  • プロジェクトを作成または選択します。
  • プロジェクトに対して Speech-to-Text API を有効にします。
  • サービス アカウントを作成します。
は最低限必要なようです。
 そして、私の場合、録音データがmp3だったのですが、使用可能なファイルフォーマット形式が決まっており、私はAudacityというソフトを使って FLAC という意形式のファイルに変換して使用しました。
変換したデータは、メニューから Strage をクリックし、「バケット(フォルダ)を作成」しその中にアップロードします。バケット作成時にバケット名を入れた後いろいろ聞かれますがデフォルトのまま進めても問題はないと思われます。
 
アップロードしたファイルをクリックすると↓のような画面になり、赤で囲われたURIという部分を後ほど使用します。
そして次のステップ
の「Google Cloud Storage ファイルを使用した長い音声ファイルの文字変換」からスタートします。
 
 
 
書きかけです。。。