Google Cloud Platform Speech To Text API を使って会議の録音データの文字化に挑戦してみました。
インターネットで「音声データのテキスト化」を調べていたら、「Google Cloud Platform Speech To Text API」というものを使えばできる!というような広告が出てきた。
グーグル先生のAIならそりゃもう優秀な認識率で仕事の自動化もすぐにできそうだと思いリンクを踏んでみました。
https://console.cloud.google.com/getting-started?hl=ja
ここ7年ほどは原始人的な仕事しかしていなかったので脳みそも相当退化してしまっているようで、実際に利用できるようになるまで2日ほどかかってしまいました。
「speech to text 使い方」で検索すると、解説をしてくれているページがいくつかありますが、うまく動かない。。またしばらく原始人的な仕事をしていると思い出せなくなるのではないかと思い備忘録としてメモしておきます。
Google Cloud Platform とても魅力的と言いますか、ハードを準備しなくても、ちょっと使ってみたいときに安く使えるところがとてもありがたい。
しかも開始から3か月間、約300ドル分がお試しできます。そして、speech to text APIは毎月60分分のデータまでは無料で使えるようなので使ってみるしかない!
speech to text API へは下の写真の赤丸のところをクリックすると・・・。
メニューが出てきますので
APIとサービスのところにカーソルを合わせて「ライブラリ」をクリック。
するとAPIライブラリが表示されるのでその中から「speech to text API」をクリックします。
そして、下の方にスクロールしていくと、「チュートリアルとドキュメント」の項目があるので、lern more をクリック
そこに書かれている内容を順番に進めていくと、途中から何のためにそれをやっているのかよくわかりませんでしたが、
- プロジェクトを作成または選択します。
- プロジェクトに対して Speech-to-Text API を有効にします。
- サービス アカウントを作成します。








