これまでずっと音声入力も併用してきて,ある程度は生産性が上がったんだけど…”画期的”というほどでもなかった。

 

その要因は…単にキーボード入力の代わりに,音声入力を使っているから…そもそも話すスピードそのものが落ちているから。

 

①話す→②変換→③眼で見てテキストを確認→④また話す

 

上記のうち②と③があるから話すスピードが落ちる。

 

なので…

 

音声入力で,本当に生産性を”画期的に”高めようと考えたら…

 

・話すだけに集中(講義や会話の時のように)

・上記を録音

・録音したものをテキスト変換

 

これが必要という結論に至った。

 

で,ドラゴンスピーチを購入したのだけれど,まだソフトに学習させてないので…変換がむちゃくちゃ。元ファイルが高圧縮のMP3だとまずいという情報を得たので,PCMでやってみるけど…やはり同じ。学習によってどれほど精度があがるのかは未知数だけど,とりあえず…他の方法を探してみた。

 

すると…いろいろあった。

 

 

・GoogleのCloud Speech-to-Text API

・MACならSoundFlower

・WindowsならVirtual Audio Cables

 

 

これらを使えば,音声ファイルから内部スピーカを通じて変換できるようだ(一部有料)。

 

https://www.vb-audio.com/Cable/

 

 

さらに調査を続けると…Google Docksではなく,writer.appを使っているらしい(これも一部有料)。

 

音声から文字起こしをするライターさんなんかが使っているようだ(”音声”,”文字起こし”で検索)。

 

 

これらの組合せで試しに音声ファイルからテキストに変換させてみた…

 

す・る・と…

 

驚くほど正確に変換してくれている。こんな感じ。

 

 

もちろん…修正は必要だけど,この変換精度なら十分生産性は上がる。

 

後,正確に発音するために…声のトレーニングをすれば(アナウンサーの発音のように)もっと認識率は上がるし,自分自身の講義の質や,提案時の説得力も向上するんじゃないかなと思ってる。

 

まだまだ試行錯誤中だけど,何とか年内に形にして,2019年は生産性を画期的に高めたい。そして…収入をさらにアップしながら時間をさらに捻出し…

 

絶対に,乃木坂46のライブと舞台(=パワースポット)に行きまくる(笑)。

 

 

ベストプラクティスが定まったら…ここで詳しく書きますね。まだまだ模索中なので今回は概要だけをご紹介。

 

 

 

 

…にしても,便利な世の中になったな!

 

必要としているものは…探せばある時代。しかもフリーミアムが進展し,ある程度まで無料で利用できる。

 

まずは探す時代。

 

探しても探しても無いものは…創る。それは売れる(笑)。