自分らしい働き方を目指した生産性向上では,こんなちょっとしたことも…。

 

音声入力!

 

最近,執筆やこのブログなど…文字入力をするときに,音声入力を利用しています。

 

新幹線や公共交通機関,研修受講中など,声を出せない場所では無理ですが…それ以外の場所なんかでは,よく利用させていただいてます。

 

というのも…仕事柄,音声認識や音声合成など音を扱う技術にアンテナを張っているのですが…ここ1-2年の技術向上はすさまじく,現在は“人間の聞き間違え”と同レベルになっているそうです。誤認識率で5%を切ったとか。

 

なのでもう完全に実用レベルなんですね。

 

僕はiphoneを使っているのですが…ほんとここ数年,完全に実用レベルだなと(ちなみに…OCR変換も,AdobeのPDFで使ってるんですが,そっちもかなりのレべルになっています)。かなり助かっています。

 

で,どれぐらい生産性がアップするかというと…僕の場合は3~5倍です。でも,キーボード入力も速いんですよ。それの3~5倍なので,かなりのものですよね。

 

ちょうど…このブログで言うと…音声入力だけだと5~10分。体系化と言い回しの改善,強調したり,誤認識の部分の修正なんかを込み込みでプラス5~10分ぐらいかな。5分というのはオーバーだけど,最短で10ぐらいです。なので,ちょっとした仕事の合間=休憩時間の息抜きにやってます。

 

だから…これまで,ここに書いてきた投稿も…やたら長いでしょ。それは話しているから(笑)。投稿数も多くなってしまって…ごめんなさい。そのうち1日1投稿ぐらいに押えますので。

 

でも…いずれにせよ…

 

技術革新,サイコー! って感じですね。これでまた時間が確保できる。

 

 

で,実際どんな感じでやっているのか?こんな感じです。以下,iphoneのスクリーンショットね。

 

 

この一番下のキーボードの所にマイクの絵がありますよね。これを押すだけ。するとしばらくの時間,音声入力が可能になります。

 

 

こんな感じで。

 

ちょっとめんどくさいのは,今のところ下記の3点。

 

①途中で音声入力が自動的に終わるので,またマイクボタンを押さないといけない

②句読点が自動ではつかない。“てん”,“まる”と言わないといけない

③改行する時は”かいぎょう”と言わなければならない。これは仕方ないか

 

上記の①は何か方法もあるのかな?②は,今後黙る時間で自動で判断できるようになるはず。③は仕方ないか。

 

で,一通り入力しても…これは話し言葉なので,体系的に整理するのを兼ねて誤認識の部分を修正していく。5%を切るとまではいかないけれど…日本語は難しいからね。でも,その修正時間を含めても…十分生産性は高くなる。

 

なので,かなり助かってます。

 

執筆でも使っていて…後は,Googleも試してみたいなと。かなり精度がいいそうなので。

 

 

 

ただ…以下余談。

 

これって全部AppleやGoogleに情報集まってんだよな。AIを開放しているのもあって…情報は全部,米国に行く。そのビッグデータをさらにAIに分析させると…米国が合法的に世界を支配することになる。

 

大丈夫か?日本。

 

AI,ビッグデータ,IoT,セキュリティは国家戦略にして,十分な予算取らないと…真正面から正々堂々とするビジネス戦で,ぐうの音も出ないほどやられるぞ。

 

それを踏まえて…ITエンジニアは頑張ろうぞ!

 

 

(おわり)