Word 2016以降のバージョンでは音声入力によるテキスト化ができ「ディクテーション」という機能で提供されています。

Word文書を開き、[ホーム]タブ [音声]-[ディクテーション]をクリックします。(下図)

 

ディクテーション機能は、Microsoft 365版 Wordや Web版 Wordではこのように起動しますが、Word 2021/2019/2016では [Windows]+[H]キーで Windows標準の音声認識機能を呼び出して利用します。

初めて利用するときは、マイクのアクセス許可のメッセージが表示されますので許可します。
マイクボタンと設定ボタンが出てくるので、マイクボタンを押して話し始めます。
ほぼリアルタイムで話した音声がテキスト化され、Word文書上に表示されます。
話し終えたら、マイクボタンを押して記録を停止します。

試しに、Wordの教本から読み上げてみました。(下図)

 

また、Web版Wordでも同じ文章を読み上げてみました。(下図)

 

このとき、句読点などは特に意識せず読み上げましたが、自動的にそれらも補ってくれています。

上図の右上に表示される設定ボタン(歯車アイコン)をクリックすると、「ディクテーションの設定」ダイアログが表示されます。(下図)

 

ここの「句読点の自動挿入を有効にする」をオフとすれば、句読点が自動的に挿入されることはありません。

文章中で改行したいところでは「改行」と発声すればよろしいですが、その前後に幾分か“間”を設けてあげると正しく認識されます。
記号やいろいろな編集マークなどは、すんなり認識されるものとそうでないものがあります。
Microsoftのサポートページ「Word で文書を音声入力する」の中の「利用できる言語」項で日本語を選択し、その下の項目を開いて参考にしてみてください。

なお、音声認識中でも改行などのキーボード操作が可能です。
なので、いちいち「改行」を発声するのが面倒なときや、音声が誤認識されたときなどに、キーボードの [Enter]キーを押すということができます。

また、認識精度は高いのですが、同音異語や読みが同じ姓名などは誤認識されるかもしれません。
最終的に、校閲機能を使ったり、誤字や表現のミスなどを修正するようにしてください。