ストリームエディタ(Sed)は、便利なツールである。例えば、次のやうなテキスト・ファイル(input.txt)があるとする。
% cat input.txt
戦後の政治・社会風潮は...
まづはインターネットからqkan.sedといふファイルを拾つて来る。そして次のやうにTerminal.app(Windowsの人はコマンド・プロンプト)に打ち込む。
% sed -f qkan.sed input.txt
戰後の政治・社會風潮は...
このやうに漢字を全て正字(旧漢字)に一括変換してくれる。qkan.sedの中身を見てみよう。こんな感じである。
y/亜悪圧囲医為壱飲隠欝営栄衛駅円艶/亞惡壓圍醫爲壹飮隱鬱營榮衞驛圓艷/
y/塩奥応欧殴穏桜仮価画届会壊懐絵拡/鹽奧應歐毆穩櫻假價畫屆會壞懷繪擴/
(以下、略)
簡単に説明しよう。abc.txtといふテキストファイルを用意する。内容はこんな感じ。
% cat abc.txt
abcdefg
次に以下のコマンドを打ち込む。
% sed -e "y/abcd/ABCD/" abc.txt
ABCDefg
abcdの文字だけABCDに変換してゐる。つまりqkan.sedの場合は、亜は亞、悪は惡と変換するのである。それをスクリプトではなくファイルで用意して、-fオプションで指定してゐるだけ。
勿論、qkan.sedもテキストファイルだから、自分で色々と変更を加へる事ができる。是非、試してみられたい。
この話の続きは、次回ではなく次々回あたりに。
% cat input.txt
戦後の政治・社会風潮は...
まづはインターネットからqkan.sedといふファイルを拾つて来る。そして次のやうにTerminal.app(Windowsの人はコマンド・プロンプト)に打ち込む。
% sed -f qkan.sed input.txt
戰後の政治・社會風潮は...
このやうに漢字を全て正字(旧漢字)に一括変換してくれる。qkan.sedの中身を見てみよう。こんな感じである。
y/亜悪圧囲医為壱飲隠欝営栄衛駅円艶/亞惡壓圍醫爲壹飮隱鬱營榮衞驛圓艷/
y/塩奥応欧殴穏桜仮価画届会壊懐絵拡/鹽奧應歐毆穩櫻假價畫屆會壞懷繪擴/
(以下、略)
簡単に説明しよう。abc.txtといふテキストファイルを用意する。内容はこんな感じ。
% cat abc.txt
abcdefg
次に以下のコマンドを打ち込む。
% sed -e "y/abcd/ABCD/" abc.txt
ABCDefg
abcdの文字だけABCDに変換してゐる。つまりqkan.sedの場合は、亜は亞、悪は惡と変換するのである。それをスクリプトではなくファイルで用意して、-fオプションで指定してゐるだけ。
勿論、qkan.sedもテキストファイルだから、自分で色々と変更を加へる事ができる。是非、試してみられたい。
この話の続きは、次回ではなく次々回あたりに。