英日交互の対訳を、英語と日本語に分離 | 特許翻訳 A to Z

特許翻訳 A to Z

特許翻訳歴26年、業界改善を目指した情報発信歴23年。
自らの試行錯誤に加え、参加者数のべ1000名を超えるセミナーや講座、年間50名前後の個別相談などを通して得たスキルアップのヒントをお届けします。


テーマ:

前回の逆で、今度は、英日交互になっている対訳データを英語と日本語とに分ける方法です。

元データに入っている番号「ではない」ものを使いたい場合の対処方法も示すために、INIDコードの対訳を例にしてみます。

1.元データの余分な番号を削除します。

方法は何でも構いませんが、たとえば秀丸エディタの「BOX選択」で削除したい範囲を縦に選択し、Deleteキーを押せば簡単です。
 


※私は普段、秀丸を背景色「黒」で使用しているため画像も黒いですが、背景色や文字色を何色に設定していても、BOX選択機能には影響しません。
 

2.空白行を削除して、ExcelのC列に貼り付けます。

秀丸エディタなら検索する文字列「\n\n」、置換後の文字列「\n」で正規表現の置換、Wordなら「^p^p」を「^p」に置換すれば、余分な空白行を削除できます。

3.前回の4と5の方法で、A列に連番を入力します。

 

4.A列の数字があるセルを選択して全体をコピーし、テキストエディタに貼り付けます。

5.テキストエディタから、貼り付けたデータをコピーし、エクセルのA列に貼り付けます。

上記の3~5で、「=A1+1」を使って連番を付与した上で、A列の数字をベタ打ちに変更しています。

前回は、ベタへの変更をしなくても機能しましたが、今回は「=A1+1」のままだとうまくいきませんので、数字は必ず単なる半角文字としておくことが重要です。
 

6.B1のセルに「=MOD(A1,2)」と入力します。これで、表示上は数字の「1」が入ります。


 

7.B1のセルを、B2以降にコピーします。
範囲選択して貼り付ければ、1回の操作で下まですべて貼り付けできます。



8.ここまでで、B列には、「1」「0」「1」「0」「1」「0」「1」「0」と交互に入ります。

 

9.A列~C列の範囲を、B列を優先にして並べ替えます。

 

これで、

2    0    特許、SPCまたは特許文献の番号
4    0    文献種類別の簡潔な言語表示
6    0    WIPO標準ST.16による文献種別コード
8    0    修正特許情報
1    1    Number of the patent, SPC or patent document
3    1    Plain language designation of the kind of document
5    1    Kind-of-document code according to WIPO Standard ST.16
7    1    Patent correction information

という結果になります。
あとは、たとえば左右の対訳にしたければ、英語部分をA列、日本語をB列などに移動するだけです。

ここでは、交互に並んだデータの先頭に連番数字を付与し、それを「偶数」と「奇数」に分けました
結果として、英語部分と日本語部分を、元の順序を変えることなく分離できます。

 

 


■関連記事
英語&日本語 INIDコード
Excelで、英→日→英→日に並べ替える
マクロを使わず連番付与+英日交互の並べ替え

 


インデックスへ

水野麻子さんをフォロー

ブログの更新情報が受け取れて、アクセスが簡単になります