用語登録 | python3Xのブログ

python3Xのブログ

ここでは40代、50代の方が日々の生活で役に立つ情報や私の趣味であるプログラム、Excelや科学に関する内容で投稿する予定です。

Tanslateに用語を登録すると、より正確な翻訳ができるようです

登録はCSVファイルに以下のように行います

翻訳元の言語:ja .etc , 翻訳先の言語: en .etc 翻訳先言語:・・・

文字コードがUTF-8です

--------------------------------------------------------

term_ja.csv

ja,en
徳之島工房,TokunoShima Works

 

中野システム,"NAKANO SYSTEM CO.,LTD"        # ( , )を含むためダブルクオーテーション( " )で括る必要がある
--------------------------------------------------------
上記の登録:trans_term.py
import boto3
translate = boto3.client(
'translate')
with open(
'term_ja.csv', 'rb') as file:
    translate.import_terminology(
        Name=
'term_ja',
        MergeStrategy='
OVERWRITE',
        TerminologyData={
'File': file.read(), 'Format': 'CSV'})
コマンド
python trans_term.py
---------------------------------------------------------
コード

import boto3
translate = boto3.client(
'translate')
text =
'徳之島工房の新しい本が中野システムから出ます。'
result = translate.translate_text(
    Text=text, SourceLanguageCode=
'ja', TargetLanguageCode='en',
    TerminologyNames=[
'term_ja']) 
print(result['TranslatedText'])

 

結果

A new book from TokunoShima Works Kobo comes out of the NAKANO SYSTEM CO., LTD.

 

登録なしの結果

A new book from Tokunoshima Kobo comes out of the Nakano system.