Tanslateに用語を登録すると、より正確な翻訳ができるようです
登録はCSVファイルに以下のように行います
翻訳元の言語:ja .etc , 翻訳先の言語: en .etc 翻訳先言語:・・・
文字コードがUTF-8です
--------------------------------------------------------
term_ja.csv
ja,en
徳之島工房,TokunoShima Works
中野システム,"NAKANO SYSTEM CO.,LTD" # ( , )を含むためダブルクオーテーション( " )で括る必要がある
--------------------------------------------------------
上記の登録:trans_term.py
import boto3
translate = boto3.client('translate')
with open('term_ja.csv', 'rb') as file:
translate.import_terminology(
Name='term_ja',
MergeStrategy='OVERWRITE',
TerminologyData={'File': file.read(), 'Format': 'CSV'})
translate = boto3.client('translate')
with open('term_ja.csv', 'rb') as file:
translate.import_terminology(
Name='term_ja',
MergeStrategy='OVERWRITE',
TerminologyData={'File': file.read(), 'Format': 'CSV'})
コマンド
python trans_term.py
---------------------------------------------------------
コード
import boto3
translate = boto3.client('translate')
text = '徳之島工房の新しい本が中野システムから出ます。'
result = translate.translate_text(
Text=text, SourceLanguageCode='ja', TargetLanguageCode='en',
TerminologyNames=['term_ja'])
print(result['TranslatedText'])
結果
A new book from TokunoShima Works Kobo comes out of the NAKANO SYSTEM CO., LTD.
登録なしの結果
A new book from Tokunoshima Kobo comes out of the Nakano system.