専門翻訳者のスキルをクローンする:カスタム翻訳エンジン
AI翻訳は進化し、流暢な訳文を出せるようになりましたが、技術、医薬、特許などの専門分野では、依然として人手による修正や、一貫性の維持に多くの時間がかかっています。その理由は、汎用翻訳エンジンがインターネット上の公開情報を中心に学習しており、専門用語や自社用語への対応が不十分であるうえ、個別のカスタマイズにも対応できないからです。
実は、自社の翻訳データを使ってAI学習させれば、「専門翻訳者のスキルをクローンした」AI翻訳が、最短1か月で実現することが可能です。本記事では、その鍵となるシストランの「カスタム翻訳エンジン」についてご紹介します。
01カスタム翻訳エンジンとは
カスタム翻訳エンジンとは、お客様独自のデータを学習させて作り上げる、お客様専用のAI翻訳エンジンです。汎用翻訳エンジンとは異なり、自社事業に最適化された高精度なAI翻訳を実現できることから、多くのグローバル企業が採用しています。
シストランは、世界初の自動翻訳開発企業として、長年にわたり政府機関、医療、製造業などのエンタープライズ向けに、カスタマイズ可能な翻訳ソリューションを提供してきました。このようなニーズに応える中で、専門分野に特化した翻訳エンジンを構築・最適化する技術や、顧客の持つ対訳データを効果的に学習するノウハウを蓄積してきました。その成果として、「SYSTRAN Model Studio 翻訳エンジンAI学習プラットフォーム」が誕生しました。現在では、毎月100以上のカスタム翻訳エンジンがこのプラットフォームでトレーニングされています。
02カスタム翻訳エンジンの作成
1. 学習データの準備
カスタム翻訳エンジンの品質は、「学習データ(教師データ)」の質と量によって決まります。中でも特に重要なのが、翻訳メモリ(Translation Memory; TM)です。これは、専門翻訳者が過去に訳した原文と訳文のペアを蓄積したもので、高精度なエンジンの学習に不可欠な材料です。
お客様が学習データを準備する際、以下の要件をご留意ください。
- 原文と訳文は基本的に「1文→1文」のペアですが、「1文→2文」や「2文→2文」にも対応可能。
- 表現にできるだけ一貫性があり、10万文(対訳ペア)以上のデータがあれば、翻訳エンジンの精度は安定しやすくなります。
- 翻訳エンジンは一方向の翻訳を学習します。「英語→日本語」と「日本語→英語」は別のエンジンとなりますので、データの方向性(例:「英語→日本語」)をご確認ください。
- 形式:tmxファイル、またはタブ仕切りテキストファイル
社内に翻訳メモリがない場合でも、基本的には過去に依頼した翻訳会社から取り寄せることが可能です。あるいは、既存のコンテンツ(例:英日版のマニュアルファイルなど)をもとに、弊社で翻訳メモリを作成する「アライン作業」のサービスもご利用可能です。もしくは、お客様が希望される分野のヒアリングを実施させていただき、イメージに近い翻訳メモリの作成を請け負うサービスもご用意しております。
2. カスタム翻訳エンジンのトレーニング
翻訳エンジンAI学習プラットフォーム「SYSTRAN Model Studio」は、主に多言語・多分野にわたるカスタマイズが必要なお客様向けに提供しています。1言語ペアのみのカスタム翻訳エンジンを作成する場合でも、弊社がトレーニングを代行することで、利用が可能になります。
◎ カスタム翻訳エンジンの作成サービス(所要期間:1エンジンにつき約1か月)
お客様から提供された学習データをもとに、弊社の専任担当がエンジンをトレーニングします。パラメータの最適化やデータの調整を通じて、用途に合った高精度なカスタム翻訳エンジンを構築します。また、お客様側で高性能なハードウェアを準備する必要はなく、初期投資を抑えられる点も大きなメリットです。
【主なプロセス】
- データクリーニング
学習データに含まれる欠損文・重複文・不要な記号などを除去・正規化することで、翻訳精度の低下や誤訳につながるノイズを取り除きます。 - トレーニングの実施
トレーニングは、翻訳エンジンが学習データから訳し方のパターンを学ぶプロセスです。提供されたデータは、複数のフィルターや変換処理を経て品質と再現性を高めたうえで使用されます。 - エンジンの評価
トレーニング後には、翻訳エンジンの品質を客観的に評価します。学習データの一部を評価用として事前に分離し、トレーニングには使用せずに比較検証に活用します。評価には主にBLEUスコア(0%-100%;参照訳に近いほど数値が高い)を用い、トレーニング前後の翻訳品質の改善度を可視化します。

3. カスタム翻訳エンジンの運用
カスタム翻訳エンジンを運用するには、翻訳ソフトウェア「SYSTRAN Translate Server」が必要です。SYSTRAN Translate Serverは、テキストやファイルの翻訳に加え、OfficeアドインやChrome拡張機能との連携、API経由での利用も可能な多機能な翻訳ツールです。
このサーバーを社内ネットワーク環境にデプロイすることで、全社員が共通の翻訳基盤を利用できるようになり、社外秘資料もセキュアに翻訳できます。さらに、翻訳結果に対する修正内容をSYSTRAN Translate Serverに保存することで、新しい用語や表現をすぐに学習させることができ、業務効率の向上を期待できます。
◎ 運用のベストプラクティス
多くのグローバル企業が採用しているベストプラクティスは、以下の流れに基づいています。
- カスタム翻訳エンジンの導入
高精度なカスタムエンジンによって、他の翻訳ツールにない品質が得られ、翻訳業務の効率化を図りながら、社内利用率を向上。 - 日常業務での翻訳メモリの蓄積
翻訳結果の修正内容をSYSTRAN Translate Serverに保存し、一定範囲内で再利用することで、重複作業を削減。 - 定期的な再トレーニング
年に一度、蓄積された新しい翻訳メモリをもとに、SYSTRAN Model Studioで再トレーニングを実施。エンジンの精度と適応範囲を拡大し、常に最高な翻訳精度を維持。

03まとめ
SYSTRANのカスタム翻訳エンジンは、専門翻訳者の訳し方をAIに学習させ、社内で高精度な翻訳を再現できる仕組みを実現します。エンジンのトレーニングには約1か月と短期間で、すぐに効率化を図ることが可能です。国内メーカーの事例では、導入前はネイティブ翻訳担当者が約70%の文章を修正していましたが、カスタム翻訳エンジン導入後は修正箇所がわずか3%にまで減少。翻訳チェック作業の負担が大幅に軽減されました。
AI時代の翻訳者には、作業効率の追求にとどまらず、語学力を軸に多言語対応の基盤づくりに関わりながら、組織全体に価値を広げていくような新たな役割が開かれています。
「自社にも導入できるのか?」、「今ある翻訳データでどこまでできるのか?」など、気になる点がございましたら、ぜひお気軽にお問い合わせください。