機械翻訳 & 人手翻訳 機械翻訳の進化と人とのコラボレーション

前回の記事では、「機械翻訳」のメリットやデメリットについて触れましたが、実はその機械翻訳にも複数種類あるということをご存知でしょうか?

コンピュータの発達により目覚ましく進化を遂げている機械翻訳は、文法や単語の意味を重視した翻訳から、文脈やニュアンスまでを考慮した翻訳ができるようになるなど、翻訳の精度は飛躍的に向上し、人間が翻訳した文章と遜色ない翻訳ができるようになってきています。
ですが、遜色ない翻訳とはいえ、まだまだ完璧とは言えません。文化や風俗習慣の違い、専門的な用語といったファクターは、人間が得意とする”理解する力”が必要になります。

機械と人間、対立するような構図を考えがちですが、それぞれのメリットとデメリットを補い、新たな価値の提供につなげることも出来るのではないでしょうか。

機械翻訳の進化

機械翻訳の始まりは、9世紀のアラビア語暗号解読者アル・キンディが開発した、暗号解読、周波数分析、確率統計といった現代の機械翻訳でも使われる体系的な言語翻訳の技術で、17世紀にフランスの哲学者ルネ・デカルトが提唱した、普遍言語という考え方により発展しました。何世紀にもわたって大きな進化を遂げてきた機械翻訳ですが、20世紀には特にその進化が顕著に見られます。
1949年、ロックフェラー財団の研究員ウォーレン・ウィーバーは、情報理論に基づいた、コンピュータベースの機械翻訳に関する最初の発表をし、第二次世界大戦中の暗号解読に成功、また、自然言語のベースにある普遍的な原理に関する理論を提唱しました。
1950年代初頭、MIT初の機械翻訳研究者イェホシュア・バーヒレルにより、機械翻訳に関する初の協議会が開催されました。
1954年、ジョージタウン大学とIBMの実験により、ロシア語の文章を英語に翻訳する機械が実証されたことで、機械翻訳に対する世界的な関心が高まることになります。

1970年代、欧州委員会がルールベース機械翻訳(RBMT)であるSystran英仏機械翻訳システムの開発を開始し、政府や組織が機械翻訳システムを導入し始めました。
2000年代、正確さ、流暢さ、複雑な文章や慣用表現の扱いといった課題はありますが、統計モデルを用いてテキストを翻訳する統計的機械翻訳(SMT)の研究が盛んになります。このようにして、時代とともに発達したコンピュータの計算能力を活かすべく、初期の提案や実験から、ルールベースや統計ベースといったアプローチ方法の機械翻訳が開発されたのです。
そして近年、Google、Microsoft、Amazonといったビッグ・テックも開発に参画している、人工ニューラルネットワークを利用したニューラル機械翻訳(NMT)が最先端の機械翻訳として、注目を集めています。

機械翻訳の種類

進化の歴史をご紹介した中で、3種類の機械翻訳について触れました。ルールベース機械翻訳(RBMT)、統計的機械翻訳(SMT)そして、ニューラル機械翻訳(NMT)の3種類です。当然ですが、それぞれ異なるアプローチ方法で言語の翻訳を行っています。

ここではそれぞれの違いを詳しく説明していきます。

ルールベース機械翻訳(RBMT)

事前に定義されたルールセットを使用し、翻訳を行います。これらのルールは、言語学者とプログラマーが協力して、言語ペアごとに文法と語彙のルールを作成します。RBMTは、簡単な文章であれば正確な翻訳ができますが、複雑な文や慣用的な表現には限界があります。

統計的機械翻訳(SMT)

翻訳するための統計モデルを使用し、翻訳を行います。この統計モデルは、大量のバイリンガルテキストデータで単語やフレーズの関係、翻訳方法を学習したものになります。翻訳の際は、統計的アルゴリズムを使用して、翻訳対象の文に対して最も可能性の高い翻訳(出現率の高い翻訳)を行います。SMTは、複雑な文や慣用的な表現を扱う際には、RBMTよりも効果的ですが、精度や流暢さの点ではまだ限界があります。

ニューラル機械翻訳(NMT)

人工ニューラルネットワークを使用し、翻訳を行います。SMT同様に大量のバイリンガルテキストデータを使用し、データ内のパターンを分析(いわゆるディープラーニング、AI学習)することで翻訳方法を学習します。翻訳の際は、単語単位ではなく文章単位で翻訳を行うため、RBMTやSMTよりも複雑な文や慣用的な表現を扱うことができます。また、他の機械翻訳と比べても、より正確で流暢な翻訳を行うことができます。現在の機械翻訳ソフトウェア開発において、主流とされる手法です。


着実に人間の翻訳に近づいてきている機械翻訳ですが、まだまだ課題が多いです。 前回の記事「機械翻訳 VS 人手翻訳 それぞれの特徴を解説!」でも述べたように、機械と人間でそれぞれメリットとデメリットがあるため、人間が論理的に判断し、機械が処理するというコラボレーションが、より高度な翻訳品質を実現するために必要になります。

機械と人間のコラボレーション

機械と人間とのコラボレーションにおける、具体的な方法として、機械翻訳のプリエディットやポストエディットがあります。プリエディットとは、機械翻訳前に原文の処理をすることで、訳文の品質を上げることを目的としています。一方、ポストエディットとは、機械翻訳されたコンテンツをレビューし修正することで、訳の精度や品質を底上げすることを目的としています。

プリエディット作業

  • 文法ミスや誤脱字など、原文の誤りを修正します。
  • 文章構造を簡略化したり、省略されている主語を補ったりして、あいまいさを取り除きます。

ポストエディット作業

表記表現、用語の統一や言葉遣いなども考慮し、より人間が書いたような表現になるよう調整します。
ポストエディットには、ライト/ラピッドポストエディットとフルポストエディットの2種類があります。

ライト/ラピッドポストエディット

主に正しい意味を伝えることに焦点を当てており、文体や読みやすさの問題は無視されます。

フルポストエディット

機械翻訳された内容を徹底的に見直し、より自然な翻訳になるよう文章のトーンや原文の背景、読みやすさなどを調整します。

プリエディット・ポストエディットのメリット

機械翻訳のスピードと人手翻訳の精度を組み合わせた形になります。フルで人手翻訳を行う場合にかかる時間と労力を削減できるため、費用対効果が高くなります。

人手翻訳の重要性

ポストエディットは、機械翻訳の精度を向上させることはできますが、人手翻訳の代わりになるというわけではありません。
文章のニュアンスを正確に捉え、文脈をくみ取り、適切な専門用語・表現を使った翻訳を行うことができます。

機械翻訳と人手翻訳のこれから

翻訳における機械と人間のコラボレーションは、今後も進化すると予想されます。
NMTの進歩により、機械翻訳の品質も向上し、大規模なポストエディットの必要性が減ってきました。AIツールを活用して人間の翻訳者をサポートできるよう、より効率的で効果的なポストエディットのワークフロー開発へと流れはシフトしています。

まとめ

機械翻訳の進化とその種類、そして翻訳における機械と人間のコラボレーションについてみてきました。目まぐるしい進化を遂げてきた機械翻訳は、簡単に、そして素早く翻訳したい時に最適なツールとして広く使われています。ですが、企業や組織で使うには、まだまだ精度に不安を感じる部分が多く残るかと思います。そんな不安を減らすためにも、プリエディットまたはポストエディットというプロセスを取り入れてみるといいかもしれません。
人間の知能と機械の処理能力が組み合わされば、互いのデメリットを補うようなワークフローへと最適化し、テクノロジーを存分に活用した高効率&高品質な翻訳を実現できるようになるかもしれません。

 

この記事を書いた人

編集部

この記事をシェアする