前回の記事で簡単に説明したように、ニューラルネットワークの機械翻訳は2010年代に登場した比較的新しいアプローチです。コンピューターの性能の向上、ディープラーニング技術の進歩、そして決定的に重要なこととして、膨大な量の言語データを構築できるようになったことで、途方もない変化がもたらされました。今日のビッグデータの爆発的な増加を見ると、今後、さらに多くの驚くべきイノベーションが起こり、人間のコミュニケーションが変革されることにワクワクしています。
ニューラル機械翻訳の原理
ニューラルネットワークの機械翻訳は、コンピューターをデータでトレーニングするという点で統計ベースのアプローチに似ています。ただし、はるかに大量のデータとディープラーニングを使用して一種の人工ニューラルネットワークを構築するという点で、根本的な違いがあります。人工ニューラルネットワークは、多数の神経細胞が集まってできた高等生物の脳に似ています。
近年の人工知能技術は、さまざまな問題を解決するための人工ニューラルネットワークを作り、それらをつなげて巨大で複雑なネットワーク構造を構築することで進化してきました。ニューラルネットワークの機械翻訳は、こうしたさまざまな人工ニューラルネットワークの一つとも言えます。短期間でさまざまな発達段階を経て、ものすごいスピードで進化してきたという事実は、人間の脳の進化過程を思い起こさせます。
ニューラル機械翻訳は、赤ちゃんが言語を学ぶのと同じように発展します。コンピューターは学習すべきデータをたくさん与え、自分で学習させ、それに基づいて翻訳できるように翻訳者を育成します。もちろん、最初は間違いを犯しますが、それを覚えて何度も何度も挑戦しながら改善を続けます。
人間の能力の限界を超えていますか?
現代のシステムでは、データから何を探すべきかを人間が教える必要はないと言っています。これは、人工知能が自身を分析してパターンを見つけ、問題を直接解決する方法です。これを見ると、人工知能には無限の可能性が秘められているため、期待はさらに高まるに違いありません。
機械翻訳は、ディープラーニングとビッグデータを通じてパフォーマンスの限界に挑戦し続けています。人間は一生かかっても得られない膨大な量の情報を学び、人間を超える問題解決能力を発揮します。基本的には、精緻なデータを機械に与えて学習させるだけで、あとの作業は機械がやってくれます。そのため、ニューラルネットワークの奥深くで行われている複雑な処理プロセスをすべて把握することは困難です。
しかし、それでも結局機械は、人間が作り出したアルゴリズムや学習データを通じて進化するしかありません。もしそうなら、人間の能力の限界を超えるよりも、機械が人間の能力を高めると考える方が正確だと思います。
人間の能力を広げるためのツールとして
しかし、現在のところ、機械翻訳が人間の専門家のレベルを超えることは容易ではないようです。これは、何千年にもわたる進化の過程で、すべての言語が複雑で独特な特性を発達させてきたからです。そのため、正確な翻訳を行うためには、その言語領域の文化を理解することが必要であり、全体的な文脈を理解し、適切な背景情報に基づいて推論を行う高度な思考プロセスが必要となります。つまり、高品質な自動翻訳能力を誇る人工知能翻訳者が出てくるまでには、まだ少し時間がかかるということです。
もしそうなら、しばらくの間、機械翻訳を人間の翻訳作業を支援する効率的なツールと考えてみませんか?言語の違いに加えて、テキストは口語や書き言葉、一般文書、専門文書など予想以上に多様であるため、その特性によって翻訳品質の違いは必ず生じます。その代わり、特定の専門分野の文書でも、データやコーパスのみがしっかり構成されていれば、精度の高い翻訳結果が得られます。
一例として、Twigfarmは、特定の分野でよく使われる単語や文章を抽出するデータベースである翻訳辞書を使用することで、特に法律、金融、機械、医学などの専門分野の文書の翻訳品質を大幅に向上させることができました。つまり、人間を置き換えるのではなく、専門の翻訳システムで汎用翻訳者の限界を克服し、タイプミスなどの人為的ミスを防ぐことで翻訳作業をより正確かつ効率的にしているのです。
ヒューマンコミュニケーションの未来へ
バベルの塔の物語だけを見ても、言葉の壁のない世界は人類にとって長年の夢のように思えます。コンピューターを想像できなかった17世紀の哲学者デカルトでさえ、一種の機械翻訳モデルを提案しました。しかし、テクノロジーの発達により物理的な境界がなくなりつつある今日でも、言葉の壁によるコミュニケーションの困難は未だに存在しています。
このような現実の中で、機械翻訳は人と人とのコミュニケーションを妨げる言語の壁を打ち破り、コミュニケーションをとり、お互いを理解したいすべての人にとって素晴らしいツールになり得ます。人工ニューラルネットワークによって精度が高まっている機械翻訳と人工知能の進歩により、人類の昔からの想像が現実のものになりつつあります。機械翻訳者は、すでに多くの点でコミュニケーションの手段として十分役立っています。
もちろん、文章に内在する深い意味や文学的表現の翻訳を期待するのであれば、まだまだ足りない部分が多いかもしれません。しかし、人工知能技術の発達により、AI (人工一般知能) と呼ばれる強力な人工知能の時代が到来し、現在の機械翻訳の限界や問題は完全に解決されるかもしれません。
寿命が限られている私たち人間が、すべての言語と知識を習得することは不可能です。しかし、機械翻訳技術と人間の繊細なコミュニケーション能力をうまく活用すれば、今後さらに素晴らしいことが起こると私は信じています。
さまざまな言語を話す多様な人々間の自由なコミュニケーションから、世界中からの膨大な量のコンテンツの交換、さらには人間と人工知能の間の将来のコミュニケーションまで。
参考文献
[1] ディープラーニングと機械翻訳 https://terms.naver.com/entry.naver?docId=3580263&cid=59088&categoryId=59096
[2] 人工ニューラルネットワーク https://ko.wikipedia.org/wiki/인공_신경망
[3] 脳 https://ko.wikipedia.org/wiki/뇌
[4] カン・ビョンギュ・イ・ジウン、「ニューラルネットワーク機械翻訳の仕組みと翻訳の正確性-中国語翻訳を例に」(中国語文学会、2018、253-295)
[5] [市場展望] AIの通訳と翻訳の進化 https://www.itdaily.kr/news/articleView.html?idxno=83486
[6] キム・ソンミ、AI時代における人間翻訳と機械翻訳(NMT)の共存-経営管理における「拡張(拡張)戦略」に焦点を当てて(韓国通訳・翻訳者協会、2018、1-32)
一緒に見るのに良いコンテンツ
[AI ストーリー] 機械翻訳と人工知能の出会い言語処理エンジンであるLETRがテキスト言語に焦点を当てているのはなぜですか?