最近、人工知能に基づく機械翻訳技術が世界中で注目されている分野です。そのため、GoogleやMSなど、多くの有力企業や研究者が集中的に研究を行っており、実際に有意義な研究成果が発表され続けています。そのおかげで、機械翻訳 (機械翻訳) の性能と品質は日々急速に進化し、機械翻訳の活用は翻訳業界や分野のさまざまな分野で拡大しています。
しかし、機械翻訳の品質には、プロの翻訳者に比べてまだ多くの欠点があることも否定できません。しかし、コストや時間の節約など、現実的な理由から機械翻訳の利用が確実に増加する状況を考えると、翻訳会社やユーザーの立場にある翻訳者は、機械翻訳の品質問題を正確に理解したうえで、必ず機械翻訳を利用することになります。
このブログ記事では、この問題を理解しやすくするために、実際の機械翻訳のパフォーマンスを測定する指標である「BLEU(バイリンガル評価対象)スコア(BLEU)スコア(BLEU)スコア(BLEU)スコア)」について説明します。
BLEU(バイリンガル評価対象)スコアとは何ですか?
優れた機械翻訳者を育成したり、翻訳者を正しく使用したりするには、翻訳品質の正確な評価と確認が不可欠です。また、実際の翻訳者の業績や品質を評価するさまざまな方法の中で、「BLEUスコア」が最も広く使われています。
簡単に言えば、BLEUスコアは翻訳品質を測定するための定量的指標であり、機械翻訳された文章と正解の正確さを比較することによって測定されます。すなわち 機械翻訳者が翻訳した文が、人間が判断した正しい文に類似しているほど、BLEUスコアは高くなります。あなたはそれをするでしょう。
BLEUスコアの実際の測定例
一般的に、機械翻訳のパフォーマンス トレーニングデータのサイズとアルゴリズムモデルのレベルによって決まります特に、学習する翻訳者にとって、質の高いデータを大量に確保することが最も重要だと言われており、長期的なサービスを通じて多くのユーザーを確保してきた大手企業はこの分野で優位に立っているようです。
そのため、後発のGicon Studioが追いつくためには、別のアプローチで差別化を図るしかありませんでした。これは前述のアルゴリズムによる改善方法であり、特定のトピックやドメインに最適化された翻訳モデルを備えたプロフェッショナルな翻訳ソリューションを提供します。実際、この分野の専門用語や表現をカスタマイズしたデータベースである翻訳辞書(翻訳辞書)は、Gicon Studioサービスのプロフェッショナルな翻訳品質を向上させる上で決定的な役割を果たしました。
ジコン・スタジオはグーグルよりも優れている
また、2019年、Gicon Studioチームは、プロによる翻訳のパフォーマンスと品質を客観的に評価するために、韓国情報通信技術協会(TTA)ソフトウェアテスト認証機関による検証および検証テスト(検証と検証)を受けました。当時、私たちは5つの分野(法律、金融、機械、化学、医療)でGoogle翻訳者との翻訳品質を比較し、4つの分野(法律、金融、機械、医療)でGoogle翻訳者よりも高いスコアを獲得しました。特に、リーガルテストでは優れたBLEUスコア(Google 0.2464、Gicon Studio 0.3277)を記録し、その技術力が認められました。
ユーザーの視点から見たBLEUスコアの意味と使い方
一見すると、BLEUスコアは、研究開発結果の評価やフィードバックを必要とする開発者や研究者にとって重要な指標だと思いがちです。ただし、実際の翻訳プロジェクトで機械翻訳ソリューションを使用する翻訳会社や翻訳者にとっては、さまざまなオプションを比較してどれが最適かを判断する良い参考にもなります。
ほとんどの翻訳者は一般的な使用を想定して設計されており、主題に関係なく使いやすいですが、特定のトピックや分野に最適化されたモデルもあります。つまり、同じ単語や文章であっても、使用する専門分野によってはまったく異なる意味で翻訳する必要がある場合があることを考えると、目的に最適なものを使用すれば正確な翻訳が可能です。
したがって、高品質の翻訳結果を得るには、関連分野に合わせたオーダーメイドのソリューションを使用する必要があります。特許、法律、医学、科学、技術など、翻訳が必要な分野はさまざまであるため、これらの分野の文書を正確に翻訳するためには、BLEUスコアなどの評価指標を参照して最適な分野を選択して使用することが賢明である必要があります。
*このコンテンツはGicon Studioからレターワークスに転送されました。