翻訳をする必要があるけれど、Google翻訳などの無料翻訳ツールを使うべきか、それとも翻訳会社に依頼するべきかがわからない。翻訳会社は高そうだし、一方で無料翻訳ツールじゃちょっと不安。どうすればいいだろう。
このような悩みに答えるべく、この記事を構成しました。
結論
「とにかく翻訳する必要があり、多少間違いがあっても大丈夫」という場合に限り、機械翻訳を使ってもいいでしょう。それ以外の場合は、人力翻訳(翻訳会社やフリーの翻訳者)を使ってください。機械翻訳をそのまま使ってはいけません。
機械翻訳が日進月歩しているこの時代において、このような結論はやや予想と違うかもしれません。でも翻訳歴12年の私から見た場合、これは妥当な評価です。
なぜなら、現在、機械翻訳はものすごく進化していますが、まだまだその作成される訳文が自然な文章にほど遠く、その「質」にまだまだ大きな問題があるからです。
出力された訳文がなんとか「読めて、わかる」場合も多いですが、完全に意味不明な訳文が出力されることもよくあります。
機械翻訳の例
百聞は一見にしかず。実例で機械翻訳の質について見てみたいと思います。翻訳エンジンはいちばん有名どころのGoogle翻訳を使います。また、翻訳後の品質がわかるように、英語から日本語へ翻訳します。日本語から英語に翻訳しても、英語から日本語に翻訳しても、同じ翻訳エンジンを使いますので、本質的に同じことのはずです。
例1
無造作に例えば、Yahoo.com から英語をとってきます。2020年6月6日のYahoo.comのトップ画面に表示された記事です。

ここの英文をコピーしてGoogle翻訳に投入して翻訳してみますね。
In a four-minute speech, Atlanta’s Keisha Lance Bottoms implored rioters to go home. It was a master class in constructive scolding.

出来上がったのが、こちらの日本語文です。↓
2人の警官が一時停止した後、警察ユニット全体が辞任
ニューヨーク州バッファロー警察の緊急対応チームの57人のメンバー全員が、年配の抗議者を地面に押し込んだために2人の警官が停止された後、部隊を辞めた。
いかがでしょうか。日本語の訳文はわかりにくいではないでしょうか。
「2人の警官が一時停止した後、警察ユニット(警察隊のことか)全体が辞任した」って、奇妙な文章ですよね。実はこの文章で「一時停止」に対応する英語はsuspendedですが、この単語には「一時停止する」の意味もありますが、「停職する」の意味もあります。そしてここでは、もちろん後者のほうが適訳です。
しかしGoogle翻訳は複数ある意味のうちの、適切でないほうの意味を選びました。ほかにも、「警察ユニット全体」も、「2人の警官が停止された後、部隊を辞めた」の部分も、手を加えないと理解しにくいことは言えると思います。
例2
もう1つ行きたいと思います。今度はホテル関係の文章にしたいと思います。Expediaで適当にニューヨークのホテルを探したら次のホテルを探し当てました。https://www.arlohotels.com/arlo-soho/

この「Your Homebase in SoHo」をGoogle翻訳に投入して翻訳してみます。

ソーホーでのホームベース
ものすごい直訳ですね。「ソーホーでのホームベース」って、原文の英語を見ないと何のことかなかなかわからないと思います。
機械翻訳の質の問題とは
上記は英語から日本語への翻訳例なので、翻訳の間違いや不自然なところはすぐに気づきますが、日本語から外国語に翻訳するときは、その言語についての知識がないと、まったく気が付かないではないのでしょうか。
そういう誤訳例を集めましたので、興味がありましたらお読みください。
このように、機械翻訳では、翻訳元原稿にある言葉を違う意味に翻訳したり、訳出された文章が不自然だったり、原文にある重要な要素がごっそり抜けたりするといった誤訳がかなり発生します。そして後述するように、その特性上、避けることはできません。これが機械翻訳の「質」の問題です。
もちろん、翻訳する内容によっては、また翻訳エンジンによっては、たまたまパーフェクトな翻訳になることもありますので、一概にすべて機械翻訳が誤訳するということではありません。しかし誤訳が発生する余地が常に存在している以上、機械翻訳をそのまま使うのは危険だということは言えるのではないでしょうか。
お客様に見せるメニューや取引先に見せるパンフレットやホームページなどに、1箇所でも上記のような誤訳があったら、アウトだと思います。
どの部分が誤訳されたかわかるのならばまだしも、いつ、どこで、どのように誤訳が現れるかわからないのでなおさら怖いのです。
ですから上記のようなリスクを犯したくない場合は、人力翻訳を使ってください。
さて、翻訳の質の問題は、主に次の2点が原因として考えられます。
- 対訳データの蓄積量に依存
- 文脈が理解できない
1つずつ見ていきますが、やや技術的な話になりますので、興味のない方は飛ばして機械翻訳が役に立つ場面に進んでいただいてかまいません。
対訳データの蓄積量に依存
現代の機械翻訳は、たくさんの対訳文例をデータとして蓄積し、文例の中の単語などを記号化して処理し、翻訳のためのデータベースを作り上げたうえで、そのデータベースを利用して翻訳しています。
データの蓄積は何よりの先決条件で、蓄積にないものは処理できませんし、蓄積にあっても量が少ない場合はうまく処理できません。またそもそもその蓄積が間違っている場合も、間違った翻訳しか出力されません。
対訳データは多くの場合、広く一般から集めており、玉石混交で一概に品質のいいものばかりだとは言い切れませんので、下手な翻訳や間違った翻訳が蓄積されることもままあることだと思います。
例えば「終活」という言葉はどうもGoogle翻訳の蓄積にないようです。

英訳は、「俺も生きないと」となっています。
一方「婚活」は蓄積にあるようです。

英訳は正しい意味になっています。
文脈が理解できない
機械翻訳はピリオドや句点等で区切られた1つ1つの文を機械的に処理しているだけなので、前後の文との関係があまり考慮されません。
こうなると例えば1つの原文に2通り以上の解釈ができる文の場合、人間の翻訳者なら前後の文脈で適切な方の意味を選んで訳出しますが、機械翻訳の場合はそうはいかず、どの意味の翻訳が出るかわかりません。
また例えば原文に誤字がある場合は、人間の翻訳者なら文脈で本当はそこは何の文字かを推測し、正しい翻訳をしますが、機械翻訳の場合はそうはいきません。あくまで誤字を訳出しますので、意味の通じない訳文になってしまいます。
人間の言葉は、既存のものでも数え切れないほどのバリエーションがありますし、どんどん新しい言葉や表現も生まれてきています。また言葉は人間の社会に根ざしており、同じ内容の表現でもそれを受け取る人によって様々に解釈が可能です。人間と同じスペックの人工知能でも生み出されない限り、上記のような問題は完璧に解決できないと思います。よって翻訳の質の問題は、完璧な人工知能の出現によって初めて解決されるものと思います。
このような質の問題があるがために、機械翻訳の結果をそのまま正式な用途に使うとときには大問題に繋がりかねません。
機械翻訳が役に立つ場面
ここまで書くと、翻訳業者による機械翻訳をディスる記事にしかなりませんので、機械翻訳を使ってもいい場面についても少しお話します。
機械翻訳は手軽に翻訳でき、すぐに結果がわかり、そして殆どの場合無料なので、冒頭で述べたように、誤訳をある程度許容できる環境にいるのであれば、利用しない手はないと思います。
たとえば海外から受け取ったメールの大雑把な意味を把握したいときや、外国語のウェブページを理解したいとき、海外製品を購入したけど日本語の説明書がないときなどに、機械翻訳を利用したらいいでしょう。これは機械翻訳を使って外国語を日本語に翻訳する場合です。
一方日本語を外国語に機械翻訳で翻訳する場合、誤訳はある程度発生しますが、次のことに気をつけることで、ある程度通じる外国語の訳文が作れると思います。
- 新語や意味が曖昧な単語を別の言葉に置き換える
- 文章は短く、シンプルに切る
- 述語がはっきりと分かるようにする
- 主語がない場合は追加する
これについては別記事に詳しくまとめていますので、よかったらお読みください。(準備中)
また、特に文法がびっくりするほど似ている日韓の間では、単語をわかりやすいものに差し替えれば、ある程度満足の行く訳文が生成できると思います。
それでも、上記のことに気をつけていても、生成された訳文はそのまま利用せず、最低限当該言語が分かる人に校正してもらうべきです。
また翻訳に携わる人の場合、機械翻訳は下訳を作ったり、言葉の意味を調べたり、あらたな着想を得たりするのにたいへん有用です。
これについてはこちらの記事に詳しくまとめていますので、興味がありましたらお読みください。(準備中)
黄天化でした。今回は以上です。