2021年5月18日火曜日

Googleが翻訳APIの機能を強化、「Document Translation」を発表

https://news.mixi.jp/view_news.pl?id=6521529&media_id=39
シェアしました。

2021年05月18日 11:22  @IT

@IT

写真AutoML Translationを使うと用語集やモデルを使ったカスタム翻訳を実現できる(出典:Google)
AutoML Translationを使うと用語集やモデルを使ったカスタム翻訳を実現できる(出典:Google)

 Googleは2021年5月12日(米国時間)、「Cloud Translation」プロダクトスイートに含まれる「Translation API Advanced」の新機能「Document Translation」(プレビュー版)を発表した。



【その他の画像】



 Cloud Translationは、Googleの機械学習モデルを使用して言語間の翻訳を動的に進めるもの。このスイートに含まれる最も基本的なプロダクトである「Translation API Basic」は、Webサイトやアプリケーションの表示を100以上の言語へ瞬時に翻訳できる。Translation API Advancedでは、Basicの機能に加えて、カスタマイズによって分野固有やコンテキスト固有の用語やフレーズに対応できる。



 Translation API Advancedの新しいDocument Translation機能では、100以上の言語について、DOCXやPPTX、XLSX、PDF形式のドキュメントを、書式設定やレイアウトといったフォーマットを保持したまま直接翻訳できる。



リアルタイムオンライン翻訳が可能



 Document Translation機能の特徴の一つは、単一ファイルのリアルタイム(同期処理)オンライン翻訳が可能なことだ。例えば、人事書類などのビジネスドキュメントを翻訳する場合、オンライン翻訳により、小規模なファイルを高速に翻訳できる。PDFの場合、ファイルサイズが20MBまで、ページ数は20ページまで対応できる。他のドキュメントタイプの場合、ファイルサイズは20MBまでで、ページ数に制限はない。



 「REST」(REpresentational State Transfer)または「gRPC」によってDocument Translation APIをモバイルまたはWebアプリケーションと簡単に連携させ、瞬時に翻訳することも可能だ。



AutoML Translationを用いたカスタム翻訳も



 Googleマネージドモデルの代わりに独自の「AutoML Translation」モデルを使って、ドキュメントを翻訳することもできる。AutoML Translationは、Cloud Translationスイートに含まれるプロダクトの一つ。



 Document Translation機能は、Googleの「SOTA翻訳モデル」でビジネスドキュメントを高速かつ簡単に翻訳するだけでなく、Translation API Advancedの機能を組み合わせることで、AutoML Translationでトレーニングした用語集やモデルを使ったカスタム翻訳を簡単に制御できる。



 Translation APIの用語集機能では、翻訳元言語と翻訳先言語で名前と語彙(ごい)を定義し、その用語集ファイルを翻訳プロジェクトに保存する。以後の翻訳リクエストでは、自動的にこの用語集を用いて翻訳が進む。


0 コメント:

コメントを投稿