2021年11月2日火曜日

独自プロセッサ×音声認識が“文字起こし”に革命を? 「Pixel 6 Pro」全力レビュー(後編)

https://news.mixi.jp/view_news.pl?id=6724882&media_id=37



2021年11月01日 20:12  ITmedia Mobile

ITmedia Mobile

写真Pixel 6 Pro
Pixel 6 Pro

 Googleは10月28日、フラグシップスマートフォン「Pixel 6シリーズ」を発売する。Google Store(Web直販)における税込み販売価格は、「Pixel 6」は7万4800円から、「Pixel 6 Pro」は11万6600円からとなっている。



【その他の画像】



 今回、シリーズの上位モデルであるPixel 6 Proを一足早く試す機会を得た。1週間ほど試用した上での感触を2回に分けて紹介する。後編では、独自プロセッサ「Google Tensor」のパワーを体感しやすい音声認識関連の機能をチェックしつつ、“Androidスマホ”としてのPixel 6 Proの実像に迫っていく。



●Tensorを生かした自然言語処理がもたらす利便性



 Tensorが実現した高いAI処理パフォーマンスは、自然言語処理をこれまでにないほどに実用的なものとした。



 自然言語処理は敷居が高そうに思えるが、現代のスマホでは至る所で使われている。例えば「Googleアシスタント」が言葉を聞き取って文字に起こし、指示の中身を解釈するという一連の流れには、全て自然言語処理が関わっている。



 従来は、このような処理をクラウド(インターネット上のサーバ)を介して行うことが一般的だった。それに対して、Tensorはこれらの処理をオンデバイス、つまりクラウドに依存せずに自力で行える能力を備える。しかも、処理にかかる消費電力は従来モデルの半分に抑えているという。



 オンデバイス処理の速さは、音声認識にまつわるさまざまな機能の使い勝手を向上している。今回は、筆者が特に有用だと感じたものをいくつか紹介する。



日本語に対応した「レコーダー」の文字起こし



 Pixelシリーズにプリインストールされている「レコーダー」アプリは、音声をテキスト化する「自動音声文字変換」、平たくいうと「文字起こし」機能を備えている。しかし、文字に起こせる言語は限られており、従来は日本語に対応していなかった。



 Pixel 6シリーズにプリインストールされているレコーダーアプリでは、ついに日本語の文字起こしに対応した。加えて、Tensorによるオンデバイス処理にも対応し、機内モード(オフライン)状態でも文字を起こせるようになった。



 筆者はこれまで、クラウド上で動作する日本語の文字起こしツールをいくつか試してきた。しかし、話し言葉から文意が伝わる程度の文字起こしを行うのは、かなり難しいと感じていた。



 ところが、Pixel 6シリーズのレコーダーアプリでは、速すぎない普通の会話であれば、難なく読める精度でテキスト化できる。これまでの文字起こしツールにおいて“難関”だった適切な位置への句読点の挿入も実現している。



 さすがに同音異義語や固有名詞は読み違えることもあるが、それでも意味をつかめる精度で書き出せるのは見事である。月額数千円から数万円するクラウド型の文字起こしツールの存在を脅かすレベルといえるかもしれない。



レスポンスの良い「リアルタイム翻訳」



 「Google翻訳」アプリのリアルタイム翻訳も、Pixel 6シリーズなら最大限のパフォーマンスを発揮できる。



 このアプリには2カ国語を認識して双方向翻訳する「会話モード」があるのだが、Pixel 6シリーズであれば実用性が増す。早口で話しても2~3秒で音声を認識し、会話にほぼ支障ない速度で翻訳を返してくれるのだ。



 翻訳の精度も、旅行で話し相手に意図を伝える程度ならほぼ問題ない。ホテルや観光案内で質問する程度であれば、ほぼ支障なく会話できるだろう。



 一方、ニュースの文章を読んでみると、専門用語や固有名詞を聞き取れずに誤訳することもある。それでも、正しく聞き取れたフレーズは、おおむね適切に翻訳してくれる。海外の英語ニュースのお供として役立ちそうだ。



 なお、会話モードの利用には通信が必須だ。ただし、事前に各言語の翻訳データをダウンロードしておけば、翻訳時に発生する通信量を抑えられる。



何気に便利な「自動字幕起こし」



 Androidのアクセシビリティ機能の1つである「自動字幕起こし機能」も、Pixel 6シリーズであれば実用的に使える。



 その名の通り、この機能は動画の字幕を自動生成してくれるという機能で、日本語を含む5言語に対応している。スマホ上で再生されるほぼ全ての動画に対応しており、再生状況に合わせて字幕を表示してくれる便利な機能だ。



 文字起こしの精度は、現在「YouTube」で使われている字幕自動生成機能よりも高い。専門用語なども、ある程度認識してくれる。YouTubeには早口でしゃべる動画も多いが、そういったものでも大意を把握できる程度の精度で文字起こしをしてくれる。



 この機能において何より便利なのは、リアルタイムで字幕を生成しつつ、翻訳する機能である。日本語の字幕がない動画でも、起こした文章をそのまま日本語に訳して読めてしまうのだ。試しにPixel 6シリーズの発表動画を自動文字起こし機能を使って見てみたが、英語での説明と齟齬(そご)がなく、話している内容をほぼそのまま理解することができた。



「Gboard」の音声入力もより実用的に



 Googleのキーボード(文字入力システム)アプリ「Gboard」の音声入力にも細かな改良点がある。



 まず入力内容を音声入力の途中で修正できるようになった。長文の入力中に修正したい部分が出てきた場合は、その部分を選択した上で話し直せばよい。



 また「○○の絵文字」と話しかけることで一部の絵文字を入力できるようになった。例えば「ハートの絵文字」と話しかければハートの絵文字が入力される。



●Android 12の“自分らしさ”も心地よい



 Android 12では、ユーザーインターフェイス(UI)が大きく見直された。Googleではこれを「Material You」と呼んでいる。



 ……と、詳しい人はすぐに気付くかもしれないが、このMaterial Youは従来の「Material Design」の延長線にある。基本的な操作は変えずに、より細かいところに手が届くように改良したものだと理解すればいい。



 Material Youでは、スマホを自分らしくアレンジできるように工夫されている。



 使い方は難しくない。まず、自分の好きな壁紙を設定する。すると、その色合いから複数の「カラーパターン」が自動生成される。その中から1つを選ぶと、そのカラーパターンがホーム画面やメニュー項目、通知エリアなど端末全体に反映できる。



 色をカスタマイズできるようになったというだけだが、「自分にあわせた色を使える」というのは、想像以上に心地良い体験だった。



●スマートデバイスの連携も改善



 Android 12では「Googleアシスタント」と「Google Home」に対応するデバイスとの連携機能も強化されている。Google Homeアプリで登録してあるスマートデバイスの操作を音声入力で行えるようになったのだ。



 例えば、Android TVの電源を付けたい場合は「ヘイグーグル、テレビを付けて」と話しかければよい。逆に「ヘイグーグル、テレビを消して」と話しかければ電源が切れるかスリープモードに入る。自宅内に複数のAndroid TVがある場合は、「テレビ」の部分を設定してあるデバイス名に置き換えて話しかければOKだ。スマートライトも同じ方法で点灯/消灯できる。



 この音声認識において、Pixel 6シリーズにおける認識精度の高さは役に立つ。



 Android 12では、通知パネルからスマートデバイスの操作を行えるようになった。Google Homeアプリから目的の機器を探して操作する導線は意外と煩雑だが、通知パネルにデバイスのショートカットを入れておけば、もう操作に迷うことはないだろう。



●独自チップ「Google Tensor」とは何物か?



 Pixel 6シリーズの進化の“鍵”を握っているのは、Google Tensorである。これについて、もう少し詳しく見ていこう。



 この記事では便宜上「プロセッサ」と呼んでいるが、Tensorは「SoC(System On a Chip)」と呼ばれる半導体チップに分類される。



 SoCは、コンピューターの中核処理を担う「CPU」、グラフィックス処理を担う「GPU」、通信を担う「モデム」など、スマートフォン(コンピューター)を構成する上で必要なハードウェアを1つの半導体チップに集約したものである。SoCを用いる最大のメリットは、実装しなければいけない部品数を削減できることにある。そのため、部品の実装面積が限られるスマホでは、SoCが広く使われている。



 従来、PixelシリーズではQualcommが設計したSoC「Snapdragon(スナップドラゴン)」を利用してきた。それを今回、Googleは自社で設計したものに切り替えたのだ。



 ただし、GoogleはTensorの“全て”を自社で開発したわけではないようだ。同社の説明を聞く限りでは、自社で独自開発したことを明言しているのは、機械学習ベースのAI(人工知能)処理を担う「TPU(Tensor Process Unit)」と、カメラのイメージセンサーから入力されたデータを映像に変換する「ISP(Image Process Unit)」の2要素に限られる。



 CPUは、他社のスマホ用プロセッサと同様にArmからライセンス供与を受けたコア(処理回路)を採用している。CPUコアは「2+2+4構成」、つまり3種類のコアを計8個搭載しており、うち2コアはArmの最新アーキテクチャである「Cortex-X1」を採用していることを明らかとしている。残りの2コアと4コアは特に言及がなかったが、実機でアプリを使って調べてみると「Cortex-A76」が2コア、「Cortex-A55」を4コア搭載していることが分かった。GPUについては、CPUと同じくArmが開発した「Mali-G78」を搭載している。



 Armアーキテクチャを採用する他社のプロセッサと比べても、TensorのCPU構成は独特だ。Qualcommの「Snapdragon 888」やSamsung Electronics(サムスン電子)の「Exynos 2100」では、最新かつ高パフォーマンスを誇るCortex-X1を1コアのみ搭載している。TensorがCortex-X1コアを多く搭載しているのは、「ピーク性能」を重視した結果だと思われる。



 ともあれ、TensorはGoogleが独自に設計したプロセッサであることは間違いないが、AIやカメラの処理をいかに効率的に行うかに注力した設計となっている。これは、競合のプロセッサにない強みであることは間違いない。CPUやGPUについてはArmのライセンスを活用し、最上位機種としてふさわしい性能を担保した格好だ。



 さらに、Tensorにはプロセッサ内部にセキュリティプロセッサを統合している。Googleでは、自社開発のセキュリティチップとして「Titan M」を開発し、Pixelシリーズに搭載していたが、プロセッサ自身にもセキュリティ機能を搭載することで、セキュアさが求められる処理を安心してこなせるようになった。



 Pixel 6シリーズでは、Titan Mの第2世代「Titan M2」チップもプロセッサから独立する形で搭載されている。セキュリティプロセッサとTitan M2の“二重”のレイヤーによって、ハードウェアのセキュリティレベルをさらに向上している。



●独自プロセッサでもアプリの互換性は問題なし



 Google独自のプロセッサと聞くと、アプリの互換性も気になる所だ。結論からいうと、この不安は杞憂(きゆう)に終わる可能性が高い。



 先述の通り、TensorのCPU/GPU部分はArmが開発したコアを採用している。Android端末でよく使われるプロセッサもそれは同様なので、Armコアをターゲットに開発されたアプリなら問題なく稼働する。少なくともSNSアプリやツール系アプリは全く問題なく動く。



 ただし、ゲームアプリだけは少し注意が必要だ。一部のAndroid向けゲームアプリは、Qualcomm製プロセッサに搭載されている独自GPU「Ardeno(アルデノ)シリーズ」でベストなパフォーマンスが発揮されるように調整されているケースがあり、他のGPUを備えるプロセッサだと思ったほどパフォーマンスが出ないことがあるのだ。



 今回、ある意味でAndroidスマホの「レファレンスモデル」においてMali-G78が採用された。それを契機に、同GPUへの最適化を一層進めるゲーム開発者が出てくる可能性もある。少し時間はかかるかもしれないが、期待したい。



 「じゃあ、現在のPixel 6シリーズはゲームに不向きなのか?」と聞かれたら、そうでもない。多くのゲームは普通にプレイできる。Pixel 6 Proで「原神」を試しにやってみた所、普通にプレイはできるものの、120fpsでの動作には対応していなかった。



●Pixel 6 Proスマホとしての使い心地は?



 ここからは、Pixel 6 Proのスマホとしての使用感を早足で紹介していこう。



 Pixel 6 Proの有機ELディスプレイのアスペクト比(縦横比)は「19.5:9」とやや縦長だ。よりの設計だ。パンチホール型のインカメラは11.1メガピクセルと画素数が高め。インカメラの周囲には2mmほどのパンチホール(黒抜き)があり、表示している画面にもよるが、強い存在感を放っている。



 ディスプレイの解像度は1440×3120ピクセルで、画素密度は512ppiと高めだ。細かい文字もくっきりと見えるという点で優秀といえる。最大リフレッシュレートは120Hzで、もちろんHDR(ハイダイナミックレンジ)表示もサポートしている。



 重量は約208gとやや重いが、ディスプレイサイズやカメラの構成から考えると致し方ない面もある。フレキシブル有機ELパネルの採用が軽量化につながったのか、Pixel 6との重量差は少ない。



 モバイル通信はnanoSIM+eSIMのデュアルSIMに対応しており、5Gと4G LTEでの同時待ち受け(DSDV)も可能だ。



 Pixel 6シリーズは5G通信をサポートしているが、iPhone 12/13シリーズと同様に対応確認が取れたキャリアでのみ、5G通信が有効になる仕組み(ホワイトリスト方式)となっている。11月1日現在、日本において5G通信を利用できるのはau 5GネットワークとSoftBank 5Gネットワークのみとされており、他社(NTTドコモと楽天モバイル)の5GプランのnanoSIM/eSIMを入れても5G通信はできない。他社の5Gネットワークには後日行われるソフトウェア更新によって対応するが、時期は明示されていない。



 日本ではスマートフォンの防水に高いニーズがあるとされているが、Pixel 6シリーズはIPX8等級の防水性能と、IP6X等級の防塵(じん)性能を備えている。水にぬれても安心だ。日本版モデルはおサイフケータイにも対応している。



 充電は30Wの急速充電をサポートし、Qi規格のワイヤレス充電も利用できる。



●Pixel 6 Proのここが気になる



 Pixel 6 Proを含むPixel 6シリーズには、現時点において「このスマホでしかできない」という機能が複数ある。興味深いスマホであることは確かなのだが、Pixel 6 Proを使っていてどうしても気になるポイントが大きく3つあった。「指紋センサー」「電池持ち」「ストレージ」である。



指紋センサー



 Pixel 6シリーズでは、ディスプレイ内に光学式の指紋センサーを備えている。指をセンサー周辺に当てると強い光が発せられ、それを使って指紋を読み取るという仕組みだ。



 この指紋センサーはロック解除に失敗することが多い。センサーの認識ゾーンが狭いのか、指も当て方によって全然認証が通らないのだ。使っていて一番気になった、言葉を選ばなければ一番使いづらかったポイントである。



電池持ち



 Pixel 6 Proのバッテリー容量は5000mAhと大きめだ。大容量だから電池も長持ち……と言いたい所なのだが、他のスマホと比べてもバッテリーの消費がとても速く感じられる。



 100%の充電状態から1日4~5時間程度使うと仮定すると、満充電から良くて1日半持たせるのが精一杯だった。端末ソフトウェアのブラッシュアップでどこまで改善するのか、これも様子見をしたい所である。



 なお、SNSなどでは発表後、展示機を体験したユーザーの感想で「発熱する」という指摘が散見されたが、実際に使ってみると手で持てなくなるほど発熱することはなかった。ただし、クラウドへ写真をアップロードしたときなど、大量のデータ送信が発生したタイミングで、背面下部、特に左手に当たる部分がほんのりと熱を持つと感じることはあった。手に当たる位置に熱源があるため、発熱しているという印象を強めているのだろう。



 字幕表示からの翻訳機能やカメラ機能では、TPUを活用することで消費電力を抑制しつつ高速なAI処理を行えるようになった。しかし、現時点では電力消費が大きくなりがちなようだ。筆者が試した範囲では、モバイル通信で5Gの境界域にいることが多かったため、そのせいでバッテリーの消費が増えてしまった可能性がありそうだ。



ストレージ



 少し細かいことかもしれないが、Pixel 6シリーズではmicroSDに対応しないことがやはり不安要素である。



 「内蔵ストレージの容量を選べるんだから大きい方(256GBモデル)を買えばいいのでは?」と思うかもしれない。しかし、Pixel 6シリーズではストレージの容量によって選べるボディーカラーが変わってしまうのだ。



 Pixel 6 Proの場合、Google直販の「Google Store」では3色を取りそろえている。しかし、色を選んでみると分かるのだが、「Stormy Black(嵐のようなブラック)」を選ばないと256GBストレージの選択肢が出てこない。要するに、「Cloudy White(雲のような白)」や「Sorta Sunny(幾らかの晴れ)」を選ぶには128GBストレージに“甘んじる”しかない状況なのだ。



 Googleとしては「なるべく端末内にデータを置かずに、どんどんクラウドにアップロードすればいいじゃないか」という考え方なのかもしれないし、それも理解できなくもないのだが、特に≪サイズがどうしても大きくなる4K動画を撮影する人にとっては、ローカルストレージの容量は多い方がよい。「容量を犠牲にしてカラーを優先する」のか、「カラーを犠牲にして容量を取る」のか、選択を迫られることは選ぶ側の立場としてはありがたくない。



●「革命的なAI体験」を楽しめるスマホ



 Pixel 6シリーズが搭載するTensorチップは「Google独自」とはいえ、CPU/GPU部分はArmからライセンスを受けた設計図をベースに作られている。確かにハイエンドクラスの性能はあるのだが、“独自性”をどこまで発揮できるかは疑問に思っていた読者も多いことだろう。実のところ、筆者もPixel 6 Proを手にするまでそう思っていた1人だ。



 しかし、テキスト文字起こしや翻訳の実用的なレスポンスやその精度、さらに幅広いシーンに対応できるカメラの実力を知って、その考えは改めざるを得なかった。



 米Vergeのインタビューの中で、GoogleはTensorチップの設計に4年をかけたことを明らかにしている。Pixelスマホの初代モデルは2016年10月の発売であるため、シリーズ展開初期の段階から独自チップの必要性に気付いていたということだ。



 その後5世代を経て日の目を見えたPixel 6シリーズは、まさに「Googleが本当に作りたかったスマートフォン」といえる仕上がりだ。


0 コメント:

コメントを投稿