(以下は、Tech CrunchのGoogle I/O2023に関する記事を翻訳編集したものであり、元の記事・内容について当社が独自に制作・発信しているものではございません。)
先週の開発者会議Google I/O 2023にて発表された、新製品や新機能を以下にまとめてご紹介します。
Google Maps
Google Mapsは、一部の都市で新機能「ルートのイマーシブビュー(イメージングビュー)」を発表した。この新機能は、交通シミュレーション、自転車レーン、複雑な交差点、駐車場などの詳細を含む、ユーザーが必要とするすべての情報を1か所に集約したもの。
マジックエディターとマジックコンポーズ
マジックエディター:
写真の特定の部分、例えば前景や背景など、より複雑な編集を行うためにAIを搭載、写真の隙間を埋めたり、より良いフレームで撮れるように被写体の位置を変えたりといった複雑な編集を簡単に行えるようになる。
マジックコンポーズ:
“ポジティブに”、“プロフェッショナルに”、“面白く”、など、テキストメッセージをさまざまなスタイルにカスタマイズできるようになる。“シェイクスピア風”に書き換えることもできるとのこと。
PaLM2
PaLM 2は、Googleの最新大規模言語モデル(LLM)である。
- Chat GPTに対抗、アップデート版Bardチャットツールに搭載され、同社が本日発表した新しいAI機能全般の基礎モデルとして機能するとのこと。
- 多言語、推論、およびコーディング機能が向上した最先端の言語モデル。デバッグのサポートも改善されている。
- Googleの最新のJAXおよびTPU v4インフラの上に構築され、JavaScriptやPythonといったよく使われるプログラミング言語だけでなく、Prolog、Verilog、Fortranなどを含む20などの言語でコードの生成が可能。コードの記述やデバッグのサポートが改善されたことも特徴で、現在、GoogleのPaLM API、Firebase、およびColab上で開発者に提供されている。
- PaLM 2は常識的な推論、数学、論理に優れており、数学のパズルを簡単に解き、問題を推論し、図を提供することもできるとのこと。
Bardがより賢く
Bardのウェイティングリストが終了、180以上の国と地域で利用可能となった。米語に加えて日本語と韓国語のサポートも開始し、近い将来上位40言語までサポートを拡大する予定。また、Bardのレスポンスに画像を表示する機能も新たに追加されている
関連記事はこちら↓
Googleワークスペース
WorkspaceスイートもAIタッチでよりスマートになり、Sheetでは表の自動生成(数式は不可)、SlideとMeetでは画像の作成が追加された。
更にSlideとMeetでは、どのようなビジュアルを求めるかを入力すると、AIがその画像を作成するという新機能が追加されている。
ミュージックLM
MusicLMは、テキストを音楽に変える、Googleの新しい実験的なAIツール。例えばパーティを開催する際、「ソウルフルなジャズパーティーに」と入力するだけで、その曲のいくつかのバージョンを作ってくれる。
検索
検索結果でユーザーが目にする画像のコンテンツと文脈の理解を深めるための新機能を二つ展開する。
- “この画像について”機能による情報提供で、情報の信頼性を高める。
- 画像に“AIにて生成”というラベルを付けることで、透明性を高める。
更に、一部の検索結果の上部に表示される新しい「パースペクティブ」フィルタの導入も近々予定。これにより、掲示板Q&Aサイト、ソーシャルメディアへの投稿(動画付きも含む)、RedditのリンクやYouTubeの動画などの発見が容易となる。
Sidekick
SidekickはGoogle Docsのサイドパネルに常駐、入力中に文脈全体を読みこみ、執筆者に表現などの提案を常に行っていく。
Codey
Googleの新しいコード補完・コード生成ツール。
今回発表されたAI中心のコーディングツールのひとつであり、コーディング質問用チャットツールGitHubのCopilotに競合する。Codeyは、特にコーディング関連のプロンプトを処理するように訓練されており、Google Cloud全般に関するクエリも処理できる。
Google Cloud
新しいA3スーパーコンピュータ仮想マシンが登場。
NvidiaのH100 GPUを搭載、専用データセンターと組み合わせることで、高い処理能力と低いレイテンシーを備えた膨大な計算能力を、比較的安価な価格帯で実現した。
Vertex
フルマネージドAIサービスであるVertex AIに向けた新しいAIモデルも発表。その中にはImagenと呼ばれるText-to-image(テキストから画像へ)変換モデルも含まれている。
画像の生成や編集はもちろん、既存の画像にキャプションを書き込むことも可能。
Find My Device
AppleとGoogleがBluetoothトラッカーの安全対策と新仕様で提携したことを受け、Googleは独自のFind My Deviceネットワークに一連の改善を導入した。
AppleのAirTagなどのサポートで一緒に移動する未知の追跡者についての予防的な警告も提供されるようになる。
プロジェクト・テイルウィンド
Googleが開発中のAIを搭載したノートブックツールで、ユーザーの自由形式のメモを自動的に整理し、要約することを目的としている。Labsを通じて利用できる。
生成AI壁紙
GoogleのText-to-imageの拡散モデルを使用し、新しいオリジナルの壁紙を生成できる。システムのカラーパレットも自動的に壁紙の色調に統一される。
Androidに近秋登場予定。
翻訳機「ユニバーサル・トランスレータ」
動画で音声を翻訳し、話したことのない言語をリップシンクさせるという、強力な新しい翻訳サービス「ユニバーサル・トランスレータ」をテスト中。
- 入力されたビデオをキャプチャ
- 音声を書き起こす
- 翻訳する
- 翻訳された言語で(スタイルとトーンを合わせて)音声を再生
- 話者の唇が新しい音声により近くなるようにビデオを編集
出所 :Tech Crunch / Google I/O 2023 is a wrap — here’s a list of everything announced