AIの音声対話、人間並みに=年内投入、オープンAIに対抗―米グーグル 2024年05月15日 06時19分

米グーグルが開発者会議で発表した人間並みの音声対話ができる人工知能(AI)を開発する「プロジェクト・アストラ」=14日、米カリフォルニア州マウンテンビュー
米グーグルが開発者会議で発表した人間並みの音声対話ができる人工知能(AI)を開発する「プロジェクト・アストラ」=14日、米カリフォルニア州マウンテンビュー

 【シリコンバレー時事】米グーグルは14日、米カリフォルニア州で開発者会議を開き、生成AI(人工知能)の音声対話能力を人間並みに引き上げる「プロジェクト・アストラ」を発表した。質問への応答を速め、音声や動画を交えた状況認識能力も向上した「AIアシスタント」を作る。年後半から一部機能を段階的に投入する。
 「チャットGPT」を手掛ける米オープンAIも13日、音声対話の速度を人間と同等にした新モデルを発表した。質問から応答までの時間を短縮し、使いやすさを高める競争が本格化している。
 グーグルは生成AIの基盤モデル「ジェミニ」に軽量版「1.5フラッシュ」を加え、開発者向けに試験公開した。汎用(はんよう)モデルの「1.5プロ」から重要な知識を移し、回答精度と効率性を両立させた。1.5プロは消費者向けの有料サービス「ジェミニ・アドバンスト」で提供を開始。日本語など35言語で使える。
 アストラの技術を使い、スマートフォンのカメラで写した映像を認識し、質問に回答する機能「ジェミニ・ライブ」も発表した。数カ月以内にアドバンストで提供を始める。デモ動画では、オフィス内を撮影しながらジェミニに眼鏡の場所を尋ねると「デスクの上でリンゴの近く」と音声で答えた。
 AI研究・開発部門グーグル・ディープマインドのハサビス最高経営責任者(CEO)は「文脈をより理解し、迅速に応答することでより自然な対話ができる」と述べた。 

海外経済ニュース