Google CloudのVertex AI Studio チャット機能についてメモ書き。
AIチャットはスマートフォンの音声アシストであったり、WEBサイトのカスタマーサービスであったり今やさまざまな場所で提供されている。
Vertex AI Studioチャットとは、Google Cloudが提供しているAIチャットサービスの事。
基本的な機能は「Vertex AI Studio自由形式」と同じなので、用語やパラメータ等については以下の記事を参照して欲しい。
Vertex AI Studioチャットはマルチターンチャットに対応している。従来のチャットボットは1回の質問に対して1つの回答を返すのに対して、マルチターンチャットではAIとの対話(ターン)を重ねる事でより深い議論や複雑なタスクを遂行できるようになる。
それでは試してみる。以下の表画像をアップロードし、JSON形式に変換する。

画像のアップロードは緑の枠線で囲んだ「メディアの挿入」から行う。

マルチモーダルなので、画像と共にテキストで指示を出す。
表をJSON形式に変換する。

この結果をもとに次の指示として「columnとtype」を大文字にしてもらう。

チャットを使って簡単なブレーンストーミングを行なってみる。
新商品のアイディアとして「20代男性向けの新しい美容家電のアイディアを3つ提案して下さい。」と指示。

アイディア1の販売戦略を考えてもらう。

これがマルチターンチャットのメリット。AIと対話を重ねることで議論を深める事ができる。
プロンプトに「Multimodal Liveを試す」というボタンがあるのでクリックしてみる。
Multimodal Liveはリアルタイムでマルチモーダルな情報処理を可能にする技術。


リアルタイム入力なので、カメラやマイクが有効になっているが、現時点(2025/3/19)で右側の「コードを取得」や構成はグレーアウトされている。
「Multimodal Liveを開始」をクリックしてみる。

「コードを取得」等がグレーアウトのままなので、API接続等はこれからなのかもしれない。
コメント