忍者ブログ

高品質バッテリー

Jpdenchi.comはお客様に様々な高品質バッテリーを提供するオンラインショップです

Google Whisk:画像の「本質」を捉えるAIツール

Googleは、Google Labsで新しい実験的AI画像生成ツールWhiskを発表しました。従来のツールが画像の複製や編集を行うのに対し、Whiskは元の画像の「本質」を捉え、それをクリエイティブに再構築します。そのため、Whiskは正確な編集ではなく、アイデアのブレインストーミングや素早いビジュアル化に最適です。

Whiskの仕組み

Google Whiskは、以下の2つの主要ステップで動作します。

1. Geminiモデルによる分析

画像をアップロードすると、Gemini言語モデルがそれを分析し、詳細な説明または「キャプション」を生成します。

2. Imagen 3による生成

Geminiが生成した説明文をGoogleのImagen 3に渡し、そのテキストを基に新しい画像を生成します。ここで生成される画像は、元の画像のピクセルではなく、テキストによる説明を元に作成されます。

このプロセスにより、Whiskは元画像に触発されながらも、創造的な柔軟性を加えた新しいビジュアルを作り出します。

Whiskの主な機能

スターターモード
シンプルなモードでは、ユーザーはテーマと3つの事前定義スタイルのいずれかを選択します:

  • ステッカー
  • エナメルピン
  • ぬいぐるみ

アドバンストエディター
詳細な入力が可能なモードで、以下を指定できます:

  • テーマ(Subject)
  • シーン(Scene)
  • スタイル(Style)
  • 仕上げ用の追加テキスト

ただし、Googleは出力画像が入力画像と異なる場合があると認識しています。例えば、生成された被写体は高さや体重、髪型、肌の色が異なることがあります。

Whiskが「編集ツール」ではない理由

従来の正確な画像編集ツールとは異なり、Whiskは粗くて想像力に富んだアイデア生成に焦点を当てています。細部を正確に複製するためのものではなく、次の用途に最適です:

  • クリエイティブなコンセプトのブレインストーミング
  • デザインの迅速なビジュアル化
  • 代替ビジュアルのアイデア探索

利用可能地域

現在、Whiskはアメリカ国内限定で、Google Labsを通じてアクセス可能です。

>>>JPdenchi.comでは、ビジネスやプロフェッショナルのニーズに最適なバッテリーを入手できます。バッテリーに関するあらゆるニーズについては、今すぐお問い合わせください。

PR

コメント

プロフィール

HN:
Vladimir
性別:
非公開

カテゴリー

P R