Bing Image Creatorとは、Microsoft Bing searchが提供する画像生成AIのサービスです。Bing Image Creatorは、文字や音声などの入力に基づいて画像を生成することができます。Bing Image Creatorは、Web上などに存在する画像と文章の組み合わせを大量に学習しており、与えられた文章の意味を解釈したうえで、その意味に適合する画像を生成できます。
Bing Image Creatorは、非常に自由度が高く、様々な種類の画像を生成できます。例えば、「本を読む犬」や「油絵風のバナナ」などという文章を入力すると、それに応じたイラストや写真を生成してくれます。しかし、特に人間の画像に関しては、Bing Image Creatorは他の画像生成AIよりも優れています。Bing Image Creatorは、人間の顔や体や服装などの特徴を正確に捉えており、リアルで自然な人間の画像を生成できます。
この記事では、Bing Image Creatorで人間の画像を生成する方法とその魅力について、以下の点について解説します。
- 人間の画像を生成するプロンプトの作り方
- プロンプトの活用例
- 人間の画像生成の応用可能性
人間の画像を生成するプロンプトの作り方
Bing Image Creatorで人間の画像を生成するには、プロンプト(入力する文章)に工夫が必要です。プロンプトは、Bing Image Creatorに対してヒントや指示を与える役割を果たします。プロンプトが適切であれば、Bing Image Creatorはより精度の高い人間の画像を生成できます。逆に、プロンプトが不適切であれば、Bing Image Creatorは意図しない人間の画像や品質の低い人間の画像を生成してしまう可能性があります。
では、どうすれば適切なプロンプトを作ることができるでしょうか?ここでは、以下の2つのコツを紹介します。
- 人物の特徴や属性を明確に表現する
- 人物の表情やポーズや背景などを細かく指定する
人物の特徴や属性を明確に表現する
人物の特徴や属性を明確に表現するとは、学習データの中にある「●●は■■だ」という関係性を的確に表現する言葉のことです。例えば、「女性」という言葉は、「女性」だけでは曖昧ですが、「金髪の女性」や「日本人女性」などという具体的な特徴や属性と組み合わせることで、ベクトルの方向が強くなります。このように、プロンプトには、Bing Image Creatorが学習データから共通部分をあわせることで共通しない部分を消すことができるような言葉を選ぶことが重要です。
また、Bing Image Creatorには、特定の人物や作品の名前など、強い特徴を持つ言葉に対しても高い反応を示す傾向があります。例えば、「ビヨンセ」という言葉は、「ビヨンセの顔」や「ビヨンセ風の服装」という関係性を学習データから抽出できるため、プロンプトに含めることで、ビヨンセに似た人物の画像を生成することができます。このように、プロンプトには、Bing Image Creatorが学習データから強い印象を受けるような言葉を含めることも有効です。
人物の表情やポーズや背景などを細かく指定する
人物の表情やポーズや背景などを細かく指定するとは、学習データの中にある「●●は■■する」という動作や状態を的確に表現する言葉のことです。例えば、「笑顔」という言葉は、「笑顔」だけでは曖昧ですが、「幸せそうな笑顔」や「笑顔で手を振る」などという具体的な表情やポーズと組み合わせることで、ベクトルの方向が強くなります。このように、プロンプトには、Bing Image Creatorが学習データから共通部分をあわせることで共通しない部分を消すことができるような言葉を選ぶことが重要です。
また、Bing Image Creatorには、特定の場所やシチュエーションなど、強い雰囲気を持つ言葉に対しても高い反応を示す傾向があります。例えば、「海辺」という言葉は、「海辺の風景」や「海辺で遊ぶ人々」という関係性を学習データから抽出できるため、プロンプトに含めることで、海辺の雰囲気のある人物の画像を生成することができます。このように、プロンプトには、Bing Image Creatorが学習データから強い印象を受けるような言葉を含めることも有効です。
プロンプトの活用例
ここまで説明したコツをもとに、実際にBing Image Creatorで人間の画像を生成するプロンプトを作成してみましょう。以下のようなプロンプトを入力します。
a portrait of a young woman with long blonde hair and blue eyes smiling happily in Hayao Miyazaki anime style
このプロンプトでは、「人物写真表現」「若い女性」「長い金髪」「青い目」「幸せそうな笑顔」「宮崎駿風」という言葉を使って人物の特徴や属性、表情やポーズや背景などを明確に表現することで、Bing Image Creatorに対してヒントや指示を与えることができます。画像生成の結果は以下のようになりました。

この画像は、プロンプトに忠実に若い女性の顔と金髪と青い目と笑顔を描いています。宮崎駿風のスタイルとしては、少し無理がある描き方ですが、人間の画像としてはリアルで自然に見えます。これは、Bing Image Creatorが人間の特徴を正確に捉えており、高品質な画像を生成できるためです。
日本語でプロンプトを打つ場合
Bing Image Creatorは、英語だけでなく、日本語などの他の言語でも画像を生成することができます。日本語でプロンプトを打つ場合は、英語と同様に、人物の特徴や属性、表情やポーズや背景などを明確に表現することが重要です。また、日本語には漢字やひらがなやカタカナなどの文字種がありますが、Bing Image Creatorはこれらの文字種にも対応しています。ただし、漢字は意味が多様であったり、同じ漢字でも読み方が異なる場合があるため、曖昧さを避けるためにふりがなを付けることも有効です。
以下のようなプロンプトを入力します。
スーツとネクタイを着た短髪(たんぱつ)の男性(だんせい)の全身(ぜんしん)写真(しゃしん)
このプロンプトでは、「スーツとネクタイ」「短髪」「男性」「全身」「写真」という言葉を使っています。また、「短髪」「男性」「全身」「写真」にはふりがなを付けています。画像生成の結果は以下のようになりました。

コメント