デジ未来
AI (エーアイ)
OpenAIの新画像生成モデル：実用性を重視したAI進化

OpenAIの新画像生成モデル：実用性を重視したAI進化

X (Twitter) Facebook Pinterest LinkedIn Email

OpenAIはChatGPT Images 2.0を発表した。このモデルは魅力的な画像生成を超え、マーケティングやストーリーボードに使える実用的な画像を提供する。画像を言語として扱い、指示遵守を強化した。

画像生成の課題は何だったか？

これまでの画像生成AIは視覚的に魅力的だった。しかし、作業に使える画像が不足していた。猫の宇宙飛行士のような楽しい画像と、マーケティングポスターは別物だ。

OpenAIの解決策とは？

OpenAIはSam Altman主導で新モデルを開発した。画像を装飾ではなく言語と位置づける。ChatGPTでの画像依頼を、創造的な試行錯誤から実用的な発注へ変える。

主な改善点は？

モデルは3つの弱点を強化した。複雑な指示の正確遵守、画像内要素の整理、テキストの忠実再現だ。曖昧さを減らし、制御性を高める。

「考える」機能はどう働くか？

初の推論機能搭載モデルだ。ChatGPTの「thinking」モードで時間をかけ、タスクを構造化する。ウェブ情報を活用し、結果を自己検証する。

例：マドリードのGran VíaとCines Callaoの画像、5月のスペイン活動メモを生成した。

実際のテスト結果は？

スペイン3都市のテレワーク比較：バレンシア、マラガ、ビルバオ。列にアイコン、気候、生活費などを配置。
バルセロナGràciaの雨の朝ストーリーボード：6コマで主人公の連続性を示す。

Genera una comparativa visual entre tres ciudades españolas para teletrabajar: Valencia, Málaga y Bilbao. Divide la imagen en tres columnas, con iconos, clima, coste de vida orientativo, ambiente, conexión internacional y calidad de vida.

Crea un storyboard de seis viñetas sobre una mañana de lluvia en Gràcia, Barcelona. Debe mostrar continuidad del mismo protagonista, un vecino del barrio que sale de casa, entra en una cafetería, mira el ambiente por la ventana, recibe una llamada importante y sale con prisa.