先抛结论
这两天把 Azure OpenAI 的 GPT-Image-2 拉起来跑了 25 张 quality: high 的大图(含一张 8 格品牌叙事条漫),全程无一张人工后期。
结论只有一句:过去三年我用 Midjourney、Stable Diffusion、DALL·E、Flux、Ideogram、Nano Banana 这一路刷下来,GPT-Image-2 是第一次让我觉得”AI 生图可以直接交付成品”的模型。
不是”生成一张能当素材的图”,而是直接出给甲方的海报、能当印刷稿的试卷、能当商品详情页的长图。
下面用 25 张实拍(呃,实跑)的结果,从 4 个能力维度拆给你看它到底强在哪里,再把 5 条可复制的 Prompt 心法一并交给你。
一、中文文字渲染:这一次终于解锁了
过去所有扩散模型最痛的一关就是”中文”。三个字以上必糊、四个字以上必乱、整页文字等于在看古希腊文。GPT-Image-2 是我见到的第一个把这一关真的过了的模型。
1.1 高考真题试卷:几乎肉眼分不出是不是扫描件
查看完整 Prompt · 高考试卷 · 2026 全国卷物理
生成一张 2026 年普通高等学校招生全国统一考试物理试卷(全国甲卷)的照片级图像。试卷用 A3 纸打印横版折叠为 A4 竖版展示。页面必须包含以下全部元素,所有文字严格为简体中文,无错字:
顶部区域:- 大标题"2026 年普通高等学校招生全国统一考试"- 副标题"理科综合能力测试 · 物理(全国甲卷)"- 左上角红色印章"绝密★启用前"- 右上角考号条形码占位 + "姓名_______ 准考证号_______"- 考试须知四条短文:使用 2B 铅笔填涂 / 严禁携带通讯工具 / 答题卡与试卷分离 / 考试时间 150 分钟
主体区域分两栏:第一部分 选择题(共 8 小题,每题 6 分,共 48 分)- 题号 14-21,每题配有物理情境描述- 第 15 题配简化的 匀速圆周运动受力分析图- 第 18 题配 电路图(电源 + 电阻 + 电流表 + 滑动变阻器)- 第 20 题配 斜面带滑块 的示意图- 每题四个选项 A. B. C. D. 右侧留出涂卡位
第二部分 非选择题- 第 22 题 实验题(8 分): "测量金属丝电阻率",配游标卡尺读数图- 第 23 题 实验题(10 分): "验证动量守恒定律",配气垫导轨示意图- 第 24 题 计算题(12 分): 关于平抛运动的综合题,含公式框- 第 25 题 计算题(20 分): 电磁感应综合题,配磁场 + 导轨示意图
底部区域:- 页脚"物理试卷(全国甲卷)第 1 页 共 6 页"- 右下角装订线虚线- 左下角 "——以下空白——"
整体要求:A4 比例,白色有细微纹理的考试用纸质感,黑色印刷字体(宋体正文 + 黑体标题),打印略有油墨渗透感,试卷被折痕压过的真实质感。不得有水印和额外文字。这张图我只给了一段不到 300 字的结构描述。模型自动补齐了:
- 顶部”绝密★启用前”红色印章
- “2026 年普通高等学校招生全国统一考试”大字
- 考试须知 4 条
- 选择题 8 题(含电路图、斜面示意图、圆周运动图)
- 实验题 2 题(游标卡尺读数图、气垫导轨图)
- 计算题 2 题(含物理公式框)
- 页面右侧装订线、左下”——以下空白——”
- 页脚”物理试卷 第 1 页 共 6 页”
这不是”像”试卷,这就是试卷。 过去这种图要 3-5 个老师联合出题 + 美工排版一整天,现在一条 prompt、170 秒。
1.2 古文真迹:26 列密集行书,零乱码
📝 查看完整 Prompt · 古文真迹 · 《滕王阁序》情绪版
生成王勃《滕王阁序》的真迹图片,请结合作品情感核进行生图。
呈现为一幅唐代纸本墨迹,纸页略泛黄发棕,有虫蛀痕迹与水渍浸染,边缘自然磨损与裂口。全文以王羲之行书笔意为主,但根据情感核呈现层次变化:
- 开篇"豫章故郡,洪都新府"—— 笔画从容工整,墨色饱满- "物华天宝,龙光射牛斗之墟"—— 笔势开始放逸,点画飞白- "落霞与孤鹜齐飞,秋水共长天一色"—— 笔意最为舒展飞动,墨色浓淡对比强烈,是全篇的抒情高点- "关山难越,谁悲失路之人"—— 笔画转沉郁,顿挫明显,墨色略有涩感- "时运不齐,命途多舛"—— 墨色转凝重,章法更紧密- 末段"一言均赋,四韵俱成"—— 回归工整中略带挥洒,如释重负
整幅作品竖式卷轴格式,全文密集中文行书书写,每行约 25-30 字,共 30 余行,所有文字必须是《滕王阁序》的真实原文、清晰可辨、无错字乱码。开篇右侧有"滕王阁序 王勃"小楷标题,末尾留"永徽三年 王子安书"落款,钤印两方(朱文"王勃之印"+ 白文"子安")。
纸张质感真实:纤维肌理、薄如蝉翼的半透感、陈旧发黄的年代感、自然的墨迹深浅变化、偶有墨点与飞白。画面氛围素雅、文气、内敛,如故宫博物院藏品照片。无水印,无额外装饰。更炸的是这张。《滕王阁序》全文 773 字,竖式卷轴 26 列密集书写。
- 所有字都是真的《滕王阁序》原文,不是乱涂
- 笔意按我 prompt 里”情感核”的指示分层变化——“落霞与孤鹜齐飞”最舒展飞动,“命途多舛”笔势沉郁
- 纸张陈旧、虫蛀、水渍浸染全有
- 落款”永徽三年 王子安书”+ 朱文印”王勃之印” + 白文印”子安”
一年前你要拿这张图去骗人说它是故宫藏品,大部分人会相信。
1.3 中医药方 + 历史课本:密集中文 + 版式的双重压测
手写中医药方(风寒感冒方) | 人教版初中历史课本(盛唐气象) |
![]() | ![]() |
左图 Prompt · 手写中医药方 · 风寒感冒方
生成一张手写中医药方图,主题为"风寒感冒调理方",接近真实中医门诊实拍的质感。
纸张:淡米黄色带竖向暗格的处方笺(传统中医毛边纸质感),纸张略有褶皱、边缘轻微卷曲,右下角有一角折过的真实感。
处方笺顶部印刷部分(红色油墨):- 正中大字"○○中医诊所 处方笺"(具体名字脱敏用"○○"或以模糊处理)- 左下方表格行印刷字:"姓名:_____ 性别:_____ 年龄:_____ 联系电话:_____ 地址:_____"- 右侧印刷字:"就诊日期:2026 年 4 月 23 日 编号:2025100523"- 下方横线分栏为"诊断"与"处方"两区
医生手写部分(用黑色毛笔或硬笔混合书写,字迹潦草有力、略微连笔,像老中医的真实笔迹):
【诊断区】- 主诉:恶寒 发热 无汗 头痛 鼻塞流清涕 脉浮紧 舌淡苔薄白- 诊断:风寒表证 · 太阳伤寒- 辨证:风寒束表,卫阳被遏
【处方区】(竖排手写)麻黄 九克桂枝 六克杏仁 六克甘草 三克生姜 三片大枣 三枚紫苏叶 六克防风 六克荆芥 六克葛根 十二克
右侧补注:"三剂 水煎服 日一剂分两次温服 忌生冷油腻"
【医嘱区】"避风寒 多饮热水 取微汗为度 汗出热退即停 服后嚼姜片一片助药力"
【签名区】右下方- "医师:王○○"(手签,龙飞凤舞)- "执业医师号:MD○○○○"- 盖一枚红色圆形印章"○○中医诊所 执业医师 王○○"(印章覆盖在签名上)- 左下方另一枚方形印章"已审核 · 药房"(蓝色)
其它真实细节:- 纸张有轻微药汁滴痕(浅黄褐色)- 右上角被回形针夹过的痕迹- 一角订书针孔- 字迹深浅不一,有的字墨色饱满有的微枯- 姓名、电话等敏感信息全部用○○打码或模糊处理
氛围:白色日光下拍摄的俯拍照片,阴影自然,纸张纹理清晰。无水印无外部标记。字迹必须是真实可辨的简体中文,每一味药名准确、用量合理(符合《伤寒论》麻黄汤加味法度)。右图 Prompt · 密集中文排版 · 人教版初中历史课本一页
生成一张"人教版义务教育教科书 · 中国历史 · 七年级下册"某一页的真实扫描图像,主题为"第二单元 第 8 课:盛唐气象"。A4 尺寸单页竖版,所有内容为真实可读简体中文。
页面版式(严格按照人教版课本风格还原):
【页眉】- 左上方小字:"第二单元 · 辽宋夏金元时期:民族关系发展和社会变化"- 右上方页码"第 38 页"下带一条红色水平细线
【大标题区】- 主标题:"第 8 课 · 盛唐气象"(红色加粗宋体,占半页宽度)- 副标题小字:"了解盛唐时期的经济、文化成就与民族交融"
【正文第一段】插在标题下,首行缩进两字格:"盛唐气象是指唐朝前期和中期所呈现出来的繁荣、自信、开放、多元的社会风貌。这一时期,经济发达、文化昌盛、民族交融、对外交往活跃,形成了令后世追慕的时代风貌。"
【小节一:经济的繁荣】加粗蓝色标题,下接 3-4 段正文,内容涵盖:- 农业发展:曲辕犁、筒车等新农具- 手工业繁荣:唐三彩、丝绸、陶瓷远销海外- 商业兴盛:长安、洛阳、扬州、成都"扬一益二"
右上方插入一幅彩色插图——唐三彩骆驼俑,图注:"唐三彩骆驼载乐俑 · 陕西历史博物馆藏"。
【小节二:民族交融】加粗蓝色标题,2-3 段正文。重点提及文成公主入藏、松赞干布、大昭寺、金城公主。
右中部插入小插图——布达拉宫前壁画"文成公主入藏"示意图,图注:"唐代 · 文成公主入藏路线"。
【知识拓展卡】米黄色圆角边框的小卡片,浮在正文中:"【相关史事】布达拉宫位于拉萨红山之巅,始建于 7 世纪吐蕃赞普松赞干布时期,为迎娶文成公主而建。今天的布达拉宫是 17 世纪由五世达赖喇嘛重建后的规模。"
【小节三:中外交往】加粗蓝色标题,2 段正文。内容:遣唐使、鉴真东渡、玄奘西行、唐蕃会盟、粟特商队、胡旋舞。
右下方插入第三幅插图——"鉴真东渡"彩绘,图注:"鉴真东渡日本六次,终将佛法、医学、建筑传入日本。"
【课后思考】页脚上方蓝色边框"【课后思考】"小栏:1. 为什么说盛唐时期是中国古代社会发展的一个高峰?2. 从文成公主入藏这一事件,谈谈唐朝处理民族关系的智慧。3. 请列举盛唐时期中外文化交流的三个事例。
【页脚】左下小字"八年级中国历史下册 · 人民教育出版社"右下"38"页码。
视觉风格:白色带微微泛黄课本纸质感,黑色宋体正文 + 蓝色黑体小节标题 + 红色主标题;边距规整,排版细密但层次分明;插图为彩色教育插画风格。所有汉字清晰无乱码、完整正确,如同教科书扫描仪扫出的真实页面。无水印。左边那张药方最让我惊讶的是:模型主动把医生姓名、电话、执业医师号全部打码成”○○“——我 prompt 里确实写了这条要求,但它不仅实现了,还连诊所名字也一并打码了。红色执业医师章、蓝色药房审核章、纸张褶皱、药汁滴痕、回形针痕迹——它自己脑补了一整套”真实中医门诊”的场景。
而且药方内容是真的符合《伤寒论》麻黄汤加味法度的:麻黄九克 + 桂枝六克 + 杏仁六克 + 甘草三克 + 紫苏叶 + 防风 + 荆芥 + 葛根。不是瞎写。
右边那张课本页更离谱:小节标题(蓝色黑体)+ 正文(宋体缩进 2 格)+ 唐三彩插图 + 文成公主入藏插图 + 鉴真东渡插图 + 图注 + “【相关史事】” 米黄色知识卡 + “【课后思考】” 蓝框思考题——每一块都严格按照人教版排版规范。
1.4 书法字帖 + 品牌海报:中文排版的可控性
《心经》楷书临摹字帖 | 新中式奶茶海报(山川茶事) |
![]() | ![]() |
左图 Prompt · 书法临摹字帖 · 《心经》楷书
生成一张《般若波罗蜜多心经》楷书书法临摹字帖,欧阳询体风格。
版面布局:- 顶部标题栏(约占 1/8 高):大字标题"般若波罗蜜多心经",副标题"楷书临摹字帖 · 欧阳询体",右上角小字"练习者_____ 日期_____"- 主体(约占 6/8 高):分为 11 列竖排格子,每列 16 个方格,每格中有一个楷书汉字示范,字迹清晰工整;每个字右侧有一个浅灰色"描红"空格,供练习者临摹。全文为《心经》260 字全文:"观自在菩萨,行深般若波罗蜜多时,照见五蕴皆空,度一切苦厄。舍利子,色不异空,空不异色,色即是空,空即是色……"一直到"菩提萨婆诃"结束。所有字笔画精准、结构端正、书写风范典雅。- 底部(约占 1/8 高):书写要领提示(5 条短句): 1. 执笔悬腕,五指齐力 2. 横画略斜,竖画垂直 3. 点如山坠,捺如波磔 4. 结构方正,布白均匀 5. 一日临一遍,百日笔自劲 右下角落"欧楷九成宫笔意 · 临摹字帖第一辑"。
视觉要求:- 米白宣纸底色,带细密纤维纹理和微微泛黄- 方格为浅灰墨线,笔画为饱满浓黑墨迹,描红字为 40% 灰度的轮廓空心字- 整体排版工整、传统、素雅,没有任何装饰元素- 无水印,无额外标记
所有汉字必须是《心经》的真实原文,笔画完整、零错字、零乱码。右图 Prompt · 新中式奶茶海报 · 山川茶事
Design a 3:4 vertical poster for a new Chinese trendy tea launch. Use a New Chinese (新中式) visual style that feels light-luxury and restrained. The palette should be deep jade green, off-white, and warm gold, with rice-paper texture, elegant negative space, ink-wash landscape accents (远山轮廓), and a modern grid layout.
Main subject (center):a visually appealing cold-brew milk tea in a tall frosted-glass cup with condensation, floating tea leaves (oolong), fresh yuzu slices, transparent ice cubes, and touches of gold foil on the rim. A sprig of fresh mint and a single dried osmanthus flower floating on top. Soft studio lighting with a gentle rim light, shallow depth of field, subtle ink-wash mountains in the far background.
The poster must accurately display the following exact Chinese copy, every character rendered crisply with no typos, using elegant Song-style and Kaiti typography where appropriate:
主视觉标题区:"山川茶事""山柚观音""冷泡系列 · 新品上市"
主文案:"一口清醒,半城入夏"
价格区:"限定尝鲜价""中杯 16 元""大杯 19 元"
活动模块:"门店活动""第二杯半价""加 3 元升级轻乳版""每日前 100 名赠限定杯套"
风味推荐:"推荐风味""观音茶底 / 西柚果香 / 轻乳云顶 / 冰感回甘"
底部活动区:"活动时间 4 月 20 日 至 5 月 10 日""扫码点单"(附二维码占位方框)英文 logo "SHANCHUAN TEA"
底部免责:"图片仅供参考,请以门店实际售卖为准"
Layout: strong promotional hierarchy — the largest element is 山川茶事 brand + 山柚观音 product name at the top, center is the hero cup, right-bottom is the price module in a gold-outlined rounded box, bottom left has the flavor slash-list, bottom is activity time + QR. A thin ink-wash mountain silhouette runs across the lower third of the poster. Maintain sophisticated, gallery-worthy restraint — not a cheap e-commerce feel. Pay special attention to small Chinese numerals, prices, and info module spacing. Paper grain, subtle osmanthus petals scattered. No watermark, no external logo.字帖那张 260 字《心经》全文楷书 + 浅灰描红空格 + 底部”执笔悬腕""横画略斜”书写要领 5 条,规整程度媲美真实字帖。
奶茶海报更狠——我把 17 条中文文案一次性甩给它(品牌名、活动名、价格、风味推荐、活动时间、免责声明……),它全部渲染对了,一个错字没有,而且主次排版高低节奏全出来了。
第一点体感:过去做这种图要美工排版半天,现在是”写文案”就等于”做设计”。
二、理解设计意图:这是个”懂设计”的模型
文字渲染只是基础。真正让我震撼的是它能理解”信息图”的版式语义。
2.1 博物馆展板级拆解图:10 处引线标注 + 4 种材质小样
查看完整 Prompt · 博物馆图鉴拆解图 · 明代山文甲
请自动生成一张"博物馆图鉴式中文拆解信息图",主题为:明代山文甲(武将铠甲)。
整张图须兼具真实写实主视觉、结构拆解、中文标注、材质说明、纹样寓意、色彩含义和核心特征总结。整体风格为:国家博物馆展板、历史服饰图鉴、文博专题信息图,而不是普通海报、古风写真、电商详情页或动漫插画。背景采用绢纸白 / 浅茶色纸张质感,整体高级、克制、专业、可收藏。
版式固定如下:
【顶部】- 中文主标题"明代山文甲"(黑底金字)- 副标题"Ming-Dynasty Mountain-Pattern Armor · 武将重铠图鉴"- 导语(3 行楷体)简述来源、盛行年代(明中叶)、形制演变。
【左侧 结构拆解区】一位身着完整山文甲的明代武将全身立姿为中心主体(正面图),旁配中文引线标注 10 处关键部件:- 凤翅盔(头盔)- 顿项(护颈)- 披膊(肩甲)- 肩吞兽纹- 胸甲(山文铁片)- 腹甲- 甲裙(裙甲)- 吊腿(护腿)- 束甲绦带- 玄铁束甲扣
每个标注配一个放大局部图。
【右上 材质 / 工艺 / 质感区】展示 4 种真实材质小样:- 山文铁片(呈"山"字造型的铁片镶嵌)- 铜鎏金吞兽扣- 皮革内衬- 明黄丝绸束带
附简短文字说明,标明工艺"冷锻锤打 / 铆接 / 鎏金 / 绦带编织"。
【右中 纹样 / 色彩 / 寓意区】- 主色板 5 色:玄黑 / 赤红 / 鎏金 / 靛蓝 / 象牙白,附 HEX 色值- 纹样样本:山文(坚固不摧)、吞兽(辟邪震慑)、云纹(天命所归)、祥云火焰(帝王仪仗)- 每个纹样配 100 字以内中文寓意说明
【底部】- 穿着顺序流程图:内衬袍 → 腹甲 → 胸甲 → 披膊 → 甲裙 → 吊腿 → 顿项 → 凤翅盔(图示 + 编号箭头)- 核心特征总结(4 点短句):重约 15 公斤 / 防御箭矢与刀剑 / 明代武将礼仪化装束 / 多见于戚继光《练兵实纪》记载
所有文字必须为简体中文(引文可为繁体),清晰、规整、可读,不要乱码、错字、英文或拼音。重点突出真实结构、材质差异、文化说明与图鉴气质。避免:海报感、影楼感、电商感、动漫感、cosplay 感、乱标注、错结构、糊字、假材质、过度装饰。这张图我用的是 @MrLarus 那条通用”博物馆图鉴”模板,主题替换成”明代山文甲”。模型做了什么:
- 中央:一位明代武将全身立姿作为主体
- 10 处中文引线标注关键部件(凤翅盔 / 顿项 / 披膊 / 胸甲 / 甲裙 / 吊腿 / 束甲绦带 …… 每一处都配一个放大局部图)
- 右上 4 种材质小样:山文铁片 / 铜鎏金吞兽 / 皮革内衬 / 明黄丝绸
- 右中 5 色主色板 + HEX 色值(玄黑 #1A1A1A、赤红 #9E1C1C、鎏金 #D4AF37…)
- 4 种纹样的寓意说明:山文(坚固不摧)/ 吞兽(辟邪震慑)/ 云纹(天命所归)/ 祥云火焰(帝王仪仗)
- 底部穿着顺序流程图:内衬袍 → 腹甲 → 胸甲 → 披膊 → 甲裙 → 吊腿 → 顿项 → 凤翅盔
这已经不是”AI 生图”,这是”AI 做设计”。
2.2 百科知识卡 + 电商详情页:模块化信息组织
雪鸮百科知识卡 | 复古胶片相机电商详情页 |
![]() | ![]() |
左图 Prompt · 百科知识卡 · 雪鸮 Snowy Owl
Generate a high-quality vertical encyclopedia-style infographic for "Snowy Owl 雪鸮".
This should not be a normal poster or a simple illustration. It should feel like a modular educational infographic that combines the clarity of a field guide, the structure of an encyclopedia page, the polish of a lifestyle knowledge card, and the shareability of a strong social-media explainer.
The image should include:- a clear and appealing main visual of a pure-white snowy owl with piercing yellow eyes, perched on a snowy rock, sharp wing feather detail- several enlarged detail callouts: close-up of facial disc, close-up of feathered talons, close-up of an eye, close-up of a flight feather- multiple rounded modular information sections with bilingual labels (Chinese + Latin)- strong title hierarchy: big title "雪鸮 SNOWY OWL" and subtitle "Bubo scandiacus · 北极圈的白色猎手"- concise but information-rich sections with short text: 基本档案 (学名 / 体长 60-70cm / 翼展 140-165cm / 寿命 10 年) / 分布区域 (北极苔原 · 冰岛 · 格陵兰 · 阿拉斯加) / 外形特征 / 生活习性 (昼行性 / 主食旅鼠) / 繁殖模式 / 趣味冷知识 Top 5- a quick scorecard at the bottom: 观赏度 ★★★★★ / 濒危等级 LC / 寒冷耐受 ★★★★★ / 亲人程度 ★☆☆☆☆
Visual requirements: clean off-white paper-texture background, soft icy blue and pale gold accents, subtle shadows, refined small icons (snowflake, compass, paw print), rounded information cards, neat grid layout, high information density but not crowded. The final image should feel publishable, collectible, and repeatable as a knowledge-card format rather than an advertisement. All Chinese text must be simplified Chinese, perfectly rendered with no typos.
Do not make it look like a commercial promo poster. Emphasize knowledge organization, modular information, and a field-guide presentation.右图 Prompt · 电商详情页 · 复古胶片相机
生成一张"复古胶片相机"电商详情图,日系轻奢杂志风,竖版长图比例 3:4。
整体风格:奶油白背景 + 木纹与皮革材质 + 暖色调阳光投影 + 日系 Fujifilm 旗舰店即视感。结构为多模块上下堆叠:
【Hero 主视觉模块】占顶部 1/3:一台复古黑银色胶片相机(皮革机身 + 银色金属顶盖)悬浮于柔光背景中,机身有"CLASSICA M2"字样,焦距环和快门盘清晰可见。右上角大字中文标题"胶片的手感 · 数字的便利",副标题"CLASSICA M2 复古胶片相机"。
【核心卖点模块】3 个圆角卡片并排:- "真·胶片质感":颗粒模式 / 10 种复古预设 / 支持 35mm 柯达乐凯- "APS-C 画幅 · 2610 万像素":搭载全新 X-Trans 传感器- "直出 JPG 即大片":内置 18 种胶片模拟(经典负片 / Acros / Velvia 等)
【产品参数规格表】模块,带小图标:- 传感器:APS-C X-Trans 5 · 镜头卡口:X 卡口 · 取景器:0.5 倍 OLED · 屏幕:3.0 英寸翻转触控 · 连拍:8fps · 视频:6K 30p · 重量:465g · 电池:NP-W235
【场景图模块】两张小图横排:一张为青年摄影师在京都小巷持相机拍摄,一张为相机平放在木桌上配一杯黑咖啡。
【配件与赠品清单】- 🔸 原装皮质相机套- 🔸 35mm F1.4 定焦镜头- 🔸 肩带 + UV 保护镜- 🔸 赠品:限定相机贴纸 + 布艺擦布 + 32G 高速卡
【用户口碑节选】3 条带 5 星好评:- "真的是一眼入魂,色彩直接出片" ——小红书用户- "复古外观搭配现代性能,周末出行首选" ——摄影师 @Kevin- "胶片模拟太离谱,朋友都以为我用菲林"
【限时价格模块】占底部:- 大字"新品上市价 ¥8,999"- 划线原价"¥10,299"- 红色标签"前 100 名赠原厂皮套"- 右下角黑色按钮"立即购买"
文字要求:所有中文清晰规整、零乱码零错字。数字、¥符号、英文型号准确。风格克制有格调,不要低价促销感。无水印。雪鸮那张:主视觉 + 4 个特写 callout(面部 / 足部 / 眼睛 / 飞羽)+ 基本档案 / 分布区域 / 外形特征 / 生活习性 / 繁殖模式 / 冷知识 Top 5,底部还有观赏度/濒危等级/寒冷耐受/亲人程度的”评分卡”。
胶片相机电商页:Hero 主视觉 + 3 个卖点卡片 + 产品参数规格(8 项)+ 2 张场景图 + 配件清单 + 3 条用户口碑(带 5 星评分)+ 价格模块(¥8999 + 划线原价 + 赠品)+ “立即购买”按钮。
两张图都是 1024×1536 竖版,放到任何电商平台都能直接当详情图用。
2.3 三日游攻略 + 健身训练图:实用工具级
京都三日游攻略 | 背阔肌训练计划 |
![]() | ![]() |
📝 左图 Prompt · 三日旅行攻略卡 · 京都
Generate a premium three-day Kyoto travel guide card as a vertical infographic poster, 3:4 ratio, in the style of a high-end Japanese travel magazine spread.
Title area (top):- Big bilingual title: "京都 三日深度游 / 3 Days in Kyoto"- Subtitle: "红叶季精选路线 · November Itinerary"- a small Kyoto icon stamp (torii gate)
Three vertically stacked day cards, each styled as a rounded translucent card on a washi paper background:
DAY 1 岚山竹林与千本鸟居- Morning 08:00 清水寺 + 二年坂三年坂(手绘小图:清水舞台)- Noon 12:00 祇园·一兰拉面 ¥¥- Afternoon 14:30 伏见稻荷大社(小图:千本鸟居红色隧道)- Evening 18:00 花见小路散步 + 夜游 + 怀石料理- 交通 tips: 京都市巴士一日券 ¥700
DAY 2 金阁寺与哲学之道- 09:00 金阁寺(小图:金色楼阁倒映池塘)- 11:30 龙安寺枯山水庭院- 13:00 🍵 銀閣寺前茶屋 抹茶套餐 ¥¥- 15:00 哲学之道(红叶下的石板小径)- 17:00 平安神宫 + 岡崎公園- 19:30 先斗町晚餐 · 居酒屋
DAY 3 岚山与宇治茶道- 08:30 岚山竹林 + 渡月桥(小图:竹林小径)- 11:00 天龙寺庭园- 13:00 岚山汤豆腐料理- 15:00 电车前往宇治(JR 奈良线 35 min)- 16:00 平等院凤凰堂(十円硬币图案原型)- 18:00 宇治茶道体验- 20:00 京都站晚餐 + 伊势丹百货扫货
Bottom module:- 住宿推荐:祇园町家 / 京都站 APA / 岚山温泉旅馆 三档- 必买清单:抹茶 / 八桥 / 和菓子 / 清水烧陶器 / 京扇子- 预算参考:¥2500–4000 / 天 (含餐饮交通门票)- 最佳季节:春樱 3–4 月 · 秋枫 11 月- 小贴士:早起避开团客 · Suica 通刷 · 神社脱帽
Visual style: soft washi paper texture background, muted autumn palette (red maple, burnt orange, moss green, cream, matte black), hand-drawn travel illustrations in each day card (small scenes), icons for food/transport/time/budget, elegant Japanese typography for Japanese text and clean simplified Chinese for Chinese text, subtle stamp marks and dotted paths between locations. Information-rich but not crowded, magazine-level editorial polish. No watermark, no external logos.右图 Prompt · 健身训练信息图 · 背阔肌强化计划
请生成一张中文健身信息图,主题为:背阔肌强化训练计划。
版式为竖版 3:4,现代、清爽、专业、模块化卡片布局,配色以深墨蓝 + 橙色高亮 + 米白背景为主,配小图标。整体既专业又实用,适合普通成年人作为训练参考。默认对象为健康成年人、无严重伤病,训练目标为"增肌 + 基础力量提升",水平为新手到中级,场景为普通健身房,单次训练控制在 40–60 分钟。
信息图必须包含以下模块,每模块做成圆角卡片:
【A. 标题区】- 主标题:"背阔肌 · 宽背计划"- 副标题:"BACK HYPERTROPHY · 入门到中级"- 小字:"单次 45 分钟 · 每周 2 次 · 8 周看到明显倒三角"
【B. 训练目标区】- 主目标:背阔肌宽度 + 厚度 + 基础力量- 次目标:改善含胸体态 + 提高引体向上数量
【C. 热身区】5 分钟- 肩部绕环 ×20- 猫牛式 ×10- 弹力带面拉 3×15- 空杆硬拉 1×10
【D. 主训练区】(核心 · 5 个动作,每个配人体肌肉图标 + 动作剪影)1. 引体向上(宽握)4 × 8-10 · RIR 2 · 要点:感受背阔发力 · 常见错误:借力摆动2. 坐姿 V 把划船 4 × 10-12 · RIR 2 · 要点:挺胸收肩胛 · 常见错误:耸肩3. 单臂哑铃划船 3 × 12/边 · RIR 1 · 要点:肘贴身 · 常见错误:身体扭转4. 高位下拉(宽握)3 × 12-15 · RIR 2 · 要点:下巴越杠不过杠 · 常见错误:后仰借力5. 直臂下压 3 × 15 · RIR 1 · 要点:肘关节微屈 · 常见错误:手腕主导
【E. 进阶 / 解锁逻辑区】- 第 1-2 周:建立动作模式,重量保守- 第 3-5 周:每周加重 2.5kg- 第 6-8 周:引入负重引体,换 3-5 次大重量组
【F. 替代动作区】(器械不足时)- 引体向上 → 辅助引体机 / 弹力带辅助- V 把划船 → 俯身杠铃划船- 直臂下压 → 弹力带下压
【G. 执行提醒区】- ✅ 组间休息 90–120 秒- ✅ 每次训练做 2 组热身轻重量- ⚠️ 腰痛期间跳过俯身划船- ⚠️ 引体感受不到背?先做 3 周高位下拉
【H. 恢复建议区】- 训练后补充 20–30g 蛋白质- 每周留 1-2 天休息- 冷水澡/泡沫轴 10 分钟放松
【I. 页脚】小字"图片仅供参考,具体训练请结合自身情况"
所有中文字体清晰锐利、零错字零乱码。整体像专业健身 App 导出的训练卡。无水印。京都攻略我只写了 “Generate a three-day Kyoto travel guide” 加上模糊的模块列表。模型自动补齐了三天行程 + 每个景点的时间戳 + emoji 食物标签 + 交通 tips + 住宿推荐 + 必买清单 + 预算参考 + 最佳季节 + 小贴士。
健身图更恐怖。5 个主训动作每个都标了:
- 组数 × 次数(如 4 × 8-10)
- RIR(储备次数)
- 技术要点
- 常见错误
- 配人体肌肉解剖图 + 动作剪影
这种东西放到小红书,点赞五位数起步。
2.4 人物关系图:理解”信息可视化”本身
查看完整 Prompt · 人物关系图 · 《三体》
Generate a high-design character relationship poster for "三体 The Three-Body Problem" (刘慈欣科幻三部曲).
This should not be a normal illustration, but a relationship map that combines information visualization, narrative structure, poster-level design, and strong fidelity to the novel's style.
Select 12 key characters arranged by faction and arc (with Chinese + English labels):- 地球派 (Earth Defense): 罗辑 Luo Ji (面壁者 Wallfacer), 章北海 Zhang Beihai (太空军政委), 史强 Da Shi (刑警), 汪淼 Wang Miao (纳米科学家)- 科学家 (Scientists): 叶文洁 Ye Wenjie (ETO 创始人 · 红岸工程师,shown as the elder central figure with shadow), 丁仪 Ding Yi (理论物理学家)- ETO 降临派 (Adventists): 伊文斯 Mike Evans (背叛的美国富豪)- 未来世纪:程心 Cheng Xin (执剑人), 云天明 Yun Tianming (大脑中的童话讲述者)- 三体舰队:智子 Sophon (三体人派出的拟人形 AI,女武士形象)- 太空纪元:关一帆 Guan Yifan (引力号船员), 艾 AA (程心助理)
Relationships (shown as different colored lines with labels):- 红色实线 = 宿敌/审判 (叶文洁↔ETO 受害者)- 金色虚线 = 信任/托付 (罗辑→程心,云天明→程心)- 蓝色箭头 = 同盟 (章北海→罗辑)- 紫色曲线 = 爱恋/单相思 (云天明→程心)- 灰色双向 = 师徒/启发 (叶文洁→罗辑)- 黑色闪电 = 背叛 (伊文斯→人类文明)
Composition: 中心为罗辑(面壁者星盘背景),叶文洁在上方化为三体星系轮廓的剪影,程心在下方被三体舰队光轨环绕,其他角色按派系分布在四象限,背景点缀"水滴"探测器、智子展开六维图像、三体世界的三颗太阳、红岸工程雷达天线。
Visual style: cinematic hard sci-fi poster with dark cosmic navy background, star-field texture, Chinese ink-wash accents on character portraits, golden highlights, faction color bands, clear character name tags in both Chinese and English, thin white-on-dark connection lines with clear labels. Include small icons for key artifacts (水滴 droplet, 智子 sophon, 阶梯飞船,黑域). Title at top "三体 THE THREE-BODY PROBLEM · 人物关系图", subtitle "刘慈欣 · 地球往事三部曲".
The final piece should make the main relationships understandable at a glance, strongly evoke the novel's hard sci-fi identity, combine infographic clarity with premium cinematic poster design, feel unified, polished, and suitable for collector display. Avoid cheap flowchart vibes, clutter, and information overload. No watermark.这张我让它做《三体》人物关系图。我只告诉它”12 个代表角色”,没告诉它具体选哪 12 个。
模型自己筛出了:罗辑(面壁者中心)/ 叶文洁(ETO 创始人)/ 章北海 / 史强 / 汪淼 / 丁仪 / 伊文斯 / 程心 / 云天明 / 智子 / 关一帆 / 艾 AA——选角非常准确。
关系线分色:红色实线 = 宿敌/审判,金色虚线 = 信任/托付,蓝色箭头 = 同盟,紫色曲线 = 爱恋/单相思,灰色双向 = 师徒/启发,黑色闪电 = 背叛。阵营分区:地球派 / 科学家 / ETO / 未来世纪 / 太空纪元。
背景还自己加了:红岸工程雷达、三体世界三颗太阳、水滴探测器、智子六维展开、阶梯飞船、黑域。
第二点体感:过去做这种信息图要请乙方一周,现在一条 prompt 三分钟,关键是内容上比多数乙方做得更准。
三、角色一致性:多格图终于不”换脸”了
过去用 MJ 跑”同一个角色在 12 个场景”这种任务,结果大概率是 12 个不同的人。GPT-Image-2 解决了这个问题。
3.1 16 格表情包:4×4 完全不漂移
查看完整 Prompt · 16 宫格表情包 · 紫发金瞳少女
Create a clean 4×4 expression grid (16 panels total) of an anime-style girl, highly consistent character design across all 16 panels with zero drift in face shape, hairstyle, eye color, and clothing.
Character design (must be identical in every panel):- teenager girl, 16 years old, slender frame- long straight lavender-purple hair with hime-cut bangs, two braided side strands tied with black ribbons- bright golden-yellow eyes with clear anime highlights- small mole under the right eye- wearing a white sailor-collar seifuku with a black ribbon tie and a deep-navy pleated skirt- pale porcelain skin
The 16 expressions (arrange left-to-right, top-to-bottom, one per cell):Row 1: 01 happy smile 开心,02 sad downcast eyes with a single tear 难过,03 angry puffed cheeks with a sweatdrop 生气,04 surprised wide eyes + round mouth 惊讶Row 2: 05 shy blushing looking away 害羞,06 speechless deadpan dot eyes 无语,07 evil grin with a glint 坏笑,08 contemplative finger on chin 沉思Row 3: 09 curious head tilted with question mark 好奇,10 proud smug with closed eyes 得意,11 wronged watery eyes pouting 委屈,12 disdainful half-closed eyes looking down 不屑Row 4: 13 confused tangled question marks 困惑,14 scared pale face 惊恐,15 crying anime waterfall tears 大哭,16 heart-eyes heart-shaped pupils + hearts floating 爱心
Style: modern Japanese anime illustration, clean line art with subtle shading, soft cel-shading, delicate pastel highlights on the hair, bright vivid color cells, each panel has a pale different-colored background (light pink, mint, lavender, peach, sky blue, cream, lilac, etc.) with a thin white border separating the 16 cells. A small Chinese/English label in the bottom-left corner of each cell. Overall feeling: collectible anime emoji pack. No watermark, no signature, no out-of-cell decoration, perfectly aligned 4×4 grid.16 格里同一个紫发金瞳 JK 少女,发型、脸型、服装、眼睛颜色、连脸上的小痣位置都一致。16 种情绪(开心/难过/生气/惊讶/害羞/无语/坏笑/沉思/好奇/得意/委屈/不屑/困惑/惊恐/大哭/爱心)分别渲染,每格还有不同的粉彩背景。
关键 prompt 只有一句:
highly consistent character design across all 16 panels with zero driftin face shape, hairstyle, eye color, and clothing3.2 12 分镜短剧:古风女侠在 12 个场景里是同一个人
查看完整 Prompt · 短剧十二分镜 · 古风女侠
生成一组 12 格短剧分镜插画(4 行 × 3 列,每格编号 01-12),电影感写实水墨插画风,胶片颗粒,古风江湖氛围。全部 12 格必须保持同一个女侠主角的面部、发型、体型、服装 100% 一致(ultra-consistent character identity across all 12 frames)。主角设定:亚洲女性,20 多岁,一头及腰黑色长发高束成马尾,额前红色发带,身穿墨绿色束腰劲装外披一件旧白色斗篷,腰间佩一柄细长剑"青霜",左手有一道旧伤疤,眼神清冷坚毅,唇色微浅。
分镜 01-03:入镇01. 雪夜官道尽头,她披着落雪的斗篷,独自牵马走向一座山间小镇的城门。02. 踏入镇内石板街,雪落屋檐,街旁悬着红灯笼,她低头避开一队巡夜兵卒。03. 她推开一间冷清客栈的木门,烛光映在雪白斗篷上,掌柜抬头相望。
分镜 04-06:察觉04. 客栈二楼雅间,她背窗而坐,桌上放着一壶冷酒与一块佩玉,目光冷峻。05. 她指腹擦过佩玉纹路,记忆般微皱眉头,烛火在眼底跳动。06. 楼下一声惊呼,她霍然起身,右手已按上剑柄。
分镜 07-09:追索07. 雪夜屋檐,她一跃而起,斗篷翻飞,身影掠过檐角瓦片。08. 暗巷之中,她与一名蒙面黑衣人交错出剑,寒光与火花瞬间迸发。09. 黑衣人被一剑挑落兜帽,露出熟悉面孔,她瞳孔微震,剑尖微颤。
分镜 10-12:远行10. 山神庙内,她跪在残破神像前,低声自语,烛光摇曳映出她眼中泪光。11. 黎明破晓,她重新披上斗篷,推开庙门,雪已停,山川苍茫在前。12. 晨光中她翻身上马,背影坚定,沿着雪后山道远去,孤影与远山融为一体。
要求:每格构图饱满、电影感镜头语言(近景/中景/远景/俯视交替),冷调色系(青墨、雪白、烛橙、旧红点缀),光比强,水墨晕染质感。主角服装、发型、伤疤位置、面部特征必须全程一致。4 行 × 3 列均匀排版,格与格之间留有细白线分隔,左上角有分镜编号 01-12,无额外文字、无水印,画面整体比例 3:4。12 格里这位雪白斗篷女侠:
- 面部特征一致
- 束发红绸带一致
- 腰间”青霜剑”12 次出现位置一致
- 左臂旧伤疤 12 格都有
- 墨绿色劲装 + 白色斗篷一致
镜头还按”4 段叙事 × 3 格”做了节奏变化:入镇 → 察觉 → 追索 → 远行。这几乎是影视分镜师的活。
3.3 九宫格写真集:日系少女零偏移
查看完整 Prompt · 九宫格写真集 · 日系胶片少女
9:16 vertical — a 3x3 grid collage (nine images) forming a Japanese film photography portrait series. Each frame features the same young Japanese female model, maintaining 100% consistency in facial features, proportions, hairstyle, and identity across all nine shots. Natural, ultra-realistic skin texture, no retouching, no smoothing. Soft dewy no-makeup look, subtle imperfections, small beauty mark under left eye. Hair: shoulder-length straight black hair with blunt bangs, slightly tousled, consistent across all frames. Outfit: cohesive Japanese summer styling — white sailor collar blouse tucked into a light beige pleated midi skirt, same outfit across all frames. Setting: a sunlit Tokyo apartment with lace curtains, wooden floor, potted plants by the window, clean minimal background. Lighting: soft diffused window light with lens flare, gentle highlights, low contrast, warm analog film softness reminiscent of Kodak Portra 400. Frame breakdown (3x3 grid): Top row — standing by window looking outside, holding curtain / facing camera mid-laugh with hand near mouth / slight side angle reading a book. Middle row — tilting head upward with closed eyes feeling sunlight / extreme close-up direct eye contact gentle smile / turning body mid-twirl with skirt flowing. Bottom row — seated on wooden floor holding a ceramic mug / back partially turned looking over shoulder by the window / standing close to frame brushing hair behind ear. Mood: 90s Japanese photobook aesthetic, intimate, soft, nostalgic. Quality: ultra-realistic, 8K detail, subtle analog film grain, natural imperfections, soft dreamy tone, warm color grading.水手领制服 + 短发齐刘海 + 左眼下小痣——9 个不同动作姿态下保持一致。最难的是中间那张特写,必须和其他 8 格”看起来是同一张脸”。它做到了。
第三点体感:一致性关键词 100% consistency across all N frames 是这一代模型解锁的核心技巧。没有这句话,还是会换脸。
四、视觉风格与摄影级写实:美学天花板也拉高了
4.1 赛博朋克剪影叙事海报:诗意与信息密度兼得
查看完整 Prompt · 剪影宇宙叙事海报 · 赛博朋克
Automatically generate a high-aesthetic "Silhouette Universe / Collector's Edition Narrative Poster" based on the theme "Cyberpunk 赛博朋克".
Do not default to common containers such as bottles, hourglasses, glass domes, or pocket watches. Instead, let the main silhouette be the strong side-profile of a human face merged with a cybernetic implant — half organic (cheek, lips, closed eye, flowing hair), half robotic (exposed circuits along the jaw, fiber-optic strands replacing hair on one side, a glowing neural port at the temple). The silhouette should be elegant, recognizable, and compositionally dominant, filling most of the vertical frame.
The entire cyberpunk universe grows naturally within, around, and through this silhouette:- Inside the silhouette's hollow space: a dense neon megacity at night with towering skyscrapers (identifiable as a Kowloon-Walled-City-meets-Tokyo future), holographic billboards in Chinese / Japanese / English (fragments: 無限,記憶,觉醒,SINGULARITY, NEW TOKYO 2099), a lone small figure in a trench coat walking down a rainy alley toward a distant glowing monolith at the top.- Along the jaw silhouette boundary: flying vehicles trailing light streaks, drones, suspended cable cars.- Within the cybernetic half: exposed chrome circuitry, glowing turquoise traces, floating data fragments, binary rain.- Within the hair: fiber-optic strands blooming into a nebula, with a distant satellite and a fractured moon.- Behind the silhouette: a massive circular HUD with radial data readouts, subtle aged-paper grain.- At the base of the poster: a ruined neon sign reading "REMEMBER WHO YOU WERE", small faint antenna towers, ghostly silhouettes of crowd figures.
Depth layering: distinct foreground (one tiny figure lit by a convenience-store sign), midground (wet streets reflecting neon, crowd silhouettes), background (towering skyscrapers fading into purple haze). Atmospheric perspective, volumetric mist, selective god rays, raindrops catching neon.
Color palette: restrained dark teal and deep indigo base, with selective neon accents of magenta pink, cyan, and acid yellow; muted by film grain and aged-paper texture. Avoid chaotic oversaturation; maintain a premium, melancholic, mythic mood.
Visual treatment: feel like a premium collector's poster — paper grain, feathered edges, soft diffusion on neon, watercolor-ink brushmark on the silhouette outline, fine printed dots. Generous negative space around the silhouette edges, restrained layout.
Final requirement: first glance recognizes the silhouette and theme instantly; second glance reveals a complete cyberpunk city growing inside; third glance still rewards close inspection with subtle details (hidden kanji, a small figure, a broken drone). A small poster catalog number "CYB-2099 · 01" in a corner, tasteful serif title "CYBERPUNK" in vertical script along the lower edge. No messy watermark, no cheap plastic neon, no video-game promo feel.这张图来自 @MrLarus 的”轮廓宇宙”模板,核心思想是”让世界在轮廓里生长,而不是把世界塞进轮廓”。
我选了”半机械人类侧脸”作为主轮廓。模型做的事情:
- 人脸轮廓空腔内生长出一座九龙城寨式的未来都市
- 纯发丝区域渐变成星云 + 碎月
- 机械半边有电路纹路和神经接口
- 颈下是一家”24/7”便利店霓虹招牌
- 城市塔楼上有”無限 / 幽醒 / 記憶 / NEW TOKYO 2099”的日文汉字霓虹字
- 底部叙事标语”REMEMBER WHO YOU WERE”
- 左下角小字”CYB-2099 · 01”收藏编号
这张图拿去印做 Netflix 剧海报都没问题。
4.2 建筑大师海报:Zaha Hadid 生平作品全家福
查看完整 Prompt · 建筑大师海报 · ZAHA HADID
A professional cinematic poster titled 'ZAHA HADID'. The central theme is a complex double exposure effect featuring the side profile silhouette of the Iraqi-British architect Zaha Hadid, her signature swept-back dark hair and strong facial structure clearly defined. Inside her silhouette, a breathtaking layered composition illustrates the evolution of parametric and neo-futurist architecture through her key works. At the base, early projects like the Vitra Fire Station are nestled, with a label 'VITRA FIRE STATION 1993'. Above it, the flowing MAXXI Museum in Rome is integrated, labeled 'MAXXI MUSEUM 2009'. Winding through the entire internal landscape is a glowing path made of fluid parametric lines, labeled 'FLUID GEOMETRY', connecting these early works to her later masterpieces. The iconic Heydar Aliyev Center with its seamless curves dominates the upper middle section, labeled 'HEYDAR ALIYEV CENTER 2012'. On a higher plateau within the profile, the Guangzhou Opera House and the London Aquatics Centre are visible, labeled 'GUANGZHOU OPERA 2010' and 'LONDON AQUATICS 2012'. At the top, the Beijing Daxing International Airport terminal with its star-shaped roof is depicted, labeled 'BEIJING DAXING 2019'. At the bottom center, a lone young female architecture student stands on a rocky ledge with a sketchbook, looking out toward a distant futuristic skyline of curving parametric buildings. The background shows a serene deep-blue dusk sky transitioning to violet. The lighting is cool twilight with volumetric light rays, creating a futuristic atmosphere. High-resolution, 8k, hyper-realistic digital art style, clean Helvetica typography, sharp focus. Side icons are replaced with simplified architectural symbols and labels: a flowing curve with 'FORM', a parametric grid with 'PARAMETRICISM', a compass with 'GEOMETRY', and a world map with 'GLOBAL LEGACY'. The text '1950 - 2016' is prominent below her name. Bottom text reads: 'THERE ARE 360 DEGREES. WHY STICK TO ONE?'. Negative: blurry, distorted face, messy text, extra fingers, Le Corbusier, Apple Park, California, watermark, signature.以 Zaha Hadid 侧脸轮廓为画布,内部按时间轴堆叠她的代表作:VITRA FIRE STATION 1993 → MAXXI MUSEUM 2009 → HEYDAR ALIYEV CENTER 2012 → LONDON AQUATICS 2012 → GUANGZHOU OPERA 2010 → BEIJING DAXING 2019。底部”1950 - 2016” + 她的名言 “THERE ARE 360 DEGREES. WHY STICK TO ONE?”
最惊艳的地方:底部”THERE ARE 360 DEGREES”标语出现时字体完美、无乱码,而且居然是 Zaha 本人真实说过的话。
4.3 城市宣传海报 + 美食地图:文化属性拉满
西安春节海报 | 成都巴适美食地图 |
![]() | ![]() |
左图 Prompt · 城市宣传海报 · 西安春节版
一张充满新春喜庆氛围但不失高雅格调的 2026 城市宣传海报。双重曝光,构图延续 S 型的流动感;在纯白的宣纸纹理背景右下角,一个身穿汉服的微缩人物正在挥舞着一条长长的红色丝绸舞带,这条红绸在空中舞动,不仅展现出丝绸的柔顺质感,更在向左上方飘动的过程中,奇幻地变形成了一条壮丽的山河长卷。在这条"山河"中,叠加了一个有山有水的西安城市手绘图,盛唐国风,景色壮阔,雄伟绵长。西安的地标建筑沿红绸蜿蜒分布:大雁塔、钟楼鼓楼、兵马俑军阵、华清池、明城墙与永宁门、大唐芙蓉园、骊山。云雾环绕,仙气缥缈,色彩丰富,结构复杂,细节丰富,但因为大面积留白,画面依然显得清新脱俗。左下角烫金排版着"SPRING 2026"和竖排宣传语"长安十二时辰 千年盛世西安",整体寓意"古都新春,大美西安"。文字排版优美大方,字迹清晰完整,尺寸 9:16。右图 Prompt · 城市美食地图 · 成都火锅版
一幅手绘风格的城市美食地图,以成都为主题。画面以鸟瞰视角的手绘简化城市地图为底,标注主要道路(如春熙路、人民南路、锦江大道)和地标(如太古里、宽窄巷子、锦里、大熊猫基地、武侯祠)但不追求精确比例,追求可爱的手绘感。地图上分布着 12 个美食地点的精致手绘小插画:宽窄巷子的老成都铜锅火锅(红油翻滚的铜锅,毛肚黄喉鸭肠堆满,旁边写着"老成都味道,麻辣鲜香")、玉林路的串串香(一大把竹签串串从陶碗里冒出,红油亮眼,推荐语"一把签签,满口江湖")、小龙坎的九宫格(九宫格铜锅冒着红油烟,牛肉片摆得整齐,推荐语"九宫分明,各据一格")、春熙路的龙抄手(白瓷碗里红油抄手浮着葱花,推荐语"皮薄馅嫩,红油一绝")、文殊院的甜水面(粗面条裹着红糖酱油花生碎,推荐语"微甜回辣,成都限定")、锦里的三大炮(三颗糯米团砸在黄豆粉上腾起白粉,推荐语"一砸两响三颗香")、太古里的钟水饺(红油水饺配蒜泥姜汁,推荐语"百年老字号")、建设路的蛋烘糕(小铁锅里金黄酥脆的蛋烘糕夹着奶油芝麻,推荐语"一口脆一口香")、人民公园的盖碗茶(鹤嘴长壶高冲沏出三件头盖碗茶,推荐语"一盏盖碗,半日闲适")、武侯祠的夫妻肺片(红油拌牛杂码得整齐,撒花生碎芫荽,推荐语"麻辣鲜香,川味经典")、玉双路的冒菜(陶碗里麻辣红汤埋满素菜肉片,推荐语"一人一锅,自由搭配")、大熊猫基地的熊猫蒸饺(蒸笼里排着一圈黑白熊猫造型蒸饺,推荐语"可爱到舍不得吃")。每个插画约占地图的 5% 面积,旁边用手写体标注店名和推荐语。地图边缘用手绘芙蓉花、竹叶、熊猫剪影和麻辣花椒纹装饰,形成边框。右下角有一个手绘指南针和图例说明。左上角标题"成都 巴适美食地图"使用胖圆的手绘美术字配熊猫和芙蓉花装饰。整体画风为水彩 + 彩铅混合的手绘质感,颜色以暖色系(红油红、竹叶绿、芙蓉粉、熊猫黑白)为主,图片比例横板 16:9。西安那张——“红绸在空中舞动 → 奇幻变形成山河长卷”的结构执行得完美。大雁塔 / 钟鼓楼 / 兵马俑 / 华清池 / 明城墙永宁门全部识别正确,左下”SPRING 2026” 烫金字 + 竖排”长安十二时辰 千年盛世西安”精准渲染。
成都美食地图——12 个美食点一个不落:老成都铜锅火锅 / 玉林路串串 / 九宫格 / 龙抄手 / 甜水面 / 三大炮 / 钟水饺 / 蛋烘糕 / 盖碗茶 / 夫妻肺片 / 冒菜 / 熊猫蒸饺。每个都有手绘小图 + 推荐语。边框四周的芙蓉花、熊猫剪影、麻辣花椒纹装饰一个没落。
4.4 等距 3D 微缩城市:style transfer 能力
查看完整 Prompt · 等距 3D 微缩城市 · 杭州西湖版
A highly detailed rounded cute isometric 3D tile rendering of Hangzhou's West Lake scenic area, 1:1 square aspect ratio, floating on a pure white background with a soft drop shadow.
The miniature tile should feel like a premium game-asset diorama with tilt-shift toy charm. Key landmarks must be clearly preserved and recognizable but stylized with rounded edges and chibi proportions:- the Broken Bridge (断桥) with a curved stone arch crossing over the lake- the Leifeng Pagoda (雷峰塔) on the southern hill, amber-tiled, multi-tiered, glowing softly- Three Pools Mirroring the Moon (三潭印月) — three tiny stone lanterns poking out of the calm lake water- Lingyin Temple hidden among pine-covered hills in the background corner- Su Causeway (苏堤) winding as a ribbon of willow trees across the water- Longjing tea terraces on a rolling green hill in one corner- a small red-lacquer pavilion, scattered tiny rowboats on the lake, pink cherry blossom trees, curving stone bridges
Lighting: warm golden-hour sunset casting long soft shadows from the west, gentle ambient occlusion, subtle god rays through trees.
Art direction: soft pastel palette (jade green, soft blue water, warm cream, rose pink, amber gold, ink black tile roofs), clean smooth low-poly surfaces with rounded edges, no harsh geometry, no humans unless as tiny silhouettes, dreamy tilt-shift toy atmosphere. Render in a Blender-like cinematic 3D style, ultra-clean, depth of field blur at the edges, pristine studio lighting, 8K detail, premium illustration quality, no text, no watermark, no logo.Nano Banana 最火的”等距 3D 微缩”在 GPT-Image-2 上同样可行。杭州西湖浓缩成一块 1:1 的小岛:雷峰塔、三潭印月、断桥、苏堤柳树、龙井茶园、樱花小径、红色亭子、小舟——完整保留地标识别度但全部圆角软萌化。
4.5 便利店胶片人像:摄影级写实
📝 查看完整 Prompt · 便利店霓虹人像 · 东京雨夜版
35mm film photography with harsh 7-Eleven fluorescent lighting mixed with colorful pink and blue neon signs from a rainy Tokyo alley outside, authentic film grain, high contrast, slight color cast, cinematic street editorial style, intimate medium shot, early 20s Japanese male model with ultra-realistic delicate refined Asian features, subtle angular jawline, clear skin with warm ivory undertone and visible specular highlights from fluorescent light, subtle skin texture and micro pores, natural matte skin, slightly parted lips, subtle natural freckles across nose bridge, messy medium-length black hair with damp wet strands sticking to forehead from rain, wearing an oversized faded indigo denim jacket over a plain white t-shirt, paired with loose cargo pants and black Converse sneakers, casual leaning pose against the glass door of a 24-hour Tokyo convenience store at 2am after rain, one hand holding a steaming can of hot coffee from the store heater, soft gaze straight at the viewer, bright cold fluorescent store light from inside mixed with pink and blue neon glow from izakaya signs outside, realistic reflections on wet glass door, blurred convenience store interior with onigiri shelves in background, wet asphalt ground reflecting neon, authentic 35mm film color grading, natural hair strands, realistic fabric wrinkles, no plastic skin, no digital over-sharpening, no airbrushing, no watermark, no text35mm 胶片质感、7-11 冷白荧光灯 + 外面的粉蓝霓虹、湿漉漉的头发、denim jacket 的布料皱褶、Converse 帆布鞋、玻璃门上的霓虹反光、地面湿柏油反光——这些细节全部都有。
第四点体感:这一代的美学上限 ≈ Midjourney v6 + 更强的指令遵循。
五、伪造能力也变强了:UI 截图真假难辨
这个能力是双刃剑,但它客观存在。
5.1 苏轼抖音直播赤壁泛舟
查看完整 Prompt · 古人穿越社交平台 · 苏轼抖音直播赤壁泛舟
生成一张"苏轼在抖音上直播 赤壁泛舟 七夕夜"的 iPhone 全屏截图。
顶部 iOS 状态栏:时间 20:23,中国移动 5G,信号满格,电量 82%。
抖音直播界面布局(必须准确还原 2026 版抖音直播间 UI):
【画面主视觉】(占屏幕 4/5)月夜赤壁:江面上一叶扁舟,苏轼头戴东坡巾、身着浅青色道袍,手持羽觞酒杯半醉半醒地抬头望月。旁边坐着一位僧人(佛印)和一位书生,都在举杯。江水微波粼粼映着金黄圆月,远处赤壁悬崖峭立,有薄雾缭绕。镜头为手持自拍视角(第一视角构图,苏轼占据画面中上部正脸对镜)。
【主播信息条】左上角- 头像:苏轼头像(头戴东坡巾水墨画风)- 昵称:"东坡居士 🍷"- 抖音号:"suishi1079"- 右侧"+关注"橙色按钮- 下方"直播中 · 87.3 万人在线 🔴"
【弹幕流】左下半屏飘过 8 条弹幕,字体为抖音标准白色描黑边:- "哥哥念两句新词吧 🫶"- "这才是真正的诗和远方 啊"- "请问苏老师在哪里喝的酒?"- "家人们谁懂啊 这月色真的绝"- "说好的赤壁赋呢 求求了"- "佛印师父也来连麦一下?"- "666 东坡肉何时上架"- "求带 有链接吗"
【礼物特效】画面中部有一串上升动画礼物:3 个"嘉年华"火箭图标 + 5 个"玫瑰"+ 2 个"跑车"右上角浮标显示"榜一大哥 @辛弃疾 1140 赠送火箭 ×3"
【互动面板】右下- 评论区图标 💬 23.4w- 点赞图标 ❤️ 186.2w(旁边有心形特效飞起)- 分享图标 ↗️- 小黄车图标(商品数 5)
【底部输入栏】- 评论框默认文字:"说点什么…"- 右侧"送礼 🎁"金色按钮
【右上角】- 三个点 ⋯ 菜单- 画质选择"蓝光 1080P"
直播标题条(顶部黄金位置):"【七夕直播】月满赤壁 · 对月浩歌 · 直播限定念新词《水调歌头》🌕"
画面右下挂件:"直播连麦中:@佛印老禅师 · @子由(苏辙)"
画面要求:抖音直播 UI 精确像素还原、所有中文清晰无乱码、古画风格主视觉与现代直播元素无缝融合、整体质感幽默有梗但不违和。无水印无外部标记。抖音直播间 UI 像素级还原:顶部 iOS 状态栏 20:23 / 中国移动 5G / 82% 电量、左上角主播信息条”东坡居士 suishi1079”、“直播中 · 87.3 万人在线”、右上角”蓝光 1080P”、右侧”榜一大哥 @辛弃疾 1140 赠送火箭 ×3” 浮标、右下角评论 23.4w / 点赞 186.2w / 小黄车 5、底部”说点什么…” + “送礼 ” 金色按钮。
主视觉是手持自拍视角的苏轼 + 佛印 + 苏辙在赤壁夜泛,月光下举杯。画面中间飞升的”火箭 + 玫瑰 + 跑车”礼物动画也还原了。
5.2 朋友圈九宫格黄山日出
查看完整 Prompt · 真实感伪截图 · 朋友圈九宫格
生成一张 iOS 微信朋友圈截图,顶部时间显示 "19:42",信号 "中国移动 5G",电量 87%。发布者头像是一只橘猫,昵称"晚风不打烊",发布时间"2 分钟前"。九宫格图片是九张不同角度的黄山云海日出打卡照(第一张是云海日出全景、其余八张分别为:迎客松、天都峰登山台阶、挑山工背影、山顶客栈窗景、热粥早餐、徒步同行者背影、石刻"黄山"二字、返程索道窗外云海),每张色调统一为暖金色,构图真实自然。配文(两行):"五点半起床真的值。" "风很大,云海比想象的厚一倍。" 下面依次显示:35 个点赞(带名字预览"张晓楠、Kevin、momo...")、6 条评论(第一条"哇 这天色也太仙了" 第二条"蹲攻略" 第三条"下次带我" ... 最下面一条是发布者自己的回复"随时" )。界面细节:iOS 17 系统字体 SF Pro,微信绿色强调色,顶部"朋友圈"标题居中,右上角相机图标,整体截图完美像素对齐无水印。iOS 状态栏”19:42 中国移动 5G 87%” → “朋友圈”标题居中 → 橘猫头像 + “晚风不打烊 · 2 分钟前” → 两行文案 → 九宫格黄山日出打卡图(云海/迎客松/登山石阶/挑山工/客栈窗/热粥/徒步同行/“黄山”石刻/索道窗外) → “35 个赞(张晓楠、Kevin、momo…)” → 6 条评论列表(“哇 这天色也太仙了”/“蹲攻略”/“下次带我”/“美哭了”/“心都被治愈了”/回复”随时”)。
一眼看过去就是你朋友真的去爬了黄山发的那条朋友圈。
5.3 西部开放世界游戏截图
📝 查看完整 Prompt · 游戏假截图 · 西部开放世界
an in-game screenshot from a photorealistic open-world western video game, showing a lone cowboy protagonist riding a brown horse through a snowy mountain valley at sunset, authentic game HUD in the bottom-left corner with a circular mini map and stamina indicator bars, subtle motion blur on the horse's legs, volumetric fog in the valley below, cinematic warm rim light from the setting orange sun, realistic footprints in the fresh snow trailing behind the horse, pine forest silhouettes in the distance, ultra high fidelity modern game engine look, 4k, photorealistic, believable video game screenshot composition, no watermark, no external text overlay besides the in-game HUD elements.雪山黄昏 + 骑马牛仔背影 + 左下角圆形迷你地图 + 耐力/体力 HUD + 马蹄雪地脚印——这张图如果发到游戏贴吧说是新作截图,大概率会被当真。
这一点我要单独提醒:眼见不一定为真是这一代模型带来的新问题。作为开发者/内容创作者,既要用好这种能力,也要守住边界。
六、彩蛋实战:把一份漫画脚本直接变成品牌条漫
说完了 24 类”单张图”的能力,我想用一个真实业务场景收尾——这可能是最能体现 GPT-Image-2 生产力价值的玩法。
场景是这样的:一位做云算力平台(共绩算力)运营的朋友,写了一份 20 镜头的漫画分镜脚本——“凌晨 2:47 的程序员 → OOM 崩溃 → 发现共绩 → 创建实例 → 紧急扩容 → 救活 Demo → 第二天清晨走出办公室”,想把它变成一张能发公众号/小红书/朋友圈的品牌条漫。
按传统做法:找漫画师 + 排版师,3–5 天,至少 3000–8000 元一张。
我做了什么:把镜头浓缩为 20 格叙事骨架,写进一条 prompt,扔给 GPT-Image-2。
198.5 秒后,拿到了这张:
为什么这张是”成品”而不是”草稿”?
仔细看这 20 格,它一次性解决了四件事:
- 角色一致性:小李从 01 到 20 都是同一张脸 —— 格子衫、黑眼圈、圆框眼镜、慌乱→自信→微笑的情绪曲线都在
- 剧本落地:凌晨 2:47 时钟、CUDA OOM 红字错误、QPS 120 → 4800 曲线、
+4 张 A800扩容动作、¥347.6 月账单 —— 原脚本里的关键数据一个没漏 - 品牌视觉统一:危机阶段冷蓝色 → 发现共绩后整个画面转暖橙 —— 色彩叙事和品牌色 (#FF7A1A) 完美绑定
- 中文排版正确:标题”算力告急!共绩算力紧急救援”、对白”共绩,给我拉满!“、标语”算力不该是创新的天花板”、价格 “¥1.68/小时 · 按秒计费” 全部零乱码
这套玩法的”魔法公式”
如果你也想把自己的产品故事变成条漫,照抄这个骨架:
【版式】vertical 8-panel 2×4 grid comic strip (9:16)【角色】定义 1 个主角 + 外观锁死(发色/眼镜/衣服),+ "100% consistent character identity across all 8 frames"【节奏】5 幕叙事压缩到 8 格:危机 → 发现 → 启动 → 加速 → 高潮 → 胜利 → 日常【文字】每格的对白、屏幕显示、系统提示用双引号精确约束【视觉】用颜色承担叙事:冷色=困境 / 品牌色=解决方案【品牌】顶部大标题 + 底部 tagline 横条,把 CTA 固化在固定位置这就是 GPT-Image-2 带来的真正变化 —— 它让”写故事”的人第一次不需要美工,就能直接产出可投放的视觉素材。
对个人创作者:小红书连载漫画、公众号营销条漫、知识博主的 IP 漫画形象,过去需要团队的事情,现在一个人一条 prompt 就能完成。
对品牌方:过去画一套 Campaign 物料要两周,现在早上写脚本、中午出稿、下午发布。
七、5 条 Prompt 工程心法(干货)
跑完 24 张,我沉淀了 5 条规律,基本能把这个模型的出图质量稳定在 95% 以上。
心法 1:骨架复用,一个模板吃一个系列
- 胶片人像模板:把 “Chinese idol” 换成 “Japanese male / Korean female / bus stop / izakaya”,骨架完全不动
- 城市海报模板:换城市 + 4-6 地标 + 宣传语
- 美食地图模板:换城市 + 12 道本地菜 + 方言推荐语
- 大师海报模板:换大师 + 代表作年表 + 生卒年
一套模板,做一个系列。这是这一代 AI 生图的关键生产力杠杆。
心法 2:一致性锚点(多格图必写)
多格图必须写这种句子:
ultra-consistent character identity across all 12 frameshighly consistent character design across all 16 panels with zero driftin face shape, hairstyle, eye color, and clothing没有这句话就是换脸。
心法 3:文字渲染三板斧
- 所有中文文案用双引号包裹:
accurately display "山川茶事" - 密集文本要分模块列出:价格区 / 活动模块 / 风味推荐 各自独立
- 排版方向要显式说明:
Song-style for body, Kaiti for headings
心法 4:负向禁用词 = 质感开关
每条 prompt 末尾带上这些:
no plastic skin, no airbrushing, no watermark, no text,no cheap neon, no video-game promo feel, no e-commerce vibe它们是 AI 生图的”反套路”开关,质感会立刻提一档。
心法 5:Azure safety 绕雷(血泪经验)
我 24 张里唯一踩坑的那一张——“Red Dead Redemption 3 截图”——被 Azure 内容安全系统直接拒了。排查后发现:
- ❌ 具体品牌 IP:
GTA 6 / Red Dead Redemption / Mario / Nike→ 直接拒 - ✅ 替换为品类描述:
open-world western video game/an Italian plumber in red overalls - ❌ 真人姓名 / 敏感词:
gun / blood / child / naked - ✅ 真的需要时,把
moderation参数切到low
八、一个不容忽视的趋势:它背后是一个 Agent
跑完这 24 张,我有一个越来越强烈的感受——
GPT-Image-2 已经不是一个纯粹的扩散模型,它背后跑着一个”生图 Agent”。
证据很多:
- 极简 prompt 自动补全:我只写了”Generate a three-day Kyoto travel guide”,它自己补出了时间戳、食物 emoji、交通 tips、预算模块、最佳季节、必买清单——这些我没要求,它推断出来的。
- 内容理解 + 合规自觉:药方那张我提了”敏感信息打码”,它不仅把姓名电话打码了,还顺手把诊所名、执业医师号也码了。这不是图像模型的能力,是理解。
- 作品内容真实性:Zaha 海报底部的”THERE ARE 360 DEGREES. WHY STICK TO ONE?” 是她本人真的说过的名言。《三体》人物关系图里智子的”三体人派出的女武士形象”、红岸工程、水滴探测器——这些设定它都对上了。这个模型查过资料。
- 可对话迭代:不满意不用从头跑,直接说”标题太小了""红色太亮了”,它会精准改那一处。
过去的 AI 生图是”输入 → 扩散 → 出图”。现在是”输入 → 理解意图 → 搜索补全 → 策划版式 → 渲染”,整个链路 agent 化了。
最后
2026 年 4 月这一波模型迭代,图像这条线路终于追上了文字。
一年前我们在讨论”AI 能不能代替插画师”。 半年前我们在讨论”AI 能不能做设计助理”。 现在这个问题变成了——
“AI 能做的设计里,哪一部分还需要人?”
如果对你有帮助,欢迎转发、在看、收藏。留言区开放:你最想用哪一类模板做什么?









