
name: article-illustrator description: “分析文章,在保留已有图片和正文内容的同时,添加少量高价值且风格统一的配图。当用户提出‘给文章配图’‘生成插图’‘为文章插图’等要求,或 Codex 需要为聊天框文本、Markdown、DOCX、纯文本、HTML、PDF 及其他可读格式制定配图计划和提示词、生成辅助图片、按照源文件的适当格式插入或返回图片、建议文章配图位置时,使用此技能。”
文章智能配图只创建能够显著改善理解、记忆、比较效果或情感语境的配图。宁可使用少量关键图片,也不要频繁添加装饰性图片。除非用户明确要求其他编辑,否则保留作者原有的含义、措辞、结构和全部已有图片。
灵活接受输入接受来自聊天框、粘贴文本、Markdown、.txt、.docx、.html、.pdf 或其他可读来源的文章内容。不要仅仅为了开始分析而要求用户转换格式。
对于粘贴到聊天框中的文本,除非用户要求生成文件,否则直接在聊天中返回加入配图后的版本。对于可编辑的源文件,默认创建加入配图后的副本,并保持原文件不变。对于 .docx,在复制出的 Word 文档中,将生成的图片嵌入选定段落的位置。对于 Markdown,将图片保存在文章旁边的 imgs/ 目录,并插入相对路径形式的图片引用。对于 PDF 或其他只读格式,优先使用现有的可编辑源文件。如果没有,则创建一份单独的、含配图的可编辑交付文件,并说明其格式。如果源文件格式无法可靠保留版式,说明这一限制,并选择最接近的可编辑输出格式,但不要因此阻碍配图规划阶段。当源文件格式需要时,使用相应的文档或 PDF 工具。不要在未告知用户的情况下将 Word 文章转换成 Markdown。
执行工作流程1. 阅读并梳理文章逐段检查文章,识别核心论点、重要主题、结构转折、抽象概念、对比关系、流程、时间线、数据关系,以及已经得到图片支持的段落。先建立全文主题地图,再判断单个段落,避免只看局部而重复配图。
把已有图片视为文章的一部分。保留这些图片及其位置。只有当新图片能够提供不同的价值,而且不是简单重复已有图片时,才添加新图。
2. 判断是否需要配图以及放在哪里默认每个重要主题使用一张图片,而不是每个章节使用一张图片。某个段落不生成图片,甚至整篇文章不生成图片,都是可以接受的结果。
当图片能够明确实现以下至少一个目的时,才添加图片:
解释抽象概念或关系;比较不同选项、状态或观点;展示流程、顺序、系统、时间线或层级;让重要数据或空间信息更容易浏览;强化贯穿全文的核心观点、关键隐喻或重要转折;补充仅靠文字难以清楚传达的必要背景;在叙事中形成有意安排的情绪停顿。以下内容默认不配图,除非图片能够提供文字之外的独特价值:
代码示例、命令或配置片段;简单列表、简短定义或已经足够直观的描述;仅起承上启下作用的过渡段;已经被附近图片充分说明的内容。代码相关内容只有在需要解释架构、数据流、界面关系或运行机制时,才考虑使用示意图。拒绝使用纯粹的通用装饰图,也不要添加重复附近文字、打断阅读节奏或制造视觉噪声的图片。短文章通常使用 0 至 2 张图片。长文章应由主题的实际需要决定数量,不要设定硬性配额。
3. 选择一种统一视觉体系阅读 references/styles.md,从其中的 10 种风格里选择最合适的一种,并在整篇文章中保持一致。选择时考虑目标读者、主题、发布场景、情绪基调和信息密度。
默认使用 4:3 比例。只有当用户要求其他比例,或者内容存在有说服力的结构需求时才调整,例如纵向时间线或横向流程图。所有图片应保持配色、线条处理、文字使用规则、人物表现方式和渲染细节一致。
优先生成不包含内嵌文字的图片。确实需要标签时,保持文字简短,并检查其可读性和准确性。不要依赖生成图片中的文字来呈现准确引语或密集数据。
4. 制定配图计划生成图片前,为每张拟议图片列出以下内容:
编号与文件名:两位序号加简洁的英文短名称,例如 01-concept-comparison;插入位置:明确的段落、标题或简短的原文定位文字;配图目的:图片能够带来的具体理解价值或叙事价值;视觉内容:主体、构图、关系和必要细节;风格与比例:选定的统一风格,比例通常为 4:3;与已有图片的关系:说明新图为什么是补充,而不是重复已有图片;alt 文本:用简洁中文描述图片中有意义的内容。如果用户只要求制定计划,展示计划后停止。否则继续执行,无须再次请求确认;但如果文章涉及敏感内容、目标读者不清楚到足以产生实质风险,或者图片生成可能产生异常费用,则应先确认。
5. 编写提示词并生成图片针对计划中每一项已确定的图片:
编写详细提示词,覆盖主体、构图、视觉层级、选定风格、配色、光照或线条处理、4:3 比例、需要排除的内容,以及与其他图片保持一致的要求。处理文件形式的文章时,将提示词保存为 imgs/prompts/NN-english-slug.md。对于仅在聊天中输出的内容,只有在对结果有帮助时才提供或保留提示词。调用当前可用的图像生成工具。如果生成失败,判断可能原因,简化或澄清提示词,然后自动重试一次。如果重试仍然失败,继续处理其余图片,并清楚说明失败项目;绝不插入无法打开的图片引用。将成功生成的图片保存为 imgs/NN-english-slug.png,除非目标文件格式会直接嵌入图片。涉及真实人物或敏感人物时,避免生成可能产生误导的写实照片。除非用户提供了合适的源图片并明确要求忠实编辑,否则使用明显属于插画、象征性或通用人物的表现方式。遵守适用的图像安全规则。
6. 插入新图但不替换已有图片默认保留所有已有图片及其位置。将新图片插入它所支持的段落之后,不要插在句子或列表中间。
对于 Markdown,使用英文半角括号,并在图片前后各留一个空行:
上一段正文。

下一段正文。使用中文 alt 文本说明图片中有用的内容。避免使用 图片1 或 文章配图 等模糊描述。不要把图片生成提示词直接当作 alt 文本。
对于 Word,将图片嵌入加入配图后的副本,使图片与目标段落保持关联,保留页边距和段落流,并在编辑工具支持时添加替代文字。使用统一的显示宽度,不要拉伸或裁切图片。
对于仅在聊天框中提供的文章,返回带有明确图片位置的修订版本。如果已有生成的图片文件,直接引用这些文件;否则使用清晰的图片位置标记,并与配图计划配套展示。
组织文件形式的输出对于 Markdown 或纯文本项目,默认使用以下结构:
article-folder/|– article-illustrated.md`– imgs/ |– prompts/ | |– 01-concept-comparison.md | `– 02-workflow-diagram.md |– 01-concept-comparison.png `– 02-workflow-diagram.png编辑源文件时,为副本添加清晰的后缀,例如 -illustrated。除非用户明确要求,否则绝不覆盖原文件。
检查最终结果交付前确认:
每张图片都有明确的内容目的;图片数量保持克制,插入位置与目标段落相符;已有图片和文章内容保持完整;所有新图片使用统一视觉体系,并符合预期的 4:3 比例;新图片没有重复附近文字或已有图片;文件名、提示词文件和图片引用一一对应;Markdown 图片路径可以正确解析,或者 Word 图片已经真正嵌入文档;中文 alt 文本简洁且信息明确;生成图片中的文字、人体结构、符号和事实细节没有明显缺陷;最终文章可以在目标格式中正常打开或渲染。简要报告所选风格、新增图片、输出位置,以及任何生成或格式限制。
styles.mdVisual Style OptionsChoose one primary style for an article. Preserve its palette, line language, level of detail, typography policy, and character treatment across all generated images.
Editorial flat illustration / 编辑扁平插画Clean geometric shapes, restrained palette, simplified people and objects, clear visual hierarchy. Best for general commentary, workplace, education, and lifestyle articles.
Minimal vector infographic / 极简矢量信息图Precise layout, icons, arrows, blocks, and limited labels. Best for comparisons, frameworks, taxonomies, and concise data relationships.
Technical schematic / 技术示意图Crisp lines, modular components, callouts, and spatial logic. Best for systems, architecture, engineering, software, and operational explanations.
Isometric diagram / 等距结构图Consistent isometric perspective with layered environments and connected components. Best for ecosystems, infrastructure, workflows, and spatial systems.
Hand-drawn explainer / 手绘讲解风Natural ink or pencil lines, simple annotations, approachable imperfections, light color washes. Best for teaching, brainstorming, and human-centered explanations.
Editorial collage / 编辑拼贴风Cut-paper forms, photographs or textures, bold composition, restrained surrealism. Best for culture, society, psychology, opinion, and conceptual tension.
Soft 3D illustration / 柔和三维插画Simple modeled forms, tactile materials, balanced lighting, moderate depth, uncluttered scenes. Best for products, digital services, innovation, and approachable technology.
Cinematic narrative illustration / 电影感叙事插画Strong scene composition, purposeful lighting, believable environments, and controlled emotion. Best for stories, history, case studies, and scene-based narratives.
Scientific or naturalistic illustration / 科学自然插画Accurate form, clear scale and structure, neutral background, disciplined color. Best for medicine, biology, nature, geography, and evidence-led education; verify factual details carefully.
Chinese contemporary illustration / 当代中式插画Modern composition informed by Chinese ink, printmaking, paper texture, or traditional color relationships without decorative pastiche. Best for Chinese culture, history, literature, festivals, and local narratives.
Selection rulesPrefer styles 2-4 for structural understanding and styles 5-8 for narrative or emotional context.Use style 9 only when accuracy can be checked against reliable source material.Use style 10 when cultural context is substantive, not merely as surface decoration.Avoid mixing photorealism with illustration unless the article’s visual identity explicitly calls for a controlled collage.Define a small palette with at least one neutral and one accent color; avoid a monotonous single-hue result.Default every image to 4:3 and keep a consistent framing density across the set.

