
Document Illustrator
Turn long articles or notes into a consistent set of cover and section illustrations without hand-designing each frame.
Overview
Document Illustrator is an agent skill most often used in Build (also Grow, Launch) that analyzes documents and generates styled cover and section illustrations via a guided 3-question workflow.
Install
npx skills add https://github.com/op7418/document-illustrator-skill --skill document-illustratorWhat is this skill?
- AI-driven topic extraction from Markdown, plain text, or other formats—no rigid heading schema required
- Three illustration styles: gradient glass cards, ticket style, and vector illustration
- Configurable 16:9 or 3:4 aspect ratios plus optional full-document cover image
- Interactive 3-step setup: ratio, cover yes/no, and recommended 3–10 content image count
- Runs Python via Bash after Read/Write/Glob to generate image files
- 3 illustration styles: gradient glass cards, ticket style, vector illustration
- 3 configuration questions: aspect ratio, cover image, and content image count (recommended 3–10)
Adoption & trust: 598 installs on skills.sh; 546 GitHub stars; 3/3 security scanners passed (skills.sh audits).
What problem does it solve?
You finished a strong written piece but lack time to manually illustrate every section for slides, posts, or README walkthroughs.
Who is it for?
Indie founders and technical writers who want repeatable doc-to-image batches with minimal design tooling.
Skip if: Teams that need brand-locked Figma components, print CMYK workflows, or fully automated publishing without confirming AI topic picks.
When should I use this skill?
User needs 配图, illustrations, or generated images for a document, article, or notes path.
What do I get? / Deliverables
You receive an approved topic outline plus generated images in your chosen ratio and style, saved alongside the source document path you provided.
- Topic and cover summary for user approval
- Generated illustration files in chosen aspect ratio and style
Recommended Skills
Journey fit
Spans multiple journey phases - primary shelf plus alternate fits below.
Docs is the primary shelf because the workflow starts by reading a document and producing visual assets that explain that document. docs subphase covers skills that improve READMEs, guides, and shipped documentation with richer media.
Where it fits
Add six section illustrations to a product README after the feature list is written.
Produce 3:4 vertical art from a newsletter draft for scheduled social posts.
Generate a cover plus chapter cards before publishing a launch story on multiple channels.
How it compares
Skill-based illustration pipeline, not a stock-photo MCP or a single-shot image API one-liner.
Common Questions / FAQ
Who is document-illustrator for?
Solo builders and creators who write in Markdown or plain text and want cohesive illustrations for docs, blogs, or decks.
When should I use document-illustrator?
During Build docs when polishing guides, during Grow content when turning essays into visual social assets, and during Launch distribution when you need shareable graphics from existing copy.
Is document-illustrator safe to install?
It uses Read, Write, Bash(python), and Glob; review the Security Audits panel on this Prism page and inspect any Python scripts before running them on sensitive documents.
SKILL.md
READMESKILL.md - Document Illustrator
# Document Illustrator Skill 基于 AI 智能分析的文档配图生成工具。无需依赖特定格式,自动理解内容并生成专业配图。 ## 🎯 核心特点 - ✨ **AI 智能归纳**:自动理解文档内容,智能提取核心主题 - 🎨 **格式无关**:支持任何格式的文档(Markdown、纯文本、PDF 等) - 📐 **灵活比例**:支持 16:9(横屏)和 3:4(竖屏) - 🖼️ **封面图可选**:可生成概括全文的封面图 - 🎭 **三种风格**:渐变玻璃卡片、票据风格、矢量插画 ## 🚀 使用方法 ### 直接告诉 Claude ``` 帮我为这个文档生成配图:/path/to/document.md ``` 或者: ``` 我想为这篇文章生成一些配图 ``` ## 📝 完整工作流程 ### 第 1 步:Claude 读取和理解文档 当你请求生成配图时,Claude 会: 1. 使用 Read 工具读取完整文档 2. AI 分析理解文档内容和结构 3. 识别核心主题和要点 **无需担心文档格式**: - ✅ 标准 Markdown(##、###) - ✅ 分隔线格式(======、------) - ✅ 纯文本段落 - ✅ 任何其他格式 ### 第 2 步:配置选项(3 个问题) Claude 会询问你的偏好: #### 问题 1:图片比例 ``` 请选择图片比例: 1. 16:9 (横屏) - 适合演示文稿、幻灯片、横屏展示 2. 3:4 (竖屏) - 适合社交媒体、手机查看、海报 请选择 (1/2): ``` #### 问题 2:封面图 ``` 是否生成封面图? 封面图将概括文档的所有核心信息,作为系列配图的引导。 1. 是 - 生成封面图 + 内容配图 2. 否 - 仅生成内容配图 请选择 (1/2): ``` #### 问题 3:内容配图数量 ``` 期望生成多少张内容配图? 建议范围:3-10 张 根据文档内容,推荐生成 6 张 请输入数字: ``` ### 第 3 步:Claude 归纳内容并展示 根据你指定的数量,Claude 会智能归纳文档,然后展示给你确认: ``` 📋 内容归纳完成 📄 封面图内容:(如果选择生成) "AI 编程工具概念演化:从 Rules 到 Skills" - 核心概念:静态上下文 vs 动态上下文 - 演化路径:Rules → Commands → MCP → Modes → Skills - 最佳实践:简化为两个核心工具 📚 内容配图(共 6 张): 1. Rules 的诞生与演化 包含:早期模型幻觉问题、rules 文件的作用、静态上下文概念 2. Commands 和工作流打包 包含:固定工作流的出现、slash command、团队分享 3. MCP Servers 带来动态能力 包含:第三方工具集成、OAuth 认证、上下文膨胀问题 4. Modes 和 Subagents 的登场 包含:人设提示词、系统提示词修改、可靠性设计、Hooks 确定性 5. Skills 统一动态上下文 包含:Skills 概念、动态加载、编程工具优化 6. 最佳实践与未来展望 包含:Rules 使用建议、Skills 探索、核心理念总结 ✓ 所有内容已覆盖,无遗漏 确认开始生成配图吗?(Y/N) ``` **关键保证**: - ✅ 内容完整:所有重要信息都会被归入某张图片 - ✅ 逻辑清晰:按照内容的自然逻辑分段 - ✅ 用户可控:展示归纳结果,等待用户确认 ### 第 4 步:生成配图 确认后,Claude 调用 Python 脚本生成图片: ``` 🖼️ 开始生成配图... 正在生成封面图... ✓ 已保存: /path/to/document/images/cover.png 正在生成第 1/6 张... 标题: Rules 的诞生与演化 ✓ 已保存: /path/to/document/images/illustration-01.png 正在生成第 2/6 张... 标题: Commands 和工作流打包 ✓ 已保存: /path/to/document/images/illustration-02.png ... ✨ 完成!共生成 7 张配图(1 张封面 + 6 张内容) ``` ### 第 5 步:输出结果 **输出位置**:文档所在目录下的 `images/` 文件夹 ``` /path/to/your/document/ └── images/ ├── cover.png # 封面图(如果选择生成) ├── illustration-01.png # 第 1 张内容配图 ├── illustration-02.png # 第 2 张内容配图 ├── illustration-03.png ├── illustration-04.png ├── illustration-05.png └── illustration-06.png ``` ## 🎨 三种风格说明 ### 1. 渐变玻璃卡片风格 (gradient-glass) **特点**: - Apple Keynote 风格的极简主义 - 玻璃拟态(Glassmorphism)设计 - 深邃虚空黑或纯净陶瓷白基底 - 流动的极光渐变色 - 3D 玻璃物体和发光效果 **适用场景**: - 科技产品介绍 - 数据分析报告 - 未来趋势展望 - 产品功能演示 ### 2. 票据风格 (ticket) **特点**: - 数字极简票券设计 - 高度对比的黑白配色 - 类似登机牌、门票的结构 - 精确的几何分区 - 中英混排,多向文字布局 **适用场景**: - 信息图表 - 统计数据展示 - 时间线和流程图 - 要点总结 ### 3. 矢量插画风格 (vector-illustration) **特点**: - 扁平化矢量插画 - 统一粗细的黑色轮廓线 - 复古柔和的配色 - 几何化处理 - 横向全景式构图 **适用场景**: - 故事叙述 - 概念解释 - 教育内容 - 品牌宣传 ## 💡 使用示例 ### 示例 1:完整流程 ``` 用户: 帮我为 ~/blog/ai-tools.md 生成配图,用票据风格 Claude: 好的,让我先读取这个文档... [读取文档,分析内容] 检测到文档长度约 3000 字,内容涉及 AI 工具演化。 请选择图片比例: 1. 16:9 (横屏) 2. 3:4 (竖屏) 用户: 1 Claude: 是否生成封面图? 1. 是 2. 否 用户: 是 Claude: 期望生成多少张内容配图? 建议范围:3-10 张 根据文档内容,推荐生成 5 张 用户: 5 Claude: [展示归纳的 5 个主题] 确认开始生成配图吗? 用户: Y Claude: [调用 Python 脚本生成 6 张图片] ✨ 完成!配图已保存到 ~/blog/images/ ``` ### 示例 2:纯文本文档 ``` 用户: 为这个纯文本笔记生成配图 Claude: [读取笔记,即使没有任何标题也能理解内容] [智能识别 3 个核心主题] [询问配置、展示归纳、生成配图] ``` ### 示例 3:自定义数量 ``` 用户: 我想要 8 张图,竖屏的,不要封面 Claude: 好的,16:9 竖屏,不生成封面,8 张内容配图。 [将文档归纳为 8 个主题] [展示归纳结果,用户确认后生成] ``` ## 🔧 技术细节 ### 图片规格 | 比例 | 分辨率 | 适用场景 | |------|--------|----------| | 16:9 | 2560x1440 (2K) | 演示文稿、横屏展示 | | 3:4 | 1920x2560 | 社交媒体、竖屏查看 | 可选 4K 分辨率: - 16:9 → 3840x2160 - 3:4 → 2880x3840 ### API 调用 - **模型**:Gemini 2.0 Flash Image Preview (Nano Banana Pro) - **成本**:每