MoreRSS

site iconchenshake | 陈沙克修改

技术、AI、留学。
请复制 RSS 到你的阅读器,或快速订阅到 :

Inoreader Feedly Follow Feedbin Local Reader

chenshake | 陈沙克的 RSS 预览

WSL2 安装 Claude Code OpenClaw Hermes-Agent

2026-05-16 08:00:00

发现使用笔记软件,也是会导致版本太多,导致经常自己查看都很不方便。记忆感觉确实因为AI,在逐步变差,唯一的办法,就是停下来,整理文章。

文章内容笔记里,公众号,不同的内容混杂一次。我需要整理一个适合我使用的版本。

WSL 2

对于 Windows 资深用户来说,无论是安装 OpenClaw 还是 Claude Code,WSL2 (Windows Subsystem for Linux) 都是官方推荐且唯一的“最优解”。

微软其实应该2024年,才算彻底解决WSL2的各种技术问题。用最新版本,可以避免很多麻烦。

确认WSl 2正常

遇到过安装所谓的精简win11,导致WSL2给精简的案例。确保win11,是2024后到版本

1
2
3
4
5
6
7
8
## Powershell admin 运行

# 检查版本信息
wsl --version

# 强制更新至最新版本
wsl --update

开启“镜像网络”模式 (Critical)

这是 Windows 用户避坑的最关键一步。默认的 WSL 网络是 NAT 模式,在处理代理、本地浏览器通讯(OpenClaw 核心需求)时极其痛苦。镜像模式 (Mirrored) 能让 Linux 直接共享 Windows 的 IP 和网络配置。

  1. 打开资源管理器,进入当前用户目录:C:\Users<你的用户名>\。
  2. 新建文件:.wslconfig (注意文件名前有小数点)。
  3. 写入以下配置:
1
2
3
4
[wsl2]
# 开启镜像网络模式
networkingMode=mirrored

WSL 常用命令

WSL启动的虚拟机,有点类似容器,你是无法在虚拟机关机,必须在Powershell里才能关机,习惯就好,差异不多。

1
2
3
4
5
6
7
8
9
10
## 关机
wsl --terminate Ubuntu-24.04


# 注销原系统:
wsl --unregister Ubuntu-24.04

# 导入到新位置:
wsl --import Ubuntu-24.04 D:\WSL\Ubuntu-24.04 D:\backups\ubuntu-24.04-snapshot-claude-20260410.tar

安装Ubuntu 24.04

1
2
3
4
5
6
7
# 查看可用分发版本
wsl --list --online
# 安装 Ubuntu 24.04
wsl --install -d Ubuntu-24.04

# 安装过程中会提示输入 Unix 用户名 和 密码(建议记住,后续 sudo 命令需要使用)。我的用户名:shake

装完系统后,关闭powershell。因为这个时候,你运行 wsl命令,是不管用的。

启动Ubutnu

windows 搜索 Ubuntu 24.04,看到图标,点击就可以打开一个Ubuntu 24.04.

sudo vi /etc/wsl.conf

1
2
3
4
[boot]
systemd=true
[user]
default=shake

配置 default 用户,可防止后续导出恢复后默认以 root 登录。

sudo无密码

1
echo "$USER ALL=(ALL) NOPASSWD: ALL" | sudo tee /etc/sudoers.d/$USER

更新

1
2
3
4
sudo apt update -y
sudo apt upgrade -y
sudo apt install unzip jq tree -y

WSL存储移动到D盘

重新打开Power shell

1
2
3
4
5
6
7
8
9
10
11
12
13
# 关闭并注销(在 PowerShell 运行):
wsl --terminate Ubuntu-24.04

# 导出快照(建议在 D 盘创建 backups 文件夹)
wsl --export Ubuntu-24.04 D:\backups\ubuntu-24.04-init.tar

# 注销原系统:
wsl --unregister Ubuntu-24.04

# 导入到新位置:(建议在 D 盘创建 WSL 文件夹)
# 格式:wsl --import <分发名> <安装位置> <备份文件路径>
wsl --import Ubuntu-24.04 D:\WSL\Ubuntu-24.04 D:\backups\ubuntu-24.04-init.tar

windows,搜索Ubuntu 24.04,就可以再次启动Ubuntu 24.04.

虚拟机持续运行

默认情况下,关闭终端窗口会导致 WSL 挂起,且 Windows 重启后服务无法自启。我们要实现“开机即后台运行”。

Ubuntu 虚拟机里,创建一个脚本:wsl-autostart.sh

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
sudo tee ~/wsl-autostart.sh > /dev/null << 'EOF'
#!/bin/bash

# ==========================================
# 脚本名称: wsl-autostart.sh
# 适用场景: 通用 WSL 2 持久化后台运行
# ==========================================

# 1. 自动获取当前用户和家目录
USER_NAME=$(whoami)
USER_HOME=$(eval echo ~$USER_NAME)
LOG_FILE="$USER_HOME/wsl-session.log"

# 2. 记录启动时间(用于排查开机自启是否触发)
echo "[$(date '+%Y-%m-%d %H:%M:%S')] WSL Session Started for $USER_NAME" >> "$LOG_FILE"


# 4. 【核心指令】防止 WSL 闲置关闭
# tail -f /dev/null 是最轻量的占座方式,不消耗 CPU 但能维持进程活跃
echo "Keep-alive process (tail) started." >> "$LOG_FILE"
tail -f /dev/null
EOF

授权

1
sudo chmod +x ~/wsl-autostart.sh

设置 Windows 任务计划程序

按下 Win + R,输入 taskschd.msc。

1
2
3
4
5
6
7
#创建任务(非基本任务):  
  ○ 常规:名称设为 wsl-autostart;勾选“不管用户是否登录都要运行”;勾选“使用最高权限运行”。  
  ○ 触发器:新建 -> 选择“启动时”;高级设置勾选“延迟任务运行 1 分钟”。  
  ○ 操作:新建 -> 程序:wsl;参数:-d Ubuntu-24.04 -u <你的用户名> -e /home/<你的用户名>/wsl-autostart.sh。  
  ○ 设置:取消勾选“只有在计算机使用交流电源时才启动此任务”;取消勾选“如果任务运行时间超过以下时间则停止”。
#  确定并输入 Windows 登录密码。

初始化Ubuntu

因为是给Claude code,OpenClaw,Hermes agent使用,所以为了方便,先安装基本必须工具。

nodejs

OpenClaw需要用到,官方推荐24的版本,最低版本要求是,skill很多都需要。

1
2
3
4
5
6
7
curl -fsSL https://deb.nodesource.com/setup_24.x | sudo -E bash -
sudo apt install nodejs -y

## 验证
node --version
npm --version

bun

1
2
3
4
5
# 安装bun
curl -fsSL https://bun.sh/install | bash

source .bashrc
bun --version

uv

1
2
3
4
5
curl -LsSf https://astral.sh/uv/install.sh | sh

 source $HOME/.local/bin/env
 uv --version

brew

1
/bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh)"

设置环境变量

1
2
3
4
echo >> /home/shake/.bashrc
echo 'eval "$(/home/linuxbrew/.linuxbrew/bin/brew shellenv bash)"' >> /home/shake/.bashrc
eval "$(/home/linuxbrew/.linuxbrew/bin/brew shellenv bash)"

安装环境需要包

1
sudo apt-get install build-essential -y

Claude Code

用curl,一行命令就完成安装

1
curl -fsSL https://claude.ai/install.sh | bash

查看目录

1
2
3
ls -la ~/.claude
backups  cache  downloads

启动Claude code 前

需要对Claude code进行基本的初始化设置

  • 全局的CLAUDE.md 文件
  • 配置使用的模型,~/.claude/settings.json
  • 设置快捷键,提升效率,修改 .bashrc
  • 创建两个项目文件夹:project-writer,devops,不同的工作,不同的文件夹下操作
  • 给两个项目文件夹,创建项目的CLAUDE.md 文件,开发和写作,有区别的。
  • 创建 ./claude/knowledge 目录, 存放相关内容。

claude 文件夹

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
~/.claude/
 ├── CLAUDE.md           ← 主记忆(目录索引)
 ├── commands/           ← 自定义命令
 └── knowledge/          ← 知识库文件夹
     ├── CLAUDE.md       ← 知识库索引
     ├── credentials/    ← 凭证(API 密钥)
     ├── guides/         ← 方法指南
     ├── setups/         ← 安装配置
     └── standards/      ← 规范标准
     └── library/        ← 知识文档
├──project-writer/
     ├── CLAUDE.md   
└──devops/
     ├── CLAUDE.md   
     

我已经把文件都准备好,从windows 复制过来就可以。Ubuntu复制windows的文件的玩法,需要熟悉一下。

1
2
3
4
5
6
cp -r /mnt/d/share ~/
cp -r ./share/claude/* ./.claude/
cp ./share/.bashrc ./
cp -r share/project-writer/ ./
cp -r share/devops/ ./
source ~/.bashrc

启动Claude code

进入devops 文件夹,启动claude code,已经设置快捷键:cc

Statusline

1
 @ ~/.claude/knowledge/setups/statusline-installation.md 安装statusline

hooks

1
 @ ~/.claude/knowledge/setups/hooks-installation.md 安装 Hooks

MCP

1
2
 @ ~/.claude/knowledge/setups/mcp-installation.md 安装MCP,确保MCP服务运行正常。
 密钥在~/.claude/knowledge/credentials

minimax cli

minimax官方推荐cli工具替代MCP。所以按照CLI。通过skill 来调用生图,看图等功能。

1
 @ ~/.claude/knowledge/setups/minimax-cli-installation.md 安装,验证生图,识别图片功能正常。

终端

对于Claude code来说,要体验更好,需要增加一个终端,目前主流的是2个

  • vscode
  • Warp

目前我使用Warp,后续打算换成vscode,验证编程的功能,更加方便。windows vscode,可以很方便直接连接到WSL环境的Claude code。

OpenClaw

有了上面的准备,安装OpenClaw就很简单了。

  • 手工安装,基本一条命令就完成,启动配置过程。输入相关内容就可以
  • 全自动:利用claude code,给他一份MD文档,让他帮你安装。
  • 半自动:手工执行安装脚本。完成基本配置。剩下优化交给claude code。这是最高效的。

配置交给Claude code的好处就是有什么错误,Claude code,自己解决。

安装

1
sudo curl -fsSL https://openclaw.ai/install.sh | bash -s -- --no-onboard

卸载

1
2
3
4
5
6
7
8
9
10
openclaw uninstall --all --yes

# remove cli
npm rm -g openclaw

# remove systemd
systemctl --user disable --now openclaw-gateway.service
rm -f ~/.config/systemd/user/openclaw-gateway.service
systemctl --user daemon-reload

删除配置

1
2
3
rm ~/.openclaw/openclaw.json
rm -rf ~/.openclaw/agents/main/sessions
rm -rf ~/.openclaw/workspace

手工配置

CC 有记忆

后续的操作,都改成Claude code进行,这个会写入CLAUDE.md 文件,这样后续配置和排错,更加方便。

1
2
3
4
请你记下来:
* openclaw 目录是~/.openclaw ,
* OpenClaw github仓库:https://github.com/openclaw/openclaw
* 官方文档:https://docs.openclaw.ai/

使用

```

3个月AI学习总结

2026-05-16 08:00:00

三月份,受到OpenClaw的影响,决定全部时间投入去搞OpenClaw,搞清楚这个AI agent怎么玩。没想到。这3个月经历,有点魔幻。

深入投入去折腾的东西,真不少。确实很多项目的相通的。都是差不多。

  • N8N
  • Claude code
  • CodeX
  • OpenClaw
  • Hermes agent
  • Antigravity 2.0
  • OpenDesign

期待未来3个月,上面这些工具,我能玩的很熟手。

N8N

以前有报名一个自动化工具班,学习make,后面的N8N,就没有跟上。这次利用这次,把N8N补上。

理解的课程里的几个视频,1年前的n8n课程,今天看来,有些已经过时。不错对我来说,还是有收获,毕竟自己动手,实现解决自己的问题的工作流。

日常我经常把youtube的视频,直接发给gemini分析,看看总结就可以。几十分钟的视频内容,很难有那么多时间去看。慢慢就基本集中到几个博主上,订阅这几个博主的视频更新,发给Gemini 总结就可以。

Gemini这次5月份发布,至少看到的一个明显变化,分析youtube的视频,基本是秒杀。不需要任何的时间等待。我通过n8n的工作流。获取频道的更新,视频链接,利用api,发送链接给gemini lite分析,效果还是不错。

这个基本是gemini的免费额度就够用。你一天分析10个视频,对gemini来说,好像不是什么事情。

目前已经可以实现多个频道合并,24小时内更新的内容,早上九点发给我,一个视频,一封邮件。格式非常漂亮。这次自己对自己好一点。

手头上有minimax的token plan,支持生图。刚好验证了一下。搞了一个n8n工作流,各种风格,生图。效果还行。

我折腾过N8N 生视频,成本有点不可能承受。1秒的视频,少的0.1美元,贵的,1美元。基本很难支撑。我充值10美金,选择最便宜的视频模型,仅仅完成工作流验证,10美金就没了。

Claude code

这个过去1年,技术圈非常狂热。一个命令行的东西,居然能那么时髦。确实是很难得。导致很多不会编程的用户,都开始用vscode。可见狂热程度。

我其实比较取巧,开始折腾的时候,已经支持第三方的api,我使用Minimax的 token plan,来验证Claude code的使用。

用claude code,写代码。折腾写文章。幸好自己3年前,开始折腾Mrakdown,所以对这些MD,没啥障碍。

用claude code,感觉最有意义,实际价值,估计是配置OpenClaw,优化OpenClaw,把OpenClaw,配置的更加安全,所有的api key,都存放在env,不放在配置文件。这样的苦活,累活,交给Claude code来完成。

其实在这方面,我没有感觉minimax的模型能力,比claude差多少。我没怎么用过Claude。仅仅是感觉minimax,可以满足我的要求,听懂我指令,去干活。

OpenClaw

这个其实从安装开始折腾,WSL2,装了无数遍。非常熟悉。对接飞书和telegram。其实熟悉了,就是skill的使用。

OpenClaw,确实当时也是给人眼前一亮。我还自己开发的了一个skill,是使用Codex,开发了一个epub格式转换pdf。体验了一下skill开发,是这么简单。最后codex,顺利把这个skill代码推送到github。

确实感受到,让模型,agent干活的快乐。以前很多事情,不熟练,每次操作,都需要查,现在好了。让agent干活就可以。

外面所谓的著名的10大agent 开公司的配置玩法,我也是对着文档跑了一遍。才知道吹牛的,有多么夸张。学到不少东西,看到的都是浮夸。

我是对接Discord,账号三天都搞不定,最后还是咸鱼,5块钱解决。人生第一次花钱买账号。账号需要养。

最终我用OpenClaw,就是上传公众号,套用格式。这个工作,skill的活。Claude code,OpenClaw,Hermes agent,都可以做。

Hermes agent

其实这个就没啥特别,和OpenClaw,基本一样的。很多人吹的所谓自我进化,都是经不起推敲。不给也是有不错的地方。我尝试hermes 配置 hermes,发现bug,去github提交bug,提交成功,并且项目负责人,给了一个高优先级。

hermes agent的神秘感其实没太强,配置记忆,经历的OpenClaw,这些都简单。

尝试通过Claude code,进行OpenClaw,Hermes agent的安装和配置。这也是没有问题。基本可以安装要求完成,并且可以形成文档。有时间,反复多次。就差不多。真的可以做到agent装agent。

CodeX

因为有订阅,但是家人使用,我很少折腾,最近一个月,Codex,非常火爆。我也是顺便折腾一下,非常惊艳。其实就是昨天开始折腾。

装上Hyperframes skill,直接可以生成视频。甚至都没有成本。这个对我来说,非常震撼。对于折腾了很久n8n的视频的人来说,是一个很大的变化。

昨天把第一个Hyperframes的视频,上传公众号,还获得了不错的流量。也算是找到一个视频制作的突破口。

Open Design

其实我也是打算折腾一下,实现做网页自由。可惜,不知道是minimax的问题,还是我的问题,我折腾几次,都没成功。后续慢慢折腾吧。

Antigravity 2.0

这个其实是google出品,我也今天才装起来。折腾,其实是为了看对Hyperframe的表现如何。这点切实和OpenAI有差距。

Image-2

这个也是我过去3个月遇到比较震撼的,生图。确实是保持了图片的一致性。修复旧照片,我已经无法看出区别了。

N8N HTTP Request cURL倒入的坑

2026-05-14 08:00:00

N8N的HTTP Request 节点,有一个功能,通过cURL倒入,非常方便,对于非程序员来说,友好很多,但是有两个坑,需要注意一下。

  • curl倒入,代码没有嵌套,N8N,使用field,如果代码有嵌套,使用JSON,
  • 使用field,有的字段会出现问题。下面解析。

尽量避免使用filed,手工使用JSON

Minimax 生图

一个手动出发器,连接一个 HTTP Request 节点,就可以实现。问题就是HTTP Request 节点如何设置

打开Minimax的文档中心,API参考

文生图

可以看到右边有一个curl 例子,非常实用,直接copy就可以。填入自己的key。key一定要注意,前面有Bearer

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
curl --request POST \
  --url https://api.minimaxi.com/v1/image_generation \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: application/json' \
  --data '
{
  "model": "image-01",
  "prompt": "A man in a white t-shirt, full-body, standing front view, outdoors, with the Venice Beach sign in the background, Los Angeles. Fashion photography in 90s documentary style, film grain, photorealistic.",
  "aspect_ratio": "16:9",
  "response_format": "url",
  "n": 3,
  "prompt_optimizer": true
}
'

n8n里打开HTTP Request节点,选择 import cURL,将上面内容贴入。建议你先在文本里,输入自己的key,再倒入。

 HTTP Request 节点

倒入参数后,结果你发现点击执行,出错。这时候就郁闷。

方法1

修改参数,原因是因为

错误原因

调整完成就正常。

方法2

把 Using Fields Below,改成 Using JSON,输入下面内容

1
2
3
4
5
6
7
8
9
{
  "model": "image-01",
  "prompt": "A man in a white t-shirt, full-body, standing front view, outdoors, with the Venice Beach sign in the background, Los Angeles. Fashion photography in 90s documentary style, film grain, photorealistic.",
  "aspect_ratio": "16:9",
  "response_format": "url",
  "n": 3,
  "prompt_optimizer": true
}

填入你的key,都可以工作正常。

参考

阿里云百炼的模型,curl,是嵌套,倒入直接using JSON

阿里百炼平台

Hugging Face Spaces 容器部署 n8n + MinIO + NCA

2026-05-10 08:00:00

在有AI协助的年代,部署,安装一个应用,应该是很简单的事情。但是有时候的组合是你第一个的时候,需要踩坑,还是非常多。估计这个是我最近花时间最做的填坑的经历。

我自己的空间,可以直接使用。

什么是 Hugging Face Spaces?

Hugging Face(社区简称 HF)是全球知名的 AI 开源社区。其推出的 Spaces 功能,为开发者提供了一站式的模型部署与演示平台,让创意快速落地、成果轻松分享。


免费算力资源,开箱即用

  • 配置规格:4 核 CPU / 16GB 内存 / 1GB 存储(免费层级)
  • 零门槛启动:无需配置服务器,上传代码即可运行
  • 适合场景:学习实践、原型验证、小型应用部署

海量示例,一键复用

  • 浏览社区中丰富的 Spaces 项目,涵盖文本、图像、音频等多模态应用
  • 支持「Duplicate Space」一键复制,快速基于他人项目二次开发
  • 降低试错成本,加速学习与创新迭代

自带域名 + HTTPS,解决访问痛点

  • 每个 Space 自动分配 *.hf.space 专属域名
  • 默认启用 HTTPS 加密,满足现代浏览器安全策略
  • 无缝集成 Docker/Gradio/Streamlit 等框架,免去反向代理与证书配置烦恼

复制项目

例如访问我的项目:n8n

选择 Duplicate this Space

复制repo

N8N+Supabase

HF Space上搭建N8N,需要解决的问题就是存储问题。目前其实HF提供Bucket 存储给Docker使用,可以解决很多问题。这次还是使用的外部的数据库的方式来解决。

Supabase,是一家PG数据库开源厂商,非常火爆,现在开源的一个玩法,就是提供一个SaaS服务。这个SaaS服务,有免费的版本,可以满足N8N需求。

参考视频 n8n 上雲端只能付費?打造免費雲端主機終極指南含永不休眠祕訣

视频介绍了全过程。了解一下原理就可以,有更加简单的版本,就是这Space,搜索N8N,看到相同的的部署,直接复制过来。唯一的小门槛就是填写环境变量。

Spaces 搜索:N8N,你会看到点赞最多的,就一个,很好选择

点赞最多,推荐

N8N,这样就基本搞定.

1
2
3
4
5
6
7
8
9
10
11
# HF有两个地址,需要区分

# 项目地址
# 项目访问地址:http://huggingface.co/spaces/(用户名)/(创建应用空间名字)
https://huggingface.co/spaces/chenshake/n8n

# 部署应用的访问地址,
# 对于n8n来说,这是控制台地址,登陆就可以,n8n,只需要一个访问端口就可以,比较简单。
# 应用访问地址:https://(用户名)-(spaces 创建应用空间名字).hf.space
https://chenshake-n8n.hf.space

健康检查

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
curl -I https://chenshake-n8n.hf.space

# 输出内容
HTTP/2 200
date: Sun, 10 May 2026 12:08:45 GMT
content-type: text/html; charset=utf-8
content-length: 16993
accept-ranges: bytes
cache-control: public, max-age=0
last-modified: Fri, 01 May 2026 16:43:13 GMT
etag: W/"4261-19de46c42dd"
vary: Accept-Encoding
vary: origin, access-control-request-method, access-control-request-headers
x-proxied-host: http://10.111.121.71
x-proxied-replica: upr4qe74-ls49x
x-proxied-path: /
link: <https://huggingface.co/spaces/chenshake/n8n>;rel="canonical"
x-request-id: oZM_Fr
access-control-allow-credentials: true

环境变量设置

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
## Space secrets

# Supaabse 创建数据库的密码

DB_POSTGRESDB_PASSWORD

# Supaabse 用户

DB_POSTGRESDB_USER

# 这是N8N用来加密代码,你只需要输入你的密码就可以。
N8N_ENCRYPTION_KEY

# 这是上面视频使用的参数,做健康检查使用,其实健康检查是不需要验证, 任意填写或者删掉
N8N_BASIC_AUTH_USER
N8N_BASIC_AUTH_PASSWORD

## Space variables,根据自己情况调整

# 默认:Asia/Shanghai

GENERIC_TIMEZONE

# TZ,默认:Asia/Shanghai

TZ

# 只能是pg:postgresdb
DB_TYPE

# 默认:public,无需更改

DB_POSTGRESDB_SCHEMA

# 这个需要根据你在Supabase cloud创建的地址

* DB_POSTGRESDB_HOST
* DB_POSTGRESDB_PORT


# n8n 端口,7860,无需更改,不要改,因为这个端口需要和repo的README.md 对应

N8N_PORT

# https,这就是HF spaces优势,提供https

N8N_PROTOCOL

# 3个地址相同,https://(username)-(project name).hf.space,https://chenshake-n8n.hf.space

* N8N_EDITOR_BASE_URL
* WEBHOOK_URL
* N8N_HOST

# 默认:false

N8N_ENFORCE_SETTINGS_FILE_PERMISSIONS

# 默认: true

NOTION_MARKDOWN_CONVERSION

# 默认: 0,
NODE_TLS_REJECT_UNAUTHORIZED

# 默认: true

# 默认 72,我理解是72小时,3天,就是一个工作流,最长运行时间

EXECUTIONS_DATA_MAX_AGE

# 默认:all,保持错误日志

EXECUTIONS_DATA_SAVE_ON_ERROR

# 默认:none,成功的日志不保留

EXECUTIONS_DATA_SAVE_ON_SUCCESS



Minio

我是部署NCA的过程,发现绕不过S3存储,代码要求不能使用本地存储,只能使用S3兼容或者google 存储。所以就必须先解决NCA存储的问题。

minio在space上的搜索,数量不多。还是非常多坑。

  • minio,需要2个端口,一个后台,一个api。但是HF,只能有一个入口,所以必须用nginx
  • 官方镜像是一个精简的版本。你必须使用红帽打包的镜像才行:quay.io/minio/minio
1
2
3
4
5
6
7
8
9
# HF有两个地址,需要区分

# 项目地址
https://huggingface.co/spaces/chenshake/minio

# 部署后的地址,对于minio来说,这是控制台地址,也是api地址,无需端口

https://chenshake-minio.hf.space/

登陆minio 控制它,创建一个bucket:nca-toolkit,设置public。这是后续需要使用。

Minio 健康检查

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
curl -I https://chenshake-minio.hf.space/minio/health/live

# 输出内容
HTTP/2 200
date: Sun, 10 May 2026 12:07:59 GMT
content-length: 0
server: nginx/1.22.1
x-xss-protection: 1; mode=block
accept-ranges: bytes
strict-transport-security: max-age=31536000; includeSubDomains
vary: Origin
vary: origin, access-control-request-method, access-control-request-headers
x-amz-id-2: dd9025bab4ad464b049177c95eb6ebf374d3b3fd1af9251148b658df7ac2e3e8
x-amz-request-id: 18AE32E926A7B6F5
x-content-type-options: nosniff
x-proxied-host: http://10.111.137.195
x-proxied-replica: u1n1lngi-27lb7
x-proxied-path: /minio/health/live
link: <https://huggingface.co/spaces/chenshake/minio>;rel="canonical"
x-request-id: wJT4nf
access-control-allow-credentials: true

环境变量

1
2
3
4
5
6
7
8
9
10
11
# Space secrets

## MINIO_ROOT_PASSWORD, 就是登陆的密码。用户名:admin,dockerfile,可以看到。这里输入你自己的密码

MINIO_ROOT_PASSWORD

Space variables

# MINIO_BROWSER_REDIRECT_URL很关键,通过nginx设置实现,必须填写:https://chenshake-minio.hf.space/browser/,根据自己情况修改
MINIO_BROWSER_REDIRECT_URL

备注

我定制了一个html页面,为了优化体验。如果你使用,估计需要修改页面的一个链接地址。

NCA (no-code-architects-toolkit)

No-Code Architects Toolkit 是一款100%免费的开源API工具(Python/Flask构建),提供音频转录、视频字幕、媒体格式转换、云存储管理等媒体处理功能,支持Docker一键部署,可替代Whisper、CloudConvert等付费服务,适合无代码开发者与自动化团队使用。

  • Spaces搜索,发现就只有一个,使用官方镜像,这是大坑,官方镜像是一个精简版,无法使用
  • 镜像上需要自己使用官方代码,build镜像才行
  • 把代码git到本地,上传HF,发现HF对小文件,图片,要求必须用LFS,
  • 使用官方代码里的Dockerfile,还需要修改:README.md, 这个是HF特点,通过README.md 进行端口设置
  • app.py 加入健康检查的路由和一个简单的优化显示

健康检查

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
curl -I https://chenshake-no-code-architects-toolkit.hf.space/health

## 输出内容
HTTP/2 200
date: Sun, 10 May 2026 12:07:02 GMT
content-type: text/html; charset=utf-8
content-length: 2
server: gunicorn
x-proxied-host: http://10.111.132.104
x-proxied-replica: dipl8pwj-vc7nj
x-proxied-path: /health
link: <https://huggingface.co/spaces/chenshake/no-code-architects-toolkit>;rel="canonical"
x-request-id: QzRKug
vary: origin, access-control-request-method, access-control-request-headers
access-control-allow-credentials: true

环境变量设置

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
## Space secrets

# API KEY,其实是NCA访问密码,Space secrets,设置你自己个人密码就可以

API_KEY

# Minio的 access key,这个登陆mino后台,创建就可以

S3_ACCESS_KEY

# Minio的密钥,填入就可以。

S3_SECRET_KEY

## Space variables,都会有默认数值,

# api请求地址,已经经过nginx的代理,调整成你自己就可以:https://chenshake-minio.hf.space

S3_ENDPOINT_URL

# 这个是需要在minio,创建一个bucket nca-toolkit,设置public,才行
S3_BUCKET_NAME

# Region,是为了兼容s3,照抄就可以:us-east-1
S3_REGION

#直接默认 /tmp
LOCAL_STORAGE_PATH

# 并发数量,为了避免内存爆,数字:2,比较保险。
GUNICORN_WORKERS

NotebookLM PPT 提示词

2026-01-11 08:00:00

用AI做PPT,我也算是熟手,以前使用天工,做出很炫酷的PPT。不过这次折腾NotebookLM的ppt,倒是比较费劲。看了一堆的视频,还是没解决自己要做ppt,如何下手。

今天总算摸出了一点门道,记录一下。我已经使用教师风格,乔波斯风格,游戏风格(我的世界)生成的PPT。

NotebookLM,在slide,编辑,填入提示词就可以。

传统风格提示词

通过下面提示词,其实是针对不同的场景,你根据自己的需求来选择就可以。

下面的提示词,有5种的使用场景

  • 企业
  • 儿童
  • 漫画
  • 教育
  • 游戏

相同的内容,你可以使用下面5种风格的提示词。如果你想更换风格,

  • 游戏(提示词5),我想改成我的世界,那么把提示词发给AI,让他改成游戏我的世界就可以。
  • 教育的内容,就使用提示词4,非常不错。背景就是黑板
1
2
3
4
5
6
7
8
9
10
11
12
13
14
【提示詞 1|高品質企業質感簡報】(企业)
創建一個高品質的抽象背景簡報,使用深藍色和金屬金色漸層作為主色調,融入微妙的幾何箭頭紋理來增加視覺深度,添加磨砂玻璃覆蓋層以營造半透明的現代感,右側設計深負空間來平衡布局,提供電影般的燈光效果,包括柔和的陰影和高光,讓整體呈現時尚企業美學,支持高解析度輸出,採用最小主義設計原則,避免過多元素,每張幻燈片保持乾淨簡潔,比例為 16:9,適合橫向投影,並確保文字與圖形完美對齊。

【提示詞 2|黏土定格動畫風簡報】(儿童)
創建一個完整的黏土定格動畫風格簡報,讓每張幻燈片呈現活潑的黏土模型效果,包括色彩豐富的黏土材質(如紅、藍、綠等鮮豔顏色)、生動的角色或元素(如跳躍、旋轉或變形的靜態姿態),背景使用柔軟的黏土紋理,文字以手捏黏土字體呈現,每頁包含小靜態序列來解釋內容,確保整體風格可愛且互動性強,支持高解析度輸出。

【提示詞 3|漫畫敘事風簡報】(漫画)
創建一個完整的漫畫風格簡報,使用白色背景與黑色文字作為基底,每頁以現代日本漫畫風格解釋內容,包括多格漫畫面板布局、角色對話泡泡(圓形或雲形)、動感線條(如速度線或爆發效果)與表情符號(如汗珠或星星),讓敘述更具故事性,顏色使用鮮豔調色板(紅、藍、黃為輔助色),每張幻燈片設計為連續故事流,支持高解析度輸出,並確保圖文比例平衡避免擁擠。

【提示詞 4|黑板教學風簡報】(老师)
創建一個深綠色黑板風格的完整簡報,使用白色、黃色與粉紅色的手寫粉筆文字,模擬真實教室黑板效果,包括輕微擦拭痕跡、隨意塗鴉元素(箭頭、圈圈)與簡單圖示(星星、勾號),背景紋理模仿粉筆灰塵,文字大小具層次以強調重點,加入黑板邊框與橡皮擦視覺元素,結構包含開頭介紹、主要內容與總結頁,整體風格輕鬆且教育化,支持高解析度輸出,並確保文字清晰可讀。

【提示詞 5|像素復古遊戲風簡報】(游戏)
創建一個像素藝術復古遊戲風格的簡報,使用 8 位元色調(紅色、藍色、綠色)與方塊像素元素,每張幻燈片模擬老派電玩畫面,包含像素角色、磚塊背景紋理與遊戲圖示(如金幣、跳躍人物),內容以關卡面板形式呈現,文字使用像素字體,加入遊戲邊框與分數欄視覺,營造懷舊且趣味的氛圍,支持高解析度輸出,並確保文字清晰不模糊。

Yaml 提示词

这种提示词,非常复杂,你也只能让AI来帮你完成。理论上各种单位公文的PPT,NotebookLM都是可以生成。我这里就模仿乔布斯的PPT模式。

乔布斯风格

对各个细节进行定制。每页不超过12个字。适合产品发布。

下面这个google文档,还有2个例子,我没验证,感兴趣可以去玩玩。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
# https://docs.google.com/document/d/1hVg21NgnF2qOg81HhWDD9c41Dn8EBFgJmWI0sKAcHts/edit?pli=1&tab=t.0
================
# 核心指令:告訴 AI 它的角色
ai_role_definition:
  role: "Chief Storyteller"
  style_model: "Steve Jobs / Zen Presentation"
  objective: "Transform raw information into a cinematic narrative."

# 1. 生成約束 (硬性規定,防止 AI 做成傳統 PPT)
generation_constraints:
  text_density:
    max_words_per_slide: 12  # 嚴格限制:一頁絕不超過 12 個字
    bullet_points: "BANNED"  # 賈伯斯流大忌:絕對禁止條列式清單
    
  visual_priority:
    images: "dominant"       # 圖片永遠是主角
    text: "supporting"       # 文字只是配角
    
  narrative_flow:
    structure: "linear"      # 線性敘事,不跳躍
    emotional_arc: true      # 必須包含情緒轉折(痛點 -> 救贖)

# 2. 幻燈片原型庫 (Slide Archetypes)
# AI 必須將內容「分類」到以下其中一種版型,不可發明新版型
slide_archetypes:
  
  # 類型 A: 震撼大字 (用於章節轉場或核心概念)
  - type: "zen_statement"
    trigger_rule: "Short, powerful concept or transition."
    layout:
      text_size: "huge"    # 100pt+
      alignment: "center"
      background: "void"   # 純漸層背景,無圖
      
  # 類型 B: 英雄登場 (用於產品展示或具象物體)
  - type: "hero_reveal"
    trigger_rule: "Introducing a product, person, or object."
    layout:
      image_style: "full_bleed_or_centered" # 滿版或置中去背
      text_visibility: "minimal" # 僅顯示名稱
      effect: "reflection"       # 倒影效果
      
  # 類型 C: 超級數據 (用於財報或關鍵指標)
  - type: "big_number"
    trigger_rule: "Specific statistic or financial figure."
    layout:
      number_size: "gigantic" # 200pt+
      caption_size: "small"   # 說明文字要很小
      chart_style: "hidden"   # 盡量不放圖表,直接放數字
      
  # 類型 D: 視覺隱喻 (用於解釋抽象概念)
  - type: "visual_metaphor"
    trigger_rule: "Abstract concept (e.g., speed, security, cloud)."
    layout:
      background_image: "high_quality_photo"
      text_position: "overlay_bottom"
      
  # 類型 E: 敵人與衝突 (用於描述現狀痛點)
  - type: "the_villain"
    trigger_rule: "Describing a problem or competitor."
    layout:
      filter: "grayscale_or_dimmed" # 灰階或壓暗,暗示「過時」
      text_tone: "questioning"      # 帶有質疑語氣

# 3. 視覺樣式定義 (給前端渲染引擎看的)
design_system:
  theme:
    background: "radial-gradient(circle, #444444 0%, #000000 100%)" # 經典舞台聚光燈效果
    font_family: "Helvetica Neue, Roboto, San Francisco"
    font_weight: 
      normal: 300 # Light
      bold: 400   # Regular (賈伯斯流不用真正的 Bold)
    color_palette:
      primary: "#FFFFFF"
      accent: "#3498db" # 賈伯斯藍,或其他單一強調色

# 4. 輸出邏輯 (Mapping Logic)
# 告訴 AI 如何處理輸入的長文
input_processing:
  split_logic: "One thought per slide." # 一個念頭一頁
  simplification: "Remove all adverbs and connecting words." # 刪除所有副詞與連接詞
  data_handling: "Extract the single most important number, discard the rest." # 只留一個最重要的數字

长辈风格

我没测试过。不过这样的提示词风格,NotebookLM也是可以的。

1
2
3
4
5
6
7
8
9
10
11
12
13
長輩風設定:
  氛圍: 充滿祝福與平靜
  視覺元素:
    背景: 盛開的蓮花
    裝飾: 閃亮亮特效
  文字排版:
    字體: 標楷體
    特效: 彩虹漸層
    邊框: 白色粗邊
  內容規則:
    開頭: 早安!
    結尾: 認同請分享

历史风格

有时候,需要介绍历史,宗教,需要搞一个风格。让AI参考上面内容,输出一个历史介绍风格的yaml格式。这个风格我验证,还是非常不错。

1
2
3
4
5
6
7
8
9
10
11
12
13
历史讲述风格设定:
  氛围: 庄重而温润,带有敬意与沉思
  视觉元素:
    背景: 淡雅古绢纹理或水墨山水意境(可融入青铜器纹样、简牍、竹简等历史符号)
    装饰: 低调金线勾边、古典回纹或云雷纹点缀,避免过度闪亮,强调典雅
  文字排版:
    字体: 标楷体或宋体
    特效: 柔和暖色渐层(如赭石→米白,或墨黑→深褐)
    边框: 浅褐色或墨色细边,简洁有书卷气
  内容规则:
    开头: "敬启者,今日共话一段往事……"
    结尾: "愿历史之光,照亮前路。若有所感,欢迎传阅共思。"

宗教风格

1
2
3
4
5
6
7
8
9
10
11
12
历史与基督教融合风格设定:
  氛围: 肃穆、庄重而充满盼望,体现敬虔与历史沉思
  视觉元素:
    背景: 米白或浅灰羊皮纸纹理、古老教堂彩窗局部图案(低饱和度)、石砌拱廊或经卷展开的意象
    装饰: 简约十字架轮廓、橄榄枝、烛台、葡萄藤或鱼形符号(ΙΧΘΥΣ),以深棕、墨绿、藏蓝或暗金线条勾勒,避免闪烁特效,强调神圣与古朴
  文字排版:
    字体: 标楷体(中文)或衬线体如Times New Roman / Garamond(若含西文),体现经典典籍感
    特效: 单色温润渐层(如深褐→米白、藏蓝→灰蓝),禁用彩虹、荧光或闪亮效果
    边框: 细深棕或墨色边框,可辅以极简藤蔓或几何纹饰,呼应中世纪手抄本风格
  内容规则:
    开头: "愿主引领我们回溯时光,思想祂在历史中的作为……"
    结尾: "凡有耳的,就应当听。若蒙光照,愿你分享这恩典的见证。"

调研报告

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
目标受众:公司高管 / 行业分析师 / 研究团队  
演示目的:呈现调研发现、关键洞察与战略建议  
整体篇幅:15~20 页  

风格要求:  
- 数据驱动:以数据、指标、趋势、对比分析为核心逻辑,每页聚焦一个核心结论。  
- 专业严谨:内容结构清晰、逻辑严密,避免主观臆断,强调证据链与方法论透明。  
- 简洁克制:去除冗余装饰,仅保留必要视觉元素,确保信息密度与可读性平衡。  

视觉效果:  
- 信息可视化:优先使用图表(柱状图、折线图、散点图、热力图等)替代文字描述;关键数据需突出标注。  
- 极简留白:采用大量留白与对齐网格,提升阅读节奏与专业感;避免视觉杂乱。  
- 卡片式布局(可选):在多维度对比或分群分析时,使用分区卡片组织内容,增强结构清晰度。  
- 图标驱动(辅助):在流程、分类或概念解释页,使用统一风格图标(如 Material Icons 或 Heroicons)降低文字负担。  

配色建议(可选):  
- 主色:深蓝(#0D1B2A)或中性灰(#2D3748)——体现专业与稳重  
- 强调色:金色(#FFC857)或科技蓝(#4A90E2)——用于高亮关键数据或结论  
- 文字色:白色(#FFFFFF)或浅灰(#E2E8F0)——确保高对比度与可读性  

字体建议:  
- 标题:思源黑体 Bold / Microsoft YaHei Bold  
- 正文:思源黑体 Regular / HarmonyOS Sans  

其他要求:  
- 每页必须包含明确结论句(非“数据显示…”而是“调研表明…”)  
- 数据来源需在页脚小字标注(如:IDC 2025 / 内部问卷 N=1,200)  
- 避免使用模糊表述(如“可能”“大概”),若证据不足应标注“待验证”或“需进一步研究”

组合版本

从风格需求和视觉效果,选一个来组合,交给NotebookLM,这样不同的内容,相同的提示词,可以产生相同风格的PPT。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
目标受众:{受众,例如:公司高管 / 技术团队 / 产品经理 / 普通用户} 
演示目的:{目的,例如:技术分享 / 项目汇报 / 产品介绍 / 教学使用} 
整体篇幅:{页数,例如:10 页以内 / 15~20 页} 
风格要求:{风格}
视觉效果:{视觉效果}

风格:
1. 专业,内容呈现以准确、逻辑、严谨为主,强调框架化表达(适合企业汇报、战略沟通、技术述职)
2. 简洁,尽量减少装饰性内容,保留一级标题/二级标题,无其他内容,结构干净利落(适合快速阅读、高管场景)
3. 具象比喻,通过贴近生活的例子、比喻、类比,让复杂内容变得容易理解(适合面向小朋友、非专业受众群体)
4. 故事化,内容以叙事链条组织,用“背景—冲突—解决—结果”模型推动 (适合产品发布、经验分享)
5. 数据驱动,强调数据、指标、趋势、对比分析,以数据结论作为核心逻辑(适合商业分析、调研报告)
6. 教学,结构更加循序渐进,以解释概念、举例说明、对比差异、步骤演示为主(适合教学、培训类)
7. 激励,采用鼓舞语气和积极愿景,强调“为什么重要”“我们要做什么” (适合团队动员、年度启动会、愿景介绍)
8. 产品展示,突出场景镜头、用户价值、功能亮点、体验流程,强调“好处和使用方式”(适用于新品发布、方案宣讲)
9. 思维导图,以概念之间的关联为主线,用层次化结构展开知识网络(适合复杂主题)

视觉效果:
1. 极简留白,以大量留白、弱化装饰、突出内容主体为核心,整体视觉干净现代(适合专业场景、高管简报)
2. 强调色块,通过大色块和模块化布局强化层级关系,使重点更醒目(适合方案展示、运营复盘)
3. 卡片式布局,以卡片、分区、分栏组织内容,让阅读更轻松清晰(适合内容较多、结构化信息)
4. 图标驱动,以统一风格的图标、符号表达概念,降低文字密度、增强可读性(适合流程讲解、结构说明)
5. 插画或手绘感,采用柔和插画或轻松手绘笔触,增强亲和力与友好度(适合科普、教学、文化主题)
6. 科技质感,以线条、渐变、光效构建轻科技氛围,视觉更现代(适合 AI、数据、互联网主题)
7. 深色主题,以暗色背景配亮色文字形成强对比,强调稳重与冲击力(适合正式场景、数据展示)
8. 信息可视化,以图表、趋势图、结构图作为主视觉,减少大段文字(适合分析汇报、研究报告)
9. 分镜叙事,以类似电影分镜的结构呈现画面连续性,使内容更具故事流动感(适合产品发布、战略叙述)
10. 品牌一致,严格遵循品牌色、字体体系与风格规范,整体一致性强(适合外部宣讲、品牌官方材料)

参考文章

NotebookLM Infographic 提示词

2026-01-11 08:00:00

最近google的infographic 图,非常火爆,因为展示的内容非常复杂和震撼。要达到自己想要的效果,或者让提示词具有通用性。这个我也折腾的好久。直到找到自己的需求。这样就很快掌握了。

孩子预计今天要考雅思。那么我想要给他准备啥,需要大概率用不上。但是确实可以用这个来搞一遍。youtube,找到最热门的雅思博主,粉丝超过100万以上才能考虑。其实就那么4个,只选择2026年最新雅思内容的视频。

大概有4种的infographic,至少目前我看到的

  • Handwritten,手写笔记
  • hand-drawn sketchnote。手绘的图
  • 海报
  • 产品说明书
  • futuristic style
  • Whiteboard style
  • Chalkboard style
  • Kawaii Doodle Art style
  • Anime Battle Style

选择不同的生图提示词,相同的内容就会生成不同风格的图。

NotebookLM

放进去了13的视频。我没有通过聊天生成单独的文本,作为源,单独生成图片,这个更加精准,也是很有道理。但是google的智商肯定比我们高,他知道我们的需求,不需要那么麻烦。直接提出你的需求就可以。

提示词修改

听力

下面的提示词是老外视频翻出来的。

1
List the most crucial information about [topic] that [audience] mustknow. Do not change the title. Be specific and explanatory. Usead smoothly, provide any requiredcomplete sentences that are redefinitions and give examplesoillustration(s) that can be used to explainthe key concept(s) of each section.Do not create a 'Why it matterssection, Limit section titles to the absolute minimum.

我让ai翻译成中文,我根据自己需求

  • [topic],改成 [雅思听力考试]
  • [audience] 改成 考生
1
列出[雅思听力考试]中最关键的信息,这些信息是考生必须了解的。请勿更改标题。内容要具体且具有解释性。行文流畅,提供必要的完整句子,包括重新定义和示例或插图,以解释每个部分的关键概念。请勿创建“重要性”部分,并将章节标题限制在绝对必要的范围内。

相同的提示词,如果生成英文,有时候内容,更加丰富。

雅思听力重点

口语

雅思口语重点

写作

做了一个调整,改成详细内容

info

雅思的写作分成task1和task2. 选择detail的情况下,一张图无法覆盖全部内容

task2

由于我的资料里关于task1太少,采用详细模式,无法生成对应的图,改成 标准 才行

task1

阅读

我还是选择 detail ,看看生成的内容。

read

Gemini 生成Infographic

可以通过Gemini,生成内容,再生成Infographic。需要采用Thinking 模式。

Handwritten,手写笔记

内容提示词

在think模式下,提交下面的提示词。

1
List the most crucial information about [topic] in Educationthat teachers must know. Do not change the title. Be specific and explanatory. Use completesentences that are read smoothly, provide any required definitions and give examples ofilustration(s) that can be used to explain the key concept(s) of each section. Do not create a'Why it matters' section. Limit section titles to the absolute minimum.

可以翻译成中文,方便很多。例如我想生成埃及文明的内容。把topic,改成埃及文明。

1
列出教师必须了解的关于埃及文明在教育中的教学影响的最关键信息。内容需具体、解释清晰,使用流畅完整的句子,提供必要的定义,并辅以示例或说明,以阐明每个部分的核心概念。各部分内容标题应简洁明了,不另设“重要性”部分。

生图提示词

添加工具,image

提示词如下,只需要修改一下显示的比例,我习惯,16:9,就不需要修改。

1
Create an educational infographic on aged, lined, spiral-bound noteboopaper with a [16:9] ratio, based on the above information. The visualaesthetic must use realistic, detailed colored pencil and watercolortextures for illustrations alongside neat, printed architectural-stylehandwriting for text, Design the page with a decorative main title bannat the top, followed by the most fundamental definition and a large,cinematic panoramic illustration spanning the width of the page. Belowthis, organize key concepts into a bulleted list section using stylizedcheckmark icons, and divide the remaining lower half of the page intoa modular grid of distinct, rectangular boxes, where each box containsspecific, fully labeled comparative diagram or classification illustrationwith its own descriptive caption, Use no titles other than the main one.

中文

1
基于上述内容,创建一张以泛黄、带横线、螺旋装订笔记本纸为背景的教育信息图,比例为[16:9],视觉风格须采用逼真细腻的彩色铅笔与水彩质感插图,并搭配整洁印刷体般的建筑风格手写字体用于文字,页面顶部设计装饰性主标题横幅,其下紧接最核心的定义及一幅横贯全页宽度的电影感全景插图,再下方以风格化对勾图标引导的项目符号列表呈现关键概念,页面下半部分则划分为模块化网格,由多个独立矩形框组成,每框内含一幅具体且完整标注的对比图或分类图并配以说明性图注,除主标题外不得使用其他任何标题。

看图。在google gemini,提示词中文和英文是没区别。显示内容,中文,英文会有点差异。英文更加丰富。

gemini

hand-drawn sketchnote。手绘的图

Gemini think模式,输入

内容提示词

1
2
3
4
5
6
7
 #Identify and explain [insert your topic]. Be specific and to the point. Provide relevant examples. Audience is [define the sketchnote's audience]

Identify and explain Anger Management Techniques. Be specific and to the point. Provide
relevant examples. Audience is 10 year old students.

Identify and explain children and parents to get along well Techniques. Be specific and to the point. Provide relevant examples. Audience is 10 year old students.

中文

1
讲解并解释孩子和父母如何才能和睦相处的技巧。内容要具体、简洁明了。提供相关的例子。目标受众是10岁的学生。

生图提示词

直接输入下面提示词就可以。

1
2
Create a hand-drawn sketchnote visual summary of these notes, Use apristine white paper background (no lines). The art style should be'graphic recording' or 'visual thinking' using black ink fine-liners forclear outlines and text, Use colored markers (specifically teal, orangeand muted red) for simple shading and accents, Center the main titlein a 3D-style rectangular box, Surround the title with radially distributedsimple doodles, business icons, stick figures, and graphs that explainthe concepts, Use arrows to connect ideas, The text should bedistinct, handwritten, all-caps printing, legible and organized like aprofessional brainstorming session. 16:9

sketchnote

海报

视频总结提示词

1
Summarise this video: https:/ww.youtube.com/watch?v=5a-9ccPDibU . Be brief and to the point. Audience is Al Enthusiasts。

图片生成,提示词就是上面那段,无需修改,记得启用 图片

video

海报生图提示词

1
2
3
4
create an inforgraphic based on the above information, accompainied by photorealistic, appropriate for the general populous,9:16

根据以上信息制作一张信息图,并配以逼真的图片,内容适合大众,比例为 9:16。

poster

产品说明书

生图提示词

这个比较复杂,人体说明,电器说明,都可以。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
“Create an infographic image of [Garmin 255], combining a realistic photograph or photoreal render of the object with technical annotation overlays placed directly on top.

Use black ink–style line drawings and text (technical pen / architectural sketch look) on a pure white studio background, including:

•Key component labels

•Internal cutaway or exploded-view outlines

•Measurements, dimensions, and scale markers

•Material callouts and quantities

•Arrows indicating function, force, or flow (air, sound, power, pressure)

•Simple schematic or sectional diagrams where relevant

Place the title Garmin 255 inside a hand-drawn technical annotation box in one corner.

Style & layout rules:

•The real object remains clearly visible beneath the annotations

•Annotations feel sketched, technical, and architectural

•Clean composition with balanced negative space

•Educational, museum-exhibit / engineering-manual vibe

Visual style:

Minimal technical illustration aesthetic, black linework over realistic imagery, precise but slightly hand-drawn feel.

Color palette:

White background, black annotation lines and text only. No colors.

Output:

1080×1080, ultra-crisp, social-feed optimized, no watermark.”

第二组提示词,也是来自facebook

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
Create an infographic image of [IPhone 17], combining a realistic photograph or photorealistic render of the object with technical annotation overlays placed directly on top.
Use black ink–style line drawings and text (technical pen / architectural sketch look) on a pure white studio background.
Include:
•Key component labels
•Internal cutaway or exploded-view outlines (where relevant)
•Measurements, dimensions, and scale markers
•Material callouts and quantities
•Arrows indicating function, force, or flow (air, sound, power, pressure, movement)
•Simple schematic or sectional diagrams where applicable
Place the title [OBJECT] inside a hand-drawn technical annotation box in one corner.
Style & layout rules:
•The real object remains clearly visible beneath the annotations
•Annotations look hand-sketched, technical, and architectural
•Clean composition with balanced negative space
•Educational, museum-exhibit / engineering-manual vibe
Visual style:
Minimal technical illustration aesthetic.
Black linework layered over realistic imagery.
Precise but slightly hand-drawn feel.
Color palette:
Pure white background.
Black annotation lines and text only.
No colors.
Output:
1080 × 1080 resolution
Ultra-crisp
Social-feed optimized
No watermark

watch

菜谱提示词

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
"Ultra-clean modern recipe infographic.
Showcase [Cantonese White Cut Chicken]  in a visually appealing finished form—sliced, plated, or portioned—floating slightly in perspective or angled view.
Arrange ingredients, steps, and tips around the dish in a dynamic editorial layout, not restricted to top-down.
Ingredients Section:
Include icons or mini illustrations for each ingredient with quantities. Arrange them in clusters, lists, or circular flows connected visually to the dish.
Steps Section:
Show preparation steps with numbered panels, arrows, or lines, forming a logical flow around the main dish. Include small cooking icons (knife, pan, oven, timer) where helpful.
Additional Info (optional):
Total calories, prep/cook time, servings, spice level—displayed as clean bubbles or badges near the dish.
Visual Style:
Editorial infographic meets lifestyle food photography. Vibrant, natural food colors, subtle drop shadows, clean vector icons, modern typography, soft gradients or glassmorphism for step panels. Accent colors can highlight key info (calories, prep time).
Composition Guidelines:
Finished meal as hero visual (perspective or angled). Ingredients and steps flow dynamically around the dish. Clear visual hierarchy: dish > steps > ingredients > optional stats. Enough negative space to keep design airy and readable.
Lighting & Background:
Soft, natural studio lighting. Minimal textured or gradient background for premium editorial feel.
Output:
1080×1080, ultra-crisp, social-feed optimized, no watermark"

chicken