Hermes Agent CLI 界面使用指南
如果你第一次接触 Hermes Agent,可以把它理解成一个“运行在终端里的 AI 助手工作台”。
它不是网页聊天窗口,而是一个完整的终端界面。你可以在里面持续对话、切换模型、加载技能、执行工具、恢复历史会话,也可以把耗时任务放到后台继续运行。
这篇文档会尽量用对新手友好的方式,带你理解 Hermes CLI 最常用的能力。你不需要一次记住所有内容,先掌握最常用的部分就足够开始使用了。
文档概览
| 模块 | 你会学到什么 |
|---|---|
| 运行 CLI | 怎么启动 Hermes,怎么做一次性提问,怎么恢复上次会话 |
| 界面布局 | 终端里的几个主要区域分别是干什么的 |
| 快捷键 | 哪些按键最常用,什么时候该按 |
| 斜杠命令 | /help、/model、/tools 这些命令怎么用 |
| 个性设置 | 怎么切换说话风格 |
| 会话管理 | 怎么恢复对话、保存上下文、压缩长会话 |
| 后台会话 | 怎么把耗时任务放到后台跑 |
| 静音模式 | 为什么有时候输出更简洁 |
建议你怎么读
如果你是第一次使用 Hermes,建议按这个顺序阅读:
- 先看“运行 CLI”
- 再看“快捷键”
- 然后看“斜杠命令”
- 最后再了解“会话管理”和“后台会话”
这样最容易上手,也不会一开始就被太多选项淹没。
运行 CLI
这一部分最重要,因为你真正开始使用 Hermes,第一步就是知道怎么启动它。
最常见的启动方式
| 场景 | 命令 | 说明 |
|---|---|---|
| 启动交互式 session(默认) | hermes |
最常用的方式。进入交互界面后,你可以持续对话。 |
| 单一查询模式(非交互) | hermes chat -q "Hello" |
只问一个问题,问完就结束,适合快速测试。 |
| 指定模型 | hermes chat --model "anthropic/claude-sonnet-4" |
临时使用指定模型。 |
| 使用 Nous provider | hermes chat --provider nous |
指定通过 Nous 提供商运行。 |
| 使用 OpenRouter provider | hermes chat --provider openrouter |
指定通过 OpenRouter 提供商运行。 |
| 指定 toolsets | hermes chat --toolsets "web,terminal,skills" |
控制当前会话能使用哪些工具。 |
| 启动时预加载 skills | hermes -s hermes-agent-dev,github-auth |
会话开始前就加载指定技能。 |
| 预加载 skill 并单次提问 | hermes chat -s github-pr-workflow -q "open a draft PR" |
带技能执行一个单次任务。 |
| 恢复最近会话 | hermes --continue |
接着最近一次对话继续。 |
| 按 ID 恢复会话 | hermes --resume <session_id> |
恢复指定历史会话。 |
| 开启详细模式 | hermes chat --verbose |
输出更多调试信息。 |
| 在独立 worktree 中交互运行 | hermes -w |
为并行 Git 任务创建隔离工作区。 |
| 在独立 worktree 中执行单次任务 | hermes -w -q "Fix issue #123" |
在隔离工作区中执行单次任务。 |
新手最先记住哪几个
如果你不想一下记太多,先记住下面 4 个就够了:
hermeshermes chat -q "Hello"hermes --continuehermes chat --verbose
这 4 个已经能覆盖:
- 日常交互
- 单次测试
- 恢复会话
- 排查问题
每种方式适合什么场景
| 命令模式 | 适合什么情况 |
|---|---|
hermes |
你打算持续聊天、持续操作、持续让 Agent 帮你工作 |
hermes chat -q |
你只想快速问一句,或者写脚本调用 |
--model / --provider |
你想临时切换模型或平台 |
-s |
你已经知道这次任务会用到哪些技能 |
--continue / --resume |
你中断过工作,现在要接着做 |
-w |
你要并行处理多个 Git 任务,避免互相影响 |
界面布局
第一次打开 Hermes CLI 时,界面可能看起来信息很多。其实你只需要知道它主要有 4 个区域:
- 标题栏
- 对话流区域
- 固定输入区域
- 状态栏
各区域分别干什么
| 区域 | 作用 |
|---|---|
| 标题栏 | 展示当前会话的基础信息,例如模型、环境、技能等 |
| 对话流区域 | 显示你和 Agent 的对话,以及工具执行结果 |
| 输入区域 | 你输入问题、命令和指令的地方 |
| 状态栏 | 显示当前会话的上下文占用、成本、耗时等信息 |
欢迎横幅通常会展示当前模型、终端后端、工作目录、可用工具以及已安装技能。新手可以把它理解为“当前工作环境总览”。
状态栏
状态栏位于输入区域上方,会实时显示当前会话的重要状态。
状态栏里通常会看到什么
YAML
model: claude-sonnet-4-20250514
tokens: 12.4K/200K
context_usage: 6%
estimated_cost: $0.06
duration: 15m
这些字段是什么意思
| 元素 | 描述 | 你需要关心什么 |
|---|---|---|
| 模型名称 | 当前使用的模型 | 确认自己是不是在用想用的模型 |
| Token 数量 | 当前上下文已使用 Token / 最大上下文窗口 | 判断上下文是不是快满了 |
| 上下文占用 | 当前上下文的使用比例 | 越接近上限越要小心 |
| 成本 | 预估会话成本 | 用于控制消耗 |
| 持续时间 | 当前会话已经运行多久 | 方便判断会话长度 |
上下文颜色怎么理解
| 颜色 | 阈值 | 含义 |
|---|---|---|
| 绿色 | < 50% | 空间很充足,可以继续 |
| 黄色 | 50%–80% | 逐渐接近中段,建议开始留意 |
| 橙色 | 80%–95% | 快接近上限了 |
| 红色 | ≥ 95% | 非常接近溢出,建议考虑压缩上下文 |
新手建议
如果你只是偶尔问几个问题,状态栏不用太紧张地盯着看。
但如果你在一个长会话里连续聊天、连续调用工具、连续处理代码,那么一定要留意:
- 上下文占用
- 成本
- 会话时长
会话恢复显示
当你通过 hermes -c 或 hermes --resume <id> 恢复会话时,标题栏和输入区域之间通常会显示一个“上一次对话摘要”面板,帮助你快速回忆之前的上下文。
快捷键
快捷键是提高效率最直接的方式。你不用全部背下来,先记住最常用的几个就行。
| 键 | 动作 | 什么时候会用到 |
|---|---|---|
| Enter | 发送消息 | 最常用 |
| Alt+Enter 或 Ctrl+J | 换行 | 需要输入多行内容时 |
| Alt+V | 粘贴图像(终端支持时) | 需要把图片发给 Agent 时 |
| Ctrl+V | 粘贴文本,并在可能时附加剪贴板图像 | 粘贴内容时 |
| Ctrl+B | 启用语音模式时,开始或停止语音录制 | 使用语音输入时 |
| Ctrl+C | 中断 Agent;2 秒内双击可强制退出 | Agent 卡住、你想打断它时 |
| Ctrl+D | 退出 CLI | 结束当前会话时 |
| Ctrl+Z | 挂起 Hermes 到后台(仅 Unix) | 暂时把 Hermes 放到后台时 |
| Tab | 接受自动建议或补全斜杠命令 | 输入命令时非常好用 |
最值得先记住的 4 个快捷键
EnterCtrl+CCtrl+DTab
掌握这 4 个,已经可以比较顺畅地使用 Hermes CLI。
斜杠命令
当你输入 / 时,Hermes 会弹出自动补全下拉菜单。你可以把斜杠命令理解成“CLI 内置控制命令”。
常用命令
| 命令 | 描述 |
|---|---|
/help |
显示命令帮助 |
/model |
查看或切换当前模型 |
/tools |
列出当前可用工具 |
/skills browse |
浏览技能中心及官方技能 |
/background <prompt> |
在独立后台会话中运行任务 |
/skin |
查看或切换当前 CLI 皮肤 |
/voice on |
开启语音模式 |
/voice tts |
切换 Hermes 回复的语音播放 |
/reasoning high |
提高推理努力程度 |
/title My Session |
为当前会话命名 |
对新手最有用的斜杠命令
建议优先熟悉这些:
/help/model/tools/title My Session/background <prompt>
命令规则
- 斜杠命令不区分大小写,例如
/HELP与/help等价。 - 已安装的技能也会自动注册为斜杠命令。
快捷命令
快捷命令的作用是:不经过 LLM,直接运行你预设好的系统命令。
这很适合做一些常用查询,比如:
- 看服务状态
- 查 GPU 使用率
- 跑一个固定脚本
配置示例
YAML
quick_commands:
status:
type: exec
command: systemctl status hermes-agent
gpu:
type: exec
command: nvidia-smi --query-gpu=utilization.gpu,memory.used --format=csv,noheader
配置后,你可以直接输入:
/status/gpu
启动时预加载技能
如果你提前就知道这次任务要用哪些技能,可以在启动时把技能一起加载好。
常见写法:
hermes -s hermes-agent-dev,github-authhermes chat -s github-pr-workflow -s github-auth
这样做的好处是:会话一开始就带着这些技能,不用中途再补充说明。
技能斜杠命令
安装在 ~/.hermes/skills/ 目录下的每个技能,都会自动变成一个斜杠命令。
示例
/gif-search funny cats/axolotl help me fine-tune Llama 3 on my dataset/github-pr-workflow create a PR for the auth refactor/excalidraw
如果你只输入技能名,Hermes 通常会先加载技能,然后再问你具体要做什么。
个性设置
Hermes 支持通过 personality 来改变说话风格。
常见用法
/personality pirate/personality kawaii/personality concise
内置 personality
Hermes 内置的人格包括:
helpful、concise、technical、creative、teacher、kawaii、catgirl、pirate、shakespeare、surfer、noir、uwu、philosopher、hype
自定义 personality 示例
YAML
personalities:
helpful: "You are a helpful, friendly AI assistant."
kawaii: "You are a kawaii assistant! Use cute expressions..."
pirate: "Arrr! Ye be talkin' to Captain Hermes..."
对于新手来说,最实用的通常是:
concise:更简洁helpful:更稳妥technical:更偏技术表达
多行输入
当你要输入一段较长的内容时,Hermes 支持多行输入。
方法一:快捷键换行
可以使用:
Alt+EnterCtrl+J
方法二:反斜杠续行
YAML
input_example:
- "Write a function that:"
- "1. Takes a list of numbers"
- "2. Returns the sum"
粘贴支持
Hermes 支持直接粘贴多行文本。
如果你已经在别处写好了提示词、日志内容或代码片段,通常可以直接粘贴进来。
中断 Agent
如果 Agent 正在工作,而你想让它停下来,可以随时中断。
常见中断方式
| 方式 | 行为 |
|---|---|
| 输入新消息并回车 | 中断当前操作,立即处理新消息 |
Ctrl+C |
中断当前操作;2 秒内双击可强制退出 |
| 终端命令执行中断 | 先发送 SIGTERM,1 秒后发送 SIGKILL |
忙碌输入模式
display.busy_input_mode 控制 Hermes 忙碌时,你按 Enter 会发生什么。
| 模式 | 行为 |
|---|---|
interrupt(默认) |
立即中断当前任务并处理你的消息 |
queue |
将消息排队,当前任务结束后再处理 |
配置示例:
YAML
display:
busy_input_mode: "queue"
如果你不希望误打断当前任务,queue 模式会更适合你。
挂起到后台
在 Unix 系统上,你可以用 Ctrl+Z 暂时把 Hermes 挂起到后台。之后再通过 fg 恢复。
工具执行进度显示
当 Hermes 正在思考或运行工具时,CLI 会给出反馈,不会让你觉得它卡住了。
思考动画
你通常会看到一些类似的状态,例如:
YAML
thinking_states:
- "pondering... (1.2s)"
- "contemplating... (2.4s)"
- "got it! (3.1s)"
工具执行反馈
| 类型 | 示例 |
|---|---|
| 终端命令 | terminal ls -la (0.3s) |
| 搜索 | web_search (1.2s) |
| 提取 | web_extract (2.1s) |
详细模式切换
使用 /verbose 可以在这些模式之间切换:off → new → all → verbose
工具预览长度
YAML
display:
tool_preview_length: 80
如果你觉得工具预览里的路径或命令太长,这个配置会很有用。默认值 0 表示不限制长度。
会话管理
Hermes 的一个很重要的能力,就是你不需要每次都从头开始。
恢复会话
退出 CLI 会话后,Hermes 会打印恢复命令和会话摘要。
你最常用的恢复方式通常是:
hermes --continuehermes -chermes --resume 具体会话 ID
如果恢复成功,之前的消息、工具调用和响应都会接上。
会话存储
CLI 会话存储在 SQLite 数据库中:~/.hermes/state.db
这里会保存:
- 会话元数据
- 消息历史
- 压缩与恢复关系
- 搜索索引
上下文压缩
当会话太长、接近上下文上限时,Hermes 可以自动把中间部分摘要压缩。
YAML
compression:
enabled: true
threshold: 0.50
summary_model: "google/gemini-3-flash-preview"
简单理解就是:
- 太长的历史不会完全丢掉
- 中间部分会变成摘要
- 头尾关键对话会尽量保留
后台会话
如果一个任务比较耗时,你不想卡在前台等它跑完,可以把它丢到后台。
常见写法:/background Analyze the logs in /var/log and summarize any errors from today
它有什么好处
- 前台会话不会被阻塞
- 你可以继续做别的事
- 还能同时开多个后台任务
工作原理
| 特性 | 说明 |
|---|---|
| 隔离的对话 | 后台 Agent 看不到当前主会话历史 |
| 继承配置 | 会继承模型、provider、工具集、推理设置等 |
| 非阻塞 | 前台会话仍可继续使用 |
| 多任务支持 | 可以同时运行多个后台任务 |
任务完成后会怎样
后台任务完成后,结果会以单独面板形式显示。
如果配置里启用了 display.bell_on_complete,终端还会发出提示音。
适合的使用场景
- 长时间研究任务
- 批量分析文件或仓库
- 并行调查多个问题
- 让主会话继续工作,把耗时任务交给后台
会话隔离
后台会话不会自动进入你的主对话历史。它们是独立会话,拥有自己的任务 ID。
静音模式
默认情况下,CLI 会以相对安静的方式显示输出。
它的特点通常包括:
- 抑制工具的详细日志
- 保留动画反馈
- 让界面更简洁
如果你需要更多调试信息,可以使用:hermes chat --verbose
新手快速上手路线
如果你现在就想开始用,可以按下面的顺序来:
- 运行
hermes - 输入一个简单问题试试
- 记住
Ctrl+C、Ctrl+D、Tab - 尝试
/help和/model - 学会用
hermes --continue恢复会话 - 等熟悉后再去试
/background和-w
常用命令速查
| 场景 | 命令 |
|---|---|
| 进入交互模式 | hermes |
| 单次提问 | hermes chat -q "Hello" |
| 恢复最近会话 | hermes --continue |
| 按 ID 恢复会话 | hermes --resume <session_id> |
| 预加载技能 | hermes -s hermes-agent-dev,github-auth |
| 打开详细模式 | hermes chat --verbose |
总结
Hermes CLI 最值得你记住的不是某个单独参数,而是它的整体工作方式:
- 它是一个完整的终端工作界面
- 它支持持续对话,也支持一次性任务
- 它支持技能、后台任务、会话恢复和上下文压缩
- 只要掌握启动、快捷键、斜杠命令和会话恢复,你就已经具备了稳定使用它的基础
如果你是第一次接触 Hermes,建议不要急着学全。先把最常见的几个命令和快捷键用熟,再逐步扩展到后台任务、技能和高级配置,这样会轻松很多。
