AI能力集 -- AI 碎片知识小结

Posted Mar 28, 2026 Updated Apr 12, 2026

By xiaodongQ

views 8 min read

AI能力集 -- AI 碎片知识小结

1. 引言

整理一些最近的 AI 碎片知识，来源也比较零碎：公众号推送、技术群群聊、短视频、刷推等等。

2. 使用经验类

2.1. 终端工具

Ghostty - 现代高性能终端，支持 GPU 加速、分屏、ligatures
- 但是只能在Linux和Mac上用，自己的Mac系统版本低试了下用不了。加上之前用来ssh连接的Windterm，对Claude Code的终端显示有时有问题，所以笔记本上也换成Wezterm了
WezTerm - 同样支持Windows，配置与 macOS/Linux 通用
- 参考：WezTerm使用介绍
- 由 Rust 编写、GPU 加速的跨平台终端模拟器与多路复用器
- 优势
  - 高性能渲染
  - 多路复用与会话管理（核心优势）
    - 本地多路复用：无需tmux，原生支持标签页、窗格分屏（水平 / 垂直）、窗口管理
    - 远程会话：其中SSH域通过libssh2直接连接远程服务器，支持会话复用，可配置默认域自动连接
    - 会话持久化：意外关闭终端后可恢复会话
  - Windows 专属集成
    - PowerShell优化：完美兼容 PowerShell 7+，支持命令行补全、语法高亮
    - 文件关联：支持通过 WezTerm 打开命令行文件（.cmd, .bat, .ps1）
  - 高级定制能力
    - Lua 配置系统：完整的 Lua API，可自定义键盘映射、外观、启动行为等，配置文件位于 %USERPROFILE%\.config\wezterm\wezterm.lua
    - 主题系统：内置 240+ 配色方案，支持动态切换，可自定义窗口框架、标签栏样式
    - 事件钩子：支持启动、退出、窗口创建 / 关闭等事件的自定义脚本，可集成第三方工具
    - 插件生态：通过 Lua 脚本扩展功能，支持自定义状态栏、快捷键、工作区管理
  - 配置可以参考：wezterm-config，使用了一下，快捷键和样式都挺好，也fork了一份。
    - 尤其是 ctrl + alt + |或/来分屏，并用 ctrl + alt + j/k/h/l 来切换，跟vim+tmux的体验一样
    - 进一步提升体验：安装PowerShell 7，并且wezterm脚本里配置，可体验新版本PowerShell带来的效率提升（如自动补全）
      - 比如这里的配置：wezterm配置分享
（备选方案） Windows Terminal + PowerShell 7
- Windows Terminal：微软官方终端，支持多标签、分屏、GPU 加速
- PowerShell 7：跨平台 Shell，兼容 bash 语法，支持管道、对象处理
- 优势：开箱即用，无需配置；劣势：自定义能力弱于 WezTerm

2.2. Claude Code 工具链

2.2.1. 核心仓库

everything claude code - Claude Code 资源聚合仓库，收录插件、脚本、使用技巧

2.2.2. 推荐插件和工具

插件	功能	备注
claude-hud	显示 Claude 使用情况和上下文统计	实时查看 token 消耗、会话长度
cc-switch	不同模型快速切换	比如用Minimax 作为 Opus 的 Plan B 备份
super-power	技能包扩展	提供额外工具和命令
happy	开源 App，可远程连接 Claude	支持移动端/桌面端远程调用

2.2.3. 使用经验

和 Claude 探讨：先确认再执行
- 复杂任务先让 Claude 输出计划/思路
- 确认无误后再执行具体操作
- 避免盲目执行导致的返工
项目初始化策略
- 各子目录分别执行 /init，生成独立的 md 文档（如 README.md、规范文档）
- 总目录下再执行一次 /init，作为索引说明，汇总各子目录功能
- 分层管理，便于多 Agent 协作和知识隔离

2.3. Agent 开发

2.3.1. Hello Agent 仓库

hello-agent - Agent 开发入门模板仓库
包含基础 Agent 结构、工具调用示例、测试框架
适合快速上手 Agent 开发，理解核心概念

2.4. Agent Skill 设计模式

谷歌近期发布的 5 个 Agent Skill 设计模式（原文：@GoogleCloudTech，作者 @Saboo_Shubham_ 和 @lavinigam）：

模式	解决的问题	核心思路
1. Tool Wrapper（工具包装器）	Agent 需要特定库/框架的专业知识	按需加载知识，不硬编码到 system prompt
2. Generator（生成器）	每次生成的文档结构不一致	模板 + 风格指南约束输出格式
3. Reviewer（审查器）	代码审查标准散落、不可维护	检查清单可插拔，分离”查什么”和”怎么查”
4. Inversion（反转）	Agent 信息不足时就猜测执行	翻转控制流：Agent 当采访者，先问再做
5. Pipeline（流水线）	复杂任务中 Agent 跳过步骤	钻石门控强制执行严格顺序，每步确认

参考阅读：Agent Skill 的五种设计模式：从 SKILL.md 格式到内容设计
实践建议：模式可组合使用（如 Pipeline + Reviewer），根据任务复杂度选择。Inversion 模式被低估——强制”先问再做”能避免 80% 无用输出。

2.5. 其他工具

2.5.1. 手机端浏览器选择

测试过以下几款：

Via 浏览器 - 轻量、无广告、支持脚本、高度自定义 ✅ 最终选择
X 浏览器 - 跟Via差不多，但是感觉自定义搜索不好用（默认百度不大好用）
Edge - 同步方便，使用也不错，前进后退没via好用

选择 Via 的理由：

体积极小（<1MB）
支持自定义 User-Agent
支持油猴脚本
无推送、无新闻、无干扰

3. 概念

3.1. Harness Engineering（驾驭工程）

参考：Harness Engineering（驾驭工程）

Harness Engineering（驾驭工程）是围绕 AI 智能体设计和构建约束机制、反馈回路、工作流控制和持续改进循环的系统工程实践。它不优化模型本身，而是优化模型运行的”环境”。核心哲学八个字：人类掌舵，智能体执行（Human Steer, Agent Execute）。

3.1.1. AI 工程范式的三次跃迁

阶段	核心	局限
Prompt Engineering	提示词优化	依赖单次输入，难以处理复杂任务
Context Engineering	上下文管理	受限于模型上下文窗口
Harness Engineering	环境/约束设计	突破单模型限制，构建系统级能力

AI, AI能力集

AI 工具链，Agent

This post is licensed under CC BY 4.0 by the author.