Post

AI能力集 -- AI 碎片知识小结

AI能力集 -- AI 碎片知识小结

1. 引言

整理一些最近的 AI 碎片知识,来源也比较零碎:公众号推送、技术群群聊、短视频、刷推等等。


2. 使用经验类

2.1. 终端工具

  • Ghostty - 现代高性能终端,支持 GPU 加速、分屏、ligatures
    • 但是只能在Linux和Mac上用,自己的Mac系统版本低试了下用不了。加上之前用来ssh连接的Windterm,对Claude Code的终端显示有时有问题,所以笔记本上也换成Wezterm
  • WezTerm - 同样支持Windows,配置与 macOS/Linux 通用
    • 参考:WezTerm使用介绍
    • 由 Rust 编写、GPU 加速的跨平台终端模拟器与多路复用器
    • 优势
      • 高性能渲染
      • 多路复用与会话管理(核心优势)
        • 本地多路复用:无需tmux,原生支持标签页、窗格分屏(水平 / 垂直)、窗口管理
        • 远程会话:其中SSH域通过libssh2直接连接远程服务器,支持会话复用,可配置默认域自动连接
        • 会话持久化:意外关闭终端后可恢复会话
      • Windows 专属集成
        • PowerShell优化:完美兼容 PowerShell 7+,支持命令行补全、语法高亮
        • 文件关联:支持通过 WezTerm 打开命令行文件(.cmd, .bat, .ps1)
      • 高级定制能力
        • Lua 配置系统:完整的 Lua API,可自定义键盘映射、外观、启动行为等,配置文件位于 %USERPROFILE%\.config\wezterm\wezterm.lua
        • 主题系统:内置 240+ 配色方案,支持动态切换,可自定义窗口框架、标签栏样式
        • 事件钩子:支持启动、退出、窗口创建 / 关闭等事件的自定义脚本,可集成第三方工具
        • 插件生态:通过 Lua 脚本扩展功能,支持自定义状态栏、快捷键、工作区管理
      • 配置可以参考:wezterm-config,使用了一下,快捷键和样式都挺好,也fork了一份。
        • 尤其是 ctrl + alt + |或/来分屏,并用 ctrl + alt + j/k/h/l 来切换,跟vim+tmux的体验一样
        • 进一步提升体验:安装PowerShell 7,并且wezterm脚本里配置,可体验新版本PowerShell带来的效率提升(如自动补全)
  • (备选方案) Windows Terminal + PowerShell 7
    • Windows Terminal:微软官方终端,支持多标签、分屏、GPU 加速
    • PowerShell 7:跨平台 Shell,兼容 bash 语法,支持管道、对象处理
    • 优势:开箱即用,无需配置;劣势:自定义能力弱于 WezTerm

2.2. Claude Code 工具链

2.2.1. 核心仓库

  • everything claude code - Claude Code 资源聚合仓库,收录插件、脚本、使用技巧

2.2.2. 推荐插件和工具

插件功能备注
claude-hud显示 Claude 使用情况和上下文统计实时查看 token 消耗、会话长度
cc-switch不同模型快速切换比如用Minimax 作为 Opus 的 Plan B 备份
super-power技能包扩展提供额外工具和命令
happy开源 App,可远程连接 Claude支持移动端/桌面端远程调用

2.2.3. 使用经验

  1. 和 Claude 探讨:先确认再执行
    • 复杂任务先让 Claude 输出计划/思路
    • 确认无误后再执行具体操作
    • 避免盲目执行导致的返工
  2. 项目初始化策略
    • 各子目录分别执行 /init,生成独立的 md 文档(如 README.md、规范文档)
    • 总目录下再执行一次 /init,作为索引说明,汇总各子目录功能
    • 分层管理,便于多 Agent 协作和知识隔离

2.3. Agent 开发

2.3.1. Hello Agent 仓库

  • hello-agent - Agent 开发入门模板仓库
  • 包含基础 Agent 结构、工具调用示例、测试框架
  • 适合快速上手 Agent 开发,理解核心概念

2.4. Agent Skill 设计模式

谷歌近期发布的 5 个 Agent Skill 设计模式(原文:@GoogleCloudTech,作者 @Saboo_Shubham_ 和 @lavinigam):

模式解决的问题核心思路
1. Tool Wrapper(工具包装器)Agent 需要特定库/框架的专业知识按需加载知识,不硬编码到 system prompt
2. Generator(生成器)每次生成的文档结构不一致模板 + 风格指南约束输出格式
3. Reviewer(审查器)代码审查标准散落、不可维护检查清单可插拔,分离”查什么”和”怎么查”
4. Inversion(反转)Agent 信息不足时就猜测执行翻转控制流:Agent 当采访者,先问再做
5. Pipeline(流水线)复杂任务中 Agent 跳过步骤钻石门控强制执行严格顺序,每步确认

参考阅读:Agent Skill 的五种设计模式:从 SKILL.md 格式到内容设计

实践建议:模式可组合使用(如 Pipeline + Reviewer),根据任务复杂度选择。Inversion 模式被低估——强制”先问再做”能避免 80% 无用输出。

2.5. 其他工具

2.5.1. 手机端浏览器选择

测试过以下几款:

  • Via 浏览器 - 轻量、无广告、支持脚本、高度自定义 ✅ 最终选择
  • X 浏览器 - 跟Via差不多,但是感觉自定义搜索不好用(默认百度不大好用)
  • Edge - 同步方便,使用也不错,前进后退没via好用

选择 Via 的理由:

  • 体积极小(<1MB)
  • 支持自定义 User-Agent
  • 支持油猴脚本
  • 无推送、无新闻、无干扰

3. 概念

3.1. Harness Engineering(驾驭工程)

参考:Harness Engineering(驾驭工程)

Harness Engineering(驾驭工程)是围绕 AI 智能体设计和构建约束机制、反馈回路、工作流控制和持续改进循环的系统工程实践。它不优化模型本身,而是优化模型运行的”环境”。核心哲学八个字:人类掌舵,智能体执行(Human Steer, Agent Execute)。

3.1.1. AI 工程范式的三次跃迁

阶段核心局限
Prompt Engineering提示词优化依赖单次输入,难以处理复杂任务
Context Engineering上下文管理受限于模型上下文窗口
Harness Engineering环境/约束设计突破单模型限制,构建系统级能力

This post is licensed under CC BY 4.0 by the author.