1221 字
6 分钟
2026.03.27

今天是高产的一天,完成了 5 个课题。重点产出是一个 Boss 直聘 AI 助手 Chrome 扩展,以及一套用 Prompt Engineering 替代代码逻辑的 Skill 设计规范。

今天做了什么#

1. Boss AI Helper Chrome 扩展#

从零开发了一个 Boss 直聘 AI 助手的 Chrome MV3 扩展,半天搞定全部核心功能:

功能说明
Popup 设置页AI 模型配置(GLM/DeepSeek/OpenAI/Claude)、API Key、求职偏好
简历量化粘贴简历 → AI 提取技能标签和工作经历时间线
聊天 AI 回复检测 HR 新消息 → 生成回复建议 → 一键填入
职位匹配分析提取职位信息 → AI 评分 → 推荐打招呼话术
今日统计投递/回复/面试/拒绝 + 转化漏斗

技术栈:WXT + Vue 3 + TypeScript + Element Plus + Pinia + Vitest + Playwright

测试结果:73 个单元测试全过,6 个 E2E 测试全过,构建产物 1.42MB。

最大的技术坑是 Chrome MV3 的 main-world 通信。Content script 运行在隔离世界中,无法直接访问页面 DOM 事件。解决方案是用 window.postMessage 桥接 content script 和 main-world script。

另外接入了 GLM 模型(通过阿里云 DashScope 端点),需要特殊处理 thinking + text 的响应格式。

2. Logic Skill 规范:用 Markdown 替代代码#

花了不少时间把 DBS 商业工具箱中的设计模式提炼成通用规范。

核心理念:传统方式是用 Python/JS 写逻辑代码调用 AI API,Logic Skill 方式是用结构化自然语言把判断逻辑写进 SKILL.md,让 AI 自己执行逻辑

代码写法: if user_has_product: enter_phase("content_diagnosis")
SKILL.md: 如果用户有产品 → 进入内容诊断阶段

建立了”代码逻辑 → 自然语言”的完整映射表,总结了 6 种可复用的设计模式(路由器、消解漏斗、信号检测、多维度评分、双模式切换、条件触发),以及一套约束系统。

最重要的发现:60% 靠正面指令,40% 靠负面约束。负面约束比正面指令更重要。比如”不要说’每个人的情况不同‘“比”要给出具体建议”更有效。

3. 1362 个 Claude Skills 生态扫描#

对本地安装的全部 1362 个 Claude Code Skills 做了分类扫描,其中 251 个包含 GitHub 链接,180+ 个唯一仓库(去重后)。

重点筛选了搜索/记忆/爬虫/研究四大类共 52 个 skill,发现了几个很有价值的:

  • deep-research — 自主研究:规划→搜索→阅读→综合报告
  • skill-seekers — 自动将文档网站、GitHub 仓库转为 Claude Skill
  • recallmax — 持久化记忆召回系统
  • hierarchical-agent-memory — 分层记忆架构,减少 token 消耗

4. 自动视频剪辑方案调研#

为 CutX 视频剪辑工具调研”自动检测口播视频中说错字段落”的技术方案。

推荐方案:ASR 转录 + 正则匹配自我纠正关键词 + 可选 LLM 辅助判断

ASR 转录 → 合并上下文窗口 → 匹配"不对/重来/我是说"等关键词 → 标记裁剪区间 → ffmpeg 裁剪

调研了 20+ 个开源项目,WhisperX(13k stars)最适合做词级时间戳对齐,CleanTone 项目做了 Whisper + Generative AI 失语检测的完整方案。

5. Solar Config Skill#

用上面总结的 Logic Skill 规范,写了一个光伏储能系统配置诊断的 Skill(360 行 SKILL.md)。四条核心公理:电压决定一切、先问需求再推设备、信息有优先级、安全是底线。这个就不展开说了。

今天学到了什么#

  • Chrome MV3 的 main-world script 和 content script 是隔离的,必须通过 window.postMessage 桥接。这是 Extension 开发中很容易踩的坑。
  • Prompt Engineering 可以替代简单的代码逻辑。if/else、状态机、循环这些结构都可以用自然语言 + 约束系统实现。关键是负面约束要写够。
  • GLM API 的响应格式和 OpenAI 不同,有 thinking + text 两部分,需要特殊解析。
  • 失语检测(Disfluency Detection) 是一个成熟的 NLP 子领域,有 reparandum/interregnum/repair 的标准标签体系。

今天的感悟#

Logic Skill 规范最有意思。以前觉得 Prompt Engineering 就是”写好提示词”,但现在发现它本质上是一种编程范式——用自然语言替代代码来编排 AI 的行为。

约束系统是灵魂。写正面指令告诉 AI “要做什么”只成功了一半,写负面约束告诉 AI “绝对不要做什么”才是可靠运行的关键。这跟写代码是一样的道理:正常流程 + 边界处理 + 异常处理,缺一不可。

明天的计划#

  • Boss AI Helper:登录 Boss 直聘实测完整功能,调优页面选择器
  • 把 Logic Skill 规范应用到更多实际场景
  • CutX:实现 detect_mistakes() 检测器
2026.03.27
https://210214.xyz/posts/2026-03-27/
作者
leileigwl
发布于
2026-03-27
许可协议
CC BY-NC-SA 4.0