今天是高产的一天,完成了 5 个课题。重点产出是一个 Boss 直聘 AI 助手 Chrome 扩展,以及一套用 Prompt Engineering 替代代码逻辑的 Skill 设计规范。
今天做了什么
1. Boss AI Helper Chrome 扩展
从零开发了一个 Boss 直聘 AI 助手的 Chrome MV3 扩展,半天搞定全部核心功能:
| 功能 | 说明 |
|---|---|
| Popup 设置页 | AI 模型配置(GLM/DeepSeek/OpenAI/Claude)、API Key、求职偏好 |
| 简历量化 | 粘贴简历 → AI 提取技能标签和工作经历时间线 |
| 聊天 AI 回复 | 检测 HR 新消息 → 生成回复建议 → 一键填入 |
| 职位匹配分析 | 提取职位信息 → AI 评分 → 推荐打招呼话术 |
| 今日统计 | 投递/回复/面试/拒绝 + 转化漏斗 |
技术栈:WXT + Vue 3 + TypeScript + Element Plus + Pinia + Vitest + Playwright
测试结果:73 个单元测试全过,6 个 E2E 测试全过,构建产物 1.42MB。
最大的技术坑是 Chrome MV3 的 main-world 通信。Content script 运行在隔离世界中,无法直接访问页面 DOM 事件。解决方案是用 window.postMessage 桥接 content script 和 main-world script。
另外接入了 GLM 模型(通过阿里云 DashScope 端点),需要特殊处理 thinking + text 的响应格式。
2. Logic Skill 规范:用 Markdown 替代代码
花了不少时间把 DBS 商业工具箱中的设计模式提炼成通用规范。
核心理念:传统方式是用 Python/JS 写逻辑代码调用 AI API,Logic Skill 方式是用结构化自然语言把判断逻辑写进 SKILL.md,让 AI 自己执行逻辑。
代码写法: if user_has_product: enter_phase("content_diagnosis")SKILL.md: 如果用户有产品 → 进入内容诊断阶段建立了”代码逻辑 → 自然语言”的完整映射表,总结了 6 种可复用的设计模式(路由器、消解漏斗、信号检测、多维度评分、双模式切换、条件触发),以及一套约束系统。
最重要的发现:60% 靠正面指令,40% 靠负面约束。负面约束比正面指令更重要。比如”不要说’每个人的情况不同‘“比”要给出具体建议”更有效。
3. 1362 个 Claude Skills 生态扫描
对本地安装的全部 1362 个 Claude Code Skills 做了分类扫描,其中 251 个包含 GitHub 链接,180+ 个唯一仓库(去重后)。
重点筛选了搜索/记忆/爬虫/研究四大类共 52 个 skill,发现了几个很有价值的:
- deep-research — 自主研究:规划→搜索→阅读→综合报告
- skill-seekers — 自动将文档网站、GitHub 仓库转为 Claude Skill
- recallmax — 持久化记忆召回系统
- hierarchical-agent-memory — 分层记忆架构,减少 token 消耗
4. 自动视频剪辑方案调研
为 CutX 视频剪辑工具调研”自动检测口播视频中说错字段落”的技术方案。
推荐方案:ASR 转录 + 正则匹配自我纠正关键词 + 可选 LLM 辅助判断。
ASR 转录 → 合并上下文窗口 → 匹配"不对/重来/我是说"等关键词 → 标记裁剪区间 → ffmpeg 裁剪调研了 20+ 个开源项目,WhisperX(13k stars)最适合做词级时间戳对齐,CleanTone 项目做了 Whisper + Generative AI 失语检测的完整方案。
5. Solar Config Skill
用上面总结的 Logic Skill 规范,写了一个光伏储能系统配置诊断的 Skill(360 行 SKILL.md)。四条核心公理:电压决定一切、先问需求再推设备、信息有优先级、安全是底线。这个就不展开说了。
今天学到了什么
- Chrome MV3 的 main-world script 和 content script 是隔离的,必须通过
window.postMessage桥接。这是 Extension 开发中很容易踩的坑。 - Prompt Engineering 可以替代简单的代码逻辑。if/else、状态机、循环这些结构都可以用自然语言 + 约束系统实现。关键是负面约束要写够。
- GLM API 的响应格式和 OpenAI 不同,有 thinking + text 两部分,需要特殊解析。
- 失语检测(Disfluency Detection) 是一个成熟的 NLP 子领域,有 reparandum/interregnum/repair 的标准标签体系。
今天的感悟
Logic Skill 规范最有意思。以前觉得 Prompt Engineering 就是”写好提示词”,但现在发现它本质上是一种编程范式——用自然语言替代代码来编排 AI 的行为。
约束系统是灵魂。写正面指令告诉 AI “要做什么”只成功了一半,写负面约束告诉 AI “绝对不要做什么”才是可靠运行的关键。这跟写代码是一样的道理:正常流程 + 边界处理 + 异常处理,缺一不可。
明天的计划
- Boss AI Helper:登录 Boss 直聘实测完整功能,调优页面选择器
- 把 Logic Skill 规范应用到更多实际场景
- CutX:实现
detect_mistakes()检测器