跳到主要内容

博客

12 articles
  1. 01
    Apr 11, 202612 min
    ab-testingllm

    对非确定性 AI 功能进行 A/B 测试:为何你的实验框架假设了错误的零假设

    标准 A/B 测试框架假设处理是确定性的,但 LLM 驱动的功能会引入处理内方差,从而破坏功效计算、膨胀样本量并产生不可靠的结果。本文为非确定性 AI 实验提供随机化、指标设计、贝叶斯方法和方差缩减的实践指南。

    Read more  →
  2. 02
    Apr 11, 202610 min
    ai-frameworksagent-architecture

    抽象反转问题:当 AI 框架迫使你在错误的层级思考

    大多数 AI Agent 框架承诺提升速度,却带来了锁定。本文介绍抽象反转问题如何困住团队,为什么 AI 抽象比传统抽象泄漏得更快,以及生产团队最终收敛的架构模式。

    Read more  →
  3. 03
    Apr 11, 20269 min
    ai-agentsdevops

    智能体凭据轮换:尚未被映射到 AI 领域的 DevOps 难题

    自主 AI 智能体在工具集成中积累了大量长期存在的密钥,而传统的轮换策略往往会在任务执行中途导致其中断。四种架构模式——即时置备、双重刷新、工具与运行时隔离以及连接器抽象——能够确保智能体在凭据生命周期内安全运行。

    Read more  →
  4. 04
    Apr 11, 202610 min
    multi-agent-systemsdeadlock

    智能体死锁:当 AI 代理永远在等待彼此

    多智能体 AI 系统在代理同时协调时,死锁率在 25% 到 95% 之间——这直接呼应了经典分布式系统的故障模式。实用的检测和预防模式,防止生产环境中的代理工作流冻结。

    Read more  →
  5. 05
    Apr 11, 202611 min
    incident-responsesre

    AI 辅助故障响应:为你的值班 Agent 提供运维手册

    尽管 AI 投资创下纪录,但由于团队在部署 Agent 时缺乏运维手册或防护栅栏,运维负担反而有所增加。通过采用三层自治模型 —— 咨询型、审批型、条件型 —— 结合结构化运维手册和爆炸半径检查,可以将 AI Agent 转化为可靠的值班伙伴。

    Read more  →
  6. 06
    Apr 11, 202610 min
    ai-adoptionproduct-metrics

    没有人正确衡量的 AI 功能采用曲线

    DAU 和会话时长掩盖了用户是真正采用 AI 功能还是仅仅在容忍它们。了解揭示真实采用情况的行为信号——编辑接受比、绕过率、覆盖时间——以及捕获这些信号的埋点架构。

    Read more  →
  7. 07
    Apr 11, 202611 min
    ai-product-strategyproduct-metrics

    AI 功能自相残杀:当你的智能功能悄悄杀死核心产品

    自动化关键工作流步骤的 AI 快捷方式可能会悄然侵蚀参与循环、降低产品粘性,并将你的产品变成一个商品化的包装层——以下是检测和预防的方法。

    Read more  →
  8. 08
    Apr 11, 202611 min
    ai-engineeringtechnical-debt

    AI 技术债务:Sprint 回顾中从未出现的四个类别

    提示词腐化、评估漂移、嵌入锁定和影子耦合——传统工程实践无法捕获的四种复合型 AI 技术债务,以及管理每种债务的实用策略。

    Read more  →
  9. 09
    Apr 11, 202610 min
    ai-agentsdistributed-systems

    Agent 流水线中的背压:当 AI 生成工作的速度快于执行速度

    会产生子 Agent 和扇出工具调用的 Agent 流水线会创建无界工作队列,耗尽 token 预算并使生产系统崩溃。借鉴响应式系统中的背压模式——有界队列、层级化预算、熔断器和自适应并发——可以在账单到来之前阻止失控扩张。

    Read more  →
  10. 10
    Apr 11, 202612 min
    legacy-systemsllm-integration

    棕地 AI:如何在不重写的情况下将 LLM 功能集成到遗留代码库

    绿地 AI 演示在遭遇十年老单体系统时往往土崩瓦解。适配器模式、数据提取策略以及渐进式迁移路径,能让你在不进行大爆炸式重写的情况下,将 LLM 功能集成到遗留代码库中。

    Read more  →
  11. 11
    Apr 11, 202613 min
    ai-agentscaching

    AI Agent 工作负载的缓存层级:多数团队止步于第二层的五层架构

    生产级 AI Agent 需要五个缓存层 —— 提示词、语义、工具结果、计划和会话状态 —— 每个层级都有独特的 TTL 和失效策略。大多数团队只做了前两层,白白流失了一半的节省空间。

    Read more  →
  12. 12
    Apr 11, 202610 min
    llmprompt-engineering

    能力激发:让大语言模型用好它已知道的一切

    大多数提示优化聚焦于指令清晰度,但真正的瓶颈往往在于知识激活。从专家身份框架到顺序分解,五种激发技术能够解锁模型的潜在能力——这是单纯优化指令无法企及的。

    Read more  →