跳到主要内容

博客

12 articles
  1. 01
    Apr 14, 202612 min
    ai-agentssecurity

    AI Agent 权限蔓延:无人审计的授权债

    AI Agent 在悄无声息地积累过量权限 —— 每一个新的集成都会增加 “一个 scope”,直到你的 Agent 拥有了自试点以来从未触碰过的生产数据库写入权限。本文将介绍用于阻止这种情况的审计方法论和 JIT 配置模式。

    Read more  →
  2. 02
    Apr 14, 202612 min
    machine-learningpersonalization

    AI 功能中的冷启动问题:为何第一周总是失败

    为何行为机器学习系统在第一天就会失败——以及在真实训练数据到来之前保持系统可用的分层引导架构。

    Read more  →
  3. 03
    Apr 14, 202610 min
    ai-safetyproduction-ai

    HITL 橡皮图章问题:为什么"人在回路"往往两者皆非

    大多数人在回路的实现并没有产生监督效果——它们只是产生了文书工作。以下是审查者停止审查的原因,以及在规模化场景下保持HITL真实有效的设计模式。

    Read more  →
  4. 04
    Apr 14, 202612 min
    aiengineering

    AI 功能的延迟预算:当核心组件是随机的,如何制定并达成 p95 SLO

    LLM 延迟与数据库延迟的行为截然不同。本文介绍如何为 AI 功能制定切实可行的 p95 SLO、分解延迟预算,并利用对冲、流式传输和推测执行真正达成这些目标。

    Read more  →
  5. 05
    Apr 14, 202611 min
    ai-engineeringtool-use

    Schema 熵:为什么你的工具定义正在生产环境中悄然腐烂

    生产 AI 系统中的工具定义会在数月内悄然退化。本文解析 Schema 熵的形成机制、Agent 为何无法自我修正,以及在腐烂破坏线上 Agent 之前捕获问题的版本控制与契约测试实践。

    Read more  →
  6. 06
    Apr 14, 20269 min
    ai-agentsobservability

    异步 Agent 的静默失败:为何你的 AI 任务悄然终止却无人察觉

    异步 AI 任务会静默而自信地失败——HTTP 200,仪表盘一片绿,客户最终投诉才发现。本文介绍死信队列、幂等键和 Saga 日志如何从传统分布式系统迁移到 AI Agent 场景以解决这一问题。

    Read more  →
  7. 07
    Apr 14, 20269 min
    aideployment

    AI 采纳悖论:为何价值最高的领域反而最晚部署 AI

    医疗行业的 AI 采纳率仅为 39%,而软件公司高达 92%——但医疗行业显然有更多可以从 AI 中获益的空间。这种差距并非源于规避风险,而是准确率阈值、合规时序与部署架构之间的结构性错配。

    Read more  →
  8. 08
    Apr 14, 202613 min
    llmopsobservability

    AI 回滚仪式:当损害是行为性而非二元性时的事故后恢复

    LLM 系统中的行为回归不会导致测试失败或触发警报。本文将介绍如何检测、诊断并从这种看似成功的故障模式中恢复。

    Read more  →
  9. 09
    Apr 14, 202613 min
    ai-engineeringtesting

    集成测试的幻象:为什么模拟工具输出会隐藏智能体的真实失败模式

    基于模拟数据构建的智能体永远不会遇到在生产环境中棘手的失败:分页死循环、序列中途的频率限制、部分成功响应以及 Schema 歧义。以下是你可以采取的对策。

    Read more  →
  10. 10
    Apr 13, 202612 min
    llmfine-tuning

    适配器兼容性悬崖:当你的微调模型遇到新版基础模型

    LoRA 和 PEFT 适配器在维度上与训练时使用的基础模型深度绑定。当提供商悄然或公开地更新底层模型时,你的微调结果可能以形状不匹配错误崩溃,更危险的是,它可能在毫无警报的情况下静默降级。本文解析哪些部分会出问题、为何会出问题,以及如何保护生产环境中的微调模型免受基础模型更新的影响。

    Read more  →
  11. 11
    Apr 13, 202611 min
    agent-memoryai-engineering

    智能体记忆垃圾回收:大规模工程化的策略性遗忘

    生产环境中的智能体记忆系统会随着过时事实和矛盾信息的积累而无声地退化。分代衰减层、语义去重、矛盾检测和自适应压缩构成了一个 GC 管道,使长期运行的智能体保持可靠——其中包含借鉴自运行时垃圾回收的具体算法。

    Read more  →
  12. 12
    Apr 13, 202611 min
    aicode-review

    AI 代码审查陷阱:为什么更快的审查正在让你的代码库变得更糟

    AI 工具让工程师写代码更快、审查代码更快,但缺陷逃逸率却在攀升。本文呈现自动化偏见、隐性逻辑错误的数据,以及真正能发现 AI Bug 的审查规范。

    Read more  →