跳到主要内容

生成式 AI 的企业趋势

· 阅读需 3 分钟

生成式 AI 的关键趋势

  • 机器学习进步重新定义计算能力
  • 计算和硬件需求的演变
  • 扩展(计算、数据、模型规模)改善结果

AI 能力的进展

  • 图像识别
    • 示例:“豹”分类,90.88% 准确率(ImageNet)
    • AlexNet 初始性能:63.3%
  • 语音识别
    • 在 LibriSpeech test-other 数据集上的性能提升

Transformers 和基础模型

  • 关键技术
    • 自回归训练
    • 使用数万亿标记进行预训练
    • 示例:“猫坐在垫子上”
  • 优化
    • 监督微调 (SFT)
    • 来自人类反馈的强化学习 (RLHF)

Gemini 模型

  • 项目启动于 2023 年 2 月
  • Gemini 1.0 发布:2023 年 12 月
  • Gemini 1.5 发布:2024 年 2 月
  • 特点
    • 跨文本、图像和视频的多模态推理
    • 长上下文能力(最多 1000 万标记)
    • 降低幻觉率

企业 AI 趋势

  1. 随着数据需求的减少,加速 AI 开发
  2. 从单一模态系统向多模态系统过渡
  3. 从密集模型架构向稀疏模型架构转变
  4. 可扩展和灵活平台的重要性
  5. API 成本下降
  6. LLMs 和搜索的集成

定制化和效率

  • 技术
    • 微调和参数高效调优(例如,LoRA)
    • 蒸馏以优化性能和延迟
  • 挑战
    • 在部署中平衡成本、延迟和性能
  • 函数调用
    • 集成 API、数据库和外部系统
    • 应用:数据检索、工作流程、客户支持

解决限制

  • 问题
    • 冻结的训练数据导致知识过时
    • 高幻觉率
    • 不一致的结构化输出
  • 解决方案
    • 检索增强生成 (RAG) 框架
    • 以私有、新鲜和权威数据为基础
    • 带有引用的结构化输出

生成式 AI 的未来

  • 增强的多模态推理和扩展的上下文能力
  • 优化以降低成本和提高可扩展性
  • 改进输出的基础性和事实准确性

Agentic AI 框架

· 阅读需 3 分钟

介绍

  • 两种 AI 应用

    • 生成式 AI:创建文本和图像等内容。
    • Agentic AI:自主执行复杂任务。这是未来
  • 关键问题:开发人员如何使这些系统更易于构建?

Agentic AI 框架

  • 示例

    • 应用包括个人助理、自主机器人、游戏代理、网络/软件代理、科学、医疗保健和供应链。
  • 核心优势

    • 用户友好:自然直观的交互,输入最少。
    • 高能力:高效处理复杂任务。
    • 可编程性:模块化和可维护,鼓励实验。
  • 设计原则

    • 统一抽象,整合模型、工具和人机交互。
    • 支持动态工作流、协作和自动化。

AutoGen 框架

https://github.com/microsoft/autogen

  • 目的:构建 Agentic AI 应用的框架。

  • 关键特性

    • 可对话和可定制的代理:简化了具有自然语言交互的应用构建。
    • 嵌套聊天:处理内容创建和推理密集型任务等复杂工作流。
    • 群聊:支持多个代理的协作任务解决。
  • 历史

    • 始于 FLAML(2022 年),成为独立项目(2023 年),每月下载量超过 20 万,广泛采用。

应用和示例

  • 高级反思
    • 用于协作优化任务的双代理系统,如博客写作。
  • 游戏和策略
    • 会话国际象棋,代理模拟战略推理。
  • 企业和研究
    • 在供应链、医疗保健和科学发现中的应用,如 ChemCrow 用于发现新化合物。

AutoGen 的核心组件

  • Agentic 编程
    • 将任务分解为可管理的步骤,以便于扩展和验证。
  • 多代理编排
    • 支持具有集中或分散设置的动态工作流。
  • Agentic 设计模式
    • 涵盖推理、规划、工具集成和内存管理。

代理设计中的挑战

  • 系统设计
    • 优化多代理系统以进行推理、规划和多样化应用。
  • 性能
    • 在保持弹性的同时平衡质量、成本和可扩展性。
  • 人机协作
    • 设计安全有效的人机交互系统。

开放问题和未来方向

  • 多代理拓扑
    • 高效平衡集中和分散系统。
  • 教学和优化
    • 使用 AgentOptimizer 等工具使代理能够自主学习。
  • 扩展应用
    • 探索软件工程和跨模态系统等新领域。

LLM 代理的历史与未来

· 阅读需 3 分钟

LLM 代理的轨迹和潜力

介绍

  • 代理的定义:与环境(物理、数字或人类)交互的智能系统。
  • 演变:从像 ELIZA(1966)这样的符号 AI 代理到现代基于 LLM 的推理代理。

核心概念

  1. 代理类型
    • 文本代理:像 ELIZA(1966)这样的基于规则的系统,范围有限。
    • LLM 代理:利用大型语言模型进行多功能的文本交互。
    • 推理代理:结合推理和行动,能够在各个领域进行决策。
  2. 代理目标
    • 执行问答(QA)、游戏解决或现实世界自动化等任务。
    • 平衡推理(内部行动)和行动(外部反馈)。

LLM 代理的关键发展

  1. 推理方法
    • 链式思维(CoT):通过逐步推理提高准确性。
    • ReAct 范式:将推理与行动结合进行系统探索和反馈。
  2. 技术里程碑
    • 零样本和少样本学习:通过最少的例子实现通用性。
    • 记忆整合:结合短期(基于上下文)和长期记忆以实现持久学习。
  3. 工具和应用
    • 代码增强:通过编程方法增强计算推理。
    • 检索增强生成(RAG):利用外部知识来源,如 API 或搜索引擎。
    • 复杂任务自动化:在机器人和化学领域的体现推理,以 ChemCrow 为例。

局限性

  • 实际挑战
    • 处理现实世界环境的困难(例如,处理不完整数据的决策)。
    • 易受无关或对抗性上下文的影响。
  • 可扩展性问题
    • 现实世界机器人与数字模拟的权衡。
    • 在特定领域进行微调和数据收集的高成本。

研究方向

  • 统一解决方案:将多样化任务简化为可推广的框架(例如,用于探索和决策的 ReAct)。
  • 先进的记忆架构:从仅追加日志转向自适应的、可写的长期记忆系统。
  • 与人类合作:专注于增强人类创造力和解决问题的能力。

未来展望

  • 新兴基准
    • 用于软件工程任务的 SWE-Bench。
    • 用于在动态环境中微调 LLM 代理的 FireAct。
  • 更广泛的影响
    • 增强的数字自动化。
    • 在软件工程、科学发现和网络自动化等领域提供复杂问题解决的可扩展解决方案。

LLM 推理:关键理念与局限性

· 阅读需 4 分钟

推理是提升 LLM 能力的关键

介绍

  • 对 AI 的期望:解决复杂的数学问题,发现科学理论,实现通用人工智能(AGI)。
  • 基本期望:AI 应该能够通过少量示例模拟人类的学习方式。

关键概念

  • 机器学习中缺少什么?
    • 推理:从最少的示例中逻辑推导出答案的能力。

玩具问题:最后字母连接

  • 问题

    : 提取单词的最后一个字母并将其连接。

    • 示例:"Elon Musk" → "nk"。
  • 传统机器学习:需要大量标记数据。

  • LLM:通过推理,只需一次演示即可实现 100% 准确率。

中间步骤的重要性

  • 人类通过推理和中间步骤解决问题。
  • 示例:
    • 输入:"Elon Musk"
    • 推理:"Elon" 的最后一个字母是 "n","Musk" 的最后一个字母是 "k"。
    • 输出:"nk"。

推理方法的进展

  1. 链式思维(CoT)提示
    • 将问题分解为逻辑步骤。
    • 数学文字题的示例展示了增强的问题解决准确性。
  2. 从易到难提示
    • 将问题分解为更简单的子问题以逐步概括。
  3. 类比推理
    • 从相关问题中调整解决方案。
    • 示例:通过回忆距离公式逻辑来找到正方形的面积。
  4. 零样本和少样本链式思维
    • 在没有明确示例的情况下触发推理。
  5. 解码中的自我一致性
    • 采样多个响应以提高逐步推理的准确性。

局限性

  • 被无关上下文干扰
    • 添加无关细节会显著降低性能。
    • 解决方案:明确指示模型忽略干扰。
  • 自我纠错的挑战
    • LLM 有时无法自我纠正错误,甚至可能使正确答案变得更糟。
    • Oracle 反馈对于有效纠正至关重要。
  • 前提顺序重要
    • 重新排序问题前提会导致性能下降,强调逻辑进程的重要性。

实际影响

  • 中间推理步骤对于解决连续问题至关重要。
  • 像使用单元测试进行自我调试的技术对未来改进充满希望。

未来方向

  1. 定义正确的问题对于进步至关重要。
  2. 通过开发能够自主解决这些问题的模型来解决推理局限性。

打造 AI 原生出版系统:TianPan.co 的进化之路

· 阅读需 6 分钟

TianPan.co 的发展历程,正是网络出版演进的缩影。从最初的静态 HTML 页面,到如今融合 AI 的智能内容平台,我们始终在探索突破。随着第三个版本的发布,让我和大家分享我们是如何在 AI 时代重新思考并实现现代出版平台的。

AI 原生出版

从 WordPress 到 AI 原生的蜕变

2009 年,TianPan.co 和许多技术博客一样,起步于一台配置简单的 VPS 上的 WordPress 站点。那时的工作流程很简单:写作、发布、继续写作。随着技术的发展,我们的需求也在不断升级。第一版选择了 Octopress 和 GitHub,开始将内容作为代码来管理,这种方式更贴近开发者的使用习惯。到了第二版,我们引入了 GraphQL、服务器端渲染等现代网络技术,同时推出了 React Native 移动应用。

如今,技术环境已发生翻天覆地的变化。AI 不再是一个简单的概念,而是正在深刻改变我们创建、组织和分享知识的方式。正是这样的认知,促使我们开发第三版时提出了一个大胆的设想:如果我们从零开始,把 AI 作为核心来设计一个出版系统,会擦出怎样的火花?

AI 原生平台的技术底座

第三版在多个维度突破了传统博客平台的局限:

  1. 内容即数据:所有内容都以 markdown 格式存储,便于 AI 系统实时处理。这不仅仅是为了机器可读,更是让 AI 真正参与到内容生命周期的各个环节。

  2. 分散发布,统一管理:内容会自动从中央仓库流向 Telegram、Discord、Twitter 等多个平台。与传统的多渠道发布不同,AI 能够智能地保持内容一致性,并针对不同平台特点做出优化。

  3. 基础设施升级:我们从最初的单核 1GB 内存配置,升级到更强大的基础设施。这样的升级不仅提升了系统可靠性,也为实时内容分析、自动编辑等 AI 驱动的功能提供了算力保障。

技术架构充分体现了这种"AI 优先"的理念:

.
├── _inbox # AI 监控的草稿区
├── notes # 已发布的英文笔记
├── notes-zh # 已发布的中文笔记
├── crm # 个人关系管理
├── ledger # 个人账本(基于 beancount.io)
├── packages
│ ├── chat-tianpan # 基于 LlamaIndex 的内容交互接口
│ ├── website # tianpan.co 网站源码
│ ├── prompts # AI 系统提示词库
│ └── scripts # AI 处理流水线

突破出版边界:构建融合的知识体系

第三版最大的特色,在于它巧妙地整合了多个知识模块:

  • 智能人脉管理:通过 AI 增强的笔记系统管理人际关系
  • 财务追踪:集成 beancount.io 实现完整的账本管理
  • 多语言支持:智能翻译与本地化
  • 互动学习:AI 驱动的对话式内容探索

工作流程也实现了质的飞跃:

  1. 以 markdown 格式创建内容
  2. 触发 CI/CD 流水线进行 AI 处理
  3. 通过 Zapier 实现多平台分发
  4. AI 编辑通过 GitHub Issues 持续提供优化建议

展望:技术出版的新图景

我们的目标不仅是打造一个更好的博客系统,更是重新定义 AI 时代下技术知识的分享方式。系统的每个组件都是实验新型 AI 能力的沃土,随时准备迎接进化。

真正令人兴奋的,不仅是技术架构本身,更是它开启的无限可能。AI 能否帮我们发现看似不相关的技术概念之间的潜在联系?如何让复杂的技术内容更容易被更多人理解?未来是否能轻松地实现富媒体内容的智能创作?

这些都是 TianPan.co v3 正在探索的方向。在这个实验场中,AI 不再是简单的工具,而是创造和传播知识的得力助手。

15. 身心健康是其他一切的动力

· 阅读需 8 分钟

你的时间和精力是你最有价值的、可自我更新的资产。保护它们以维持充满活力和满足的生活。

Physical and Mental Well-Being

15.1 将个人健康作为清单优先事项

自我关怀常常在人们忙于外部需求的时候被忽视。我们可以通过将健康习惯纳入每日或每周清单来应对这一问题。清单能够提供这样一些好处:

  • 持续改进:随着你的身心状态变化进行跟踪和调整。
  • 主动健康管理:及早发现小问题以预防慢性病。
  • 认知轻松:通过自动化常规护理减少决策疲劳。

例如,将每日遛狗视为清单项目,确保你定期活动,让你的思维轻松进入或退出“工作模式”。

15.2 在五个关键领域有意锻炼

并非所有锻炼都是一样的。每种类型都满足你身体的特定需求。以下是五个主要类别及其益处的细分:

类别示例主要益处
MIIT (中等强度间歇训练)慢跑、骑自行车、划船等中等速度的运动改善心血管健康;增强耐力;对关节友好。
HIIT (高强度间歇训练)冲刺、波比跳、Tabata 训练最大化卡路里燃烧;提高新陈代谢;时间效率高。
力量训练自由重量、阻力带、自身体重练习增强肌肉和骨密度;提高功能性健身。
平衡训练单腿站立、瑜伽姿势、太极改善协调性;防止跌倒;增强核心稳定性。
柔韧性练习静态/动态拉伸、瑜伽、泡沫滚动增加活动范围;减少紧张;帮助恢复。

制定一个整合这些元素的例行程序,以实现全面的健身。

15.3 优先考虑睡眠和营养

睡眠

优质睡眠是生产力和健康的基础。通过以下策略保护你的 昼夜节律

  • 晨光暴露:在户外待 20-30 分钟,或在阴天使用 光疗灯箱(10,000 Lux)。
  • 限制夜间蓝光:减少屏幕时间并建立平静的就寝常规。
  • 坚持时间表:对齐起床和睡觉时间以实现最佳恢复。一个人可以维持大约 14-16 小时的“相对高效的清醒”,所以如果你计划在午夜上床睡觉,最好在早上 8 点前起床。

营养

采用符合饮食指南的均衡饮食,重点是:

  1. 多样化的蔬菜(深绿色、红/橙色、淀粉类、豆类)。
  2. 全水果。
  3. 全谷物优于精制谷物。
  4. 瘦蛋白(家禽、海鲜、坚果、豆类)。
  5. 健康脂肪(例如 Omega-3)。

避免高血糖食物,并考虑补充 关键维生素和矿物质,这些对能量水平和情绪至关重要。对于时间安排,像 16:8 间歇性禁食 这样的做法可以增强能量和专注力。

15.4 练习正念或冥想来管理压力

正念是完全活在当下,观察而不评判。它:

  • 提高对情绪和思想的意识。
  • 通过将注意力集中在当下来减少压力。
  • 提高清晰度和专注力。
  • 改善整体健康。

正念可以超越冥想,延伸到日常活动中——无论是走路、吃饭还是工作——通过培养有意识的注意力。

15.5 休息以充电

  • 恢复不是一个可选项,而是一个必选项——你要么有计划地去休息,要么就会累。定期休息可以恢复能量,提高专注力,并维持高性能。

    恢复原则

    • 像计划工作一样计划恢复:像计划任务一样有意地计划休息。
    • 将恢复与压力类型匹配:不同的压力需要不同的休息——身体、情感或创造性。
    • 使用多样化的恢复方法:结合短暂休息(如散步或快速拉伸)和较长的恢复期。

    实施

    • 采用 52/17 节奏:工作 52 分钟,然后休息 17 分钟。
    • 保护周末:利用周末断开连接并恢复活力。
    • 计划季度重置:安排深度恢复期以充电和反思。

15.6 创建人们喜爱的空间

你的环境对你的行为有深远的影响,往往超过意志力。优化你的空间可以让好习惯更容易养成,坏习惯更难养成。

实施

  • 优化工作空间以提高专注力:确保良好的照明、符合人体工程学的家具和最少的干扰。
  • 为不同活动指定区域:为专注工作、放松和创造性思维创建单独的区域。
  • 减少积极习惯的摩擦:让生产性任务的工具易于获取(例如,日记或健身装备)。
  • 增加消极习惯的摩擦:增加干扰的障碍,例如将手机放在另一个房间。

15.7 有意识地导航大脑状态

你的大脑在三种主要状态下运作,每种状态适合特定任务。成功取决于识别这些状态并有效地在它们之间转换。

三种状态

  1. 放松:适合创造力、反思和战略思考。
  2. 工作:最适合专注执行和解决问题。
  3. 过热:一种适得其反的状态,压力降低了效率。

实施

  • 学习你的状态指标:识别你进入每种状态的时间(例如,精神清晰度与疲劳)。
  • 将任务与状态匹配:将深度专注任务留给工作状态,将创造性任务留给放松状态。
  • 发展过渡仪式:使用短暂的活动如散步或呼吸练习在状态之间转换。
  • 避免过热:当压力积累时休息以防止倦怠。

AI 时代的营销 4P:经典理论的新解读

· 阅读需 7 分钟

2024 年,Notion 的估值突破 100 亿美元,这一成绩可以用 McCarthy 的 4P 营销理论重新解读。4P——产品、价格、地点和促销——依然是营销的核心要素。这套由 E. Jerome McCarthy 在 20 世纪 60 年代提出的理论,将营销归纳为最基本的四个层面。然而,在如今这个初创公司竞速前进、传统规则被不断打破重写的时代,4P 的支柱又该如何进化?让我们一起来探索 4P 在科技创新领域的应用。

1. 产品:从满足需求到创造痴迷

在 20 世纪 60 年代,产品是核心:制造人们需要的东西,就能卖得出去。而今天,仅仅满足需求已经远远不够,最成功的科技产品能够创造痴迷

Notion 并不是因为市场需要另一个生产力工具而成为百亿美元公司。他们的成功在于,他们成为了数百万人的默认思维空间。Notion 将强大的功能(如数据库和模板)与愉悦的体验(如高度定制化和美观设计)相结合,创造了一种独特的吸引力。在 AI 时代,个性化是推动创新的关键。

创始人应该问:

  • 我的产品是否会随着用户行为的变化不断进化?
  • 我的产品是否能用竞争对手无法企及的方式惊喜并取悦用户?

优秀产品不仅解决问题,更会打造一个用户无法离开的生态系统。

2. 价格:免费的心理学与增长的艺术

过去,定价常常基于“成本加利润”的公式,而今天,定价更像是心理博弈与扩展能力的结合。免费增值(Freemium)模式是 2C SaaS 行业中非常常见的商业模式,而 Notion 则在这个基础上实现了创新。通过让核心功能免费,Notion 将用户转变为品牌的传播者,同时向企业用户提供不可或缺的增值服务并收费。

这一模式的核心是:定价不只是金额的问题,更关乎用户的进入门槛。用户需要在掏钱之前,已经感受到巨大的价值。在 AI 驱动的产品中,这种模式尤为显著——新增用户的边际成本几乎为零,而随着网络效应的增强,用户对产品的感知价值会显著提升。

创始人需要问自己:

  • 我是否在降低用户进入门槛的同时提升长期价值?
  • 我的定价策略是否能有效促进病毒式增长?

3. 地点:无处不在的数字化生态

在 McCarthy 的年代,“地点”通常指的是实体分销渠道。而今天,“地点”已经彻底数字化,其核心是如何实现既无处不在又不会过火

Notion 很少依赖广告,而是通过有机传播扩展影响力。用户创造的模板和内容在社交媒体上广泛传播,产品本身成为了分销的最佳引擎。

AI 技术进一步加速了这一趋势。通过 API 和第三方集成,“地点”已经扩展到其他生态系统中,例如 Slack 机器人、Shopify 插件和 Zapier 自动化工具。

创始人需要思考:

  • 我的产品是否能自然地融入用户的数字生活场景?
  • 它是否能够无缝集成到其他平台中,为用户创造更多价值?

4. 促销:社区驱动的新范式

促销曾经意味着广告购买和媒体曝光,而今天的关键在于社区的力量。Notion 成功地通过赋能创作者(如 YouTuber、教育工作者和中小企业)来展示产品,从而建立了一个狂热的用户社区。

在 AI 时代,促销的方式从“高声宣传”转变为“倾听用户”。社区建设的意义在于,赋予用户话语权,让他们来定义产品的叙事。OpenAI 的 ChatGPT 之所以成功,不仅因为产品本身优秀,更因为它让用户发现了许多团队未曾预见的使用场景。

创始人需要问:

  • 我的用户是否已经成为最好的推广者?
  • 我的社区是否在推动产品的持续优化和进化?

重新定义 4P:AI 时代的营销蓝图

4P 理论并不是过时的遗产,而是一份经久不衰的指南:4P 是营销的全部和全部的营销。Notion 的崛起表明,尽管营销的基本原则依然有效,但在 AI 驱动的新时代,它们可以被重新解读和应用。

随着 AI 技术的持续演进,4P 将进一步发生变化:

  • 产品将根据用户行为数据被 AI 不断优化;
  • 定价将变得更加个性化与动态化;
  • 地点将扩展到更多 AI 原生的环境;
  • 促销将借助 AI 打造个性化的社区体验。

对于初创公司而言,挑战在于,如何既保留核心价值,又与时俱进。最终,成功的营销不仅是吸引用户,更是打造一个与用户长期共鸣、持续增长的生态体系。这正是现代科技创始人需要掌握的关键,也是我们希望通过这篇文章为你传递的洞见。

一亿美元的遥测错误:OpenAI 的故障教会我们系统设计的知识

· 阅读需 5 分钟

在 2024 年 12 月 11 日,OpenAI 发生了一次灾难性的故障,使 ChatGPT、他们的 API 和 Sora 中断了超过四个小时。虽然故障发生在每家公司身上,但这次故障特别引人注目,因为它揭示了现代系统设计的一个关键教训:有时我们添加的工具以防止故障,反而成为故障的根源。

十亿美元的讽刺

有趣的是:这次故障并不是由于黑客攻击、部署失败,甚至不是他们的 AI 模型中的错误引起的。相反,它是由于一个旨在提高可靠性的工具引起的。OpenAI 正在添加更好的监控以防止故障时,意外地造成了他们有史以来最大的故障之一。

这就像雇佣一个保安,结果他把所有人都锁在了楼外。

故障滚出的雪球

事件的经过如下:

  1. OpenAI 部署了一个新的遥测服务,以更好地监控他们的系统
  2. 该服务用 API 请求淹没了他们的 Kubernetes 控制面板
  3. 当控制面板失败时,DNS 解析也中断了
  4. 没有 DNS,服务无法相互找到
  5. 工程师无法修复问题,因为他们需要控制面板来移除有问题的服务

但最有趣的部分不是故障本身,而是多个保障系统同时失败:

  1. 测试没有捕捉到问题,因为它只在规模上出现
  2. DNS 缓存掩盖了问题,足够长的时间让它传播到各处
  3. 用来修复问题的系统恰恰是那些崩溃的系统

三个关键教训

1. 规模改变一切

遥测服务在测试中工作得很好。问题只在部署到数千个节点的集群时出现。这突显了现代系统设计中的一个基本挑战:一些问题只在规模上出现。

2. 保障系统可能成为风险因素

OpenAI 的 DNS 缓存,旨在提高可靠性,实际上通过掩盖问题使情况变得更糟,直到为时已晚。他们的 Kubernetes 控制面板,旨在管理集群健康,成为了单点故障。

3. 恢复计划需要恢复计划

最令人震惊的部分?工程师无法修复问题,因为他们需要正常工作的系统来修复损坏的系统。这就像需要一把梯子才能够到你需要的梯子。

系统设计的未来

OpenAI 的响应计划揭示了系统设计的未来走向:

  1. 解耦关键系统:他们将 Kubernetes 数据面板与控制面板分开,减少相互依赖
  2. 改进测试:他们正在添加故障注入测试,以模拟大规模故障
  3. 应急程序:他们正在建立即使在其他一切失败时也能工作的紧急访问系统

这对你的公司意味着什么

即使你不是在 OpenAI 的规模下运营,这些教训依然适用:

  1. 在规模上测试,而不仅仅是测试功能
  2. 提前建立紧急访问系统
  3. 质疑你的保障系统——它们可能隐藏着风险

可靠系统的未来并不是防止所有故障,而是确保我们能够快速而优雅地从故障中恢复。

记住:最危险的问题不是我们能预见到的,而是那些从我们构建的保障系统中突然冒出来的。

不充分的平衡:系统如何失败以及机会藏在哪里

· 阅读需 8 分钟

在 2018 年,FDA 终于批准了用于短肠综合症婴儿的鱼油营养——这种治疗在欧洲已经拯救了数十年的生命。延迟并不是由于监管者的无能,而是 Eliezer Yudkowsky 所称的“无效平衡”的教科书案例:一个稳定但不理想的状态,在这个状态下,明显的改进未能实现。虽然美国婴儿使用大豆基配方奶面临高达 30% 的死亡率,但接受鱼油基替代品治疗的欧洲婴儿,死亡率降至 9%。这种明显的差异揭示了即使是先进的系统也可能被惯性所困。

不充分的平衡出现在没有任何单一参与者——无论是公司、监管者还是个人——既没有激励也没有手段来改善系统时。当市场高效时,往往会消除这种低效。但在某些领域,系统性约束加剧了失败,为那些愿意挑战现状的人创造了机会。

系统惯性的隐性成本

以美国医疗保健系统为例,医疗错误仍然是第三大死亡原因,每年导致超过 250,000 人死亡。与航空业通过严格的错误追踪将事故减少 65% 不同,医院很少追踪错误率或发布绩效指标。这种失败并不是由于医疗专业人员的无能,而是结构性障碍的结果。医院害怕诉讼、监管处罚和声誉损害,形成了一种隐瞒而非透明的文化。不充分的平衡:得以维持。

同样,在网络安全领域,尽管威胁不断上升,许多组织仍然依赖过时的做法。采购流程、合规要求和纯粹的组织惯性创造了一个即使是优越的解决方案也难以获得 traction 的系统。这些系统性盲点——嵌入在政策、习惯和文化中——将组织锁定在次优结果中。

来自技术的教训:打破平衡

技术行业,常常因其活力而受到赞誉,也并未免于这些陷阱。几十年来,程序员忍受着笨拙的版本控制系统。像 CVS 和 Subversion 这样的工具充其量只是渐进式的改进,未能挑战根本性的低效。林纳斯·托瓦兹(Linus Torvalds)作为版本控制工具领域的外部人士,创造了 Git——这不是一个渐进式的改进,而是一个范式转变。Git 的分布式模型和性能优势打破了不充分的平衡,展示了大胆的、由外部驱动的创新如何使停滞的系统复苏。

识别机会的框架

Yudkowsky 的不充分平衡概念提供了一种视角,以识别系统何时适合被颠覆。它依赖于三个问题:

  1. 市场效率:该领域是否迅速消除低效?
    • 高效市场,如高频交易,几乎没有明显的机会。
    • 低效市场,如医疗保健,受到不透明定价和激励不对齐的困扰。
  2. 系统性约束:是否存在阻碍改进的结构性障碍?
    • FDA 的规定要求昂贵的大规模研究,阻碍了像鱼油营养这样的解决方案,即使其好处已经很明显。
    • 学术研究优先考虑新颖性而非复制,导致关键发现未得到验证。
  3. 信息不对称:你是否拥有他人所缺乏的见解?
    • 患者在小众疾病上往往比全科医生研究得更透彻。
    • 初创公司由于不受官僚主义的束缚,可以超越现有企业。

机会在召唤

对于企业家和技术领导者,这一框架指向可操作的策略:

  • 针对系统性约束限制现有企业的领域。
  • 专注于远未达到最佳的“足够好”市场。
  • 寻找低技术障碍的高摩擦问题。

例如,考虑气候技术。碳捕集充满了不充分的平衡:资金缺口、政策惯性和根深蒂固的能源利益减缓了采用。然而,那些能够绕过这些系统性障碍——通过模块化解决方案或非常规融资模式——可以改变这一格局。

打破不可能的神话

“不充分的平衡”提醒我们,没有人解决一个问题的原因并不总是技术上的不可能——往往是系统性的不对齐。问“为什么没有人已经做到这一点?”是错误的问题。正确的问题是:

  • 什么激励维持当前状态?
  • 我可以绕过哪些他人无法绕过的障碍?
  • 我如何在等待系统改变的同时提供价值?

考虑 OpenAI。当学术 AI 研究在资助周期和发表或灭亡的激励下停滞不前时,OpenAI 建立了一个以月球计划为重点的组织,优先考虑部署而非论文。通过绕过传统的学术约束,他们加速了进展并占领了前沿。

对于你内心的乐观主义者

对于乐观主义者来说,不充分的平衡不仅仅是问题——它们是通往隐藏机会的地图。历史表明,系统不会自我修复;它们是由那些看到他人忽视的事物并在他人不愿意时采取行动的人修复的。无论是改变婴儿护理、重写网络安全规则,还是开创新技术,最大的突破来自于理解不仅是什么破碎的,还有为什么——并敢于去修复它。

因此,下次当你遇到一个破碎的系统时,不要将其视为一个无法解决的混乱。仔细看看。在它的约束中,潜藏着一个等待被抓住的机会。

如何有效地构建和销售软件

· 阅读需 5 分钟

构建成功的软件需要卓越的产品开发和战略分发。以下是实现这两者的框架。

战略基础

愿景与使命

  • 愿景:定义你希望创造的未来状态
  • 使命:概述推动实现该愿景的核心行动
  • 战略总计划:绘制从小胜利到重大目标的关键里程碑

构建过程

开发方法

  1. 从 PRFAQ(新闻稿/常见问题)开始,以确保与客户对齐
  2. 利用社区反馈识别痛点
  3. 设置激进的时间框架:
    • 功能:最多 2 周
    • 项目:最多 1 季度

产品评估框架

跟踪我们构建的内容及其如何服务客户,使用产品地图

解决方案用例Jobs to be done评分(质量 × 分发)
[按受众或目的分组的功能][具体功能][情景驱动的任务或目标][影响评估]

例如,

解决方案用例Jobs to be done评分(质量 × 分发)
区块链用户的资产流动性Bridge促进跨区块链网络的资产无缝转移...
网络参与者的透明度Cuckoo Scan (主网)为用户和开发者提供详细的主网交易和区块数据...
Cuckoo Sepolia Scan (测试网)帮助开发者在沙盒环境中探索和测试...

质量评估(极佳产品框架)

维度核心问题1(不足)3(好)5(极佳)
魔法体验是否带来愉悦?令人沮丧令人愉快用户成为传播者
美学吸引力设计是否周到?杂乱干净必要的,优雅的
技术卓越是否解决复杂问题?基础稳定使不可能变得轻松
生态系统契合是否无缝集成?高摩擦运作良好开启新可能性
市场影响是否改变类别?同类产品渐进式定义类别

分发评估(市场框架)

维度核心问题1(不足)3(好)5(极佳)
客户参与是否吸引/留住客户?留存差中等忠诚品牌传播者
品牌认知品牌强度?未被认可可信赖标志性
渠道有效性分发表现?覆盖有限关键细分市场广泛、无缝覆盖
营销创新策略独特性?通用有些独特性引领潮流
收入增长可持续增长?增长有限稳定增长市场领导者

分发策略

初创阶段策略

  • 私人的对外联系(冷 DM) - 由于平台风险,需战略性使用
  • 内容驱动的 SEO(博客 + 工具)
  • 精心管理的联盟计划
  • 针对性生命周期电子邮件
  • 补充付费广告

最佳实践

  1. 留存和推荐:优先考虑如何使产品粘性强且易于推荐
  2. 持续反馈:积极收集并融入用户反馈
  3. 平台选择:为每个功能使用适当的工具

测量与迭代

使用上述工具持续评估和调整:

  1. 使用框架对工作进行评分放到产品总图
  2. 识别与愿景/使命和用户反馈不一致的地方
  3. 给下一步需要迭代的改进排序
  4. 根据需要更新战略计划

通过集中地图详细说明我们如何、在哪里以及以何种方式服务客户——结合指标和市场反馈——我们可以更自信地进行迭代,确保每个解决方案都得到良好管理,改进由清晰、基于事实的见解驱动。