反馈数据规模、频率、机制在二十一世纪已发生根本变化,这是数字化和智能的本质,也是影响未来商业重要的变量之一。在技术领域,用户行为反馈带来互联网的相关性,AI算法的误差、奖励、强度等反馈机制涌现智能,基于简单反馈规则的算法,结合海量的反馈数据,正在创造让人惊奇的表现,并解决复杂问题,无论是搜索、推荐引擎还是大规模预训练模型。在商业领域,新的商业模式总是基于新的生产力而诞生,特斯拉影子模式、预训练大模型(GPT)、谷歌自动驾驶(Waymo)、亚马逊智能化应用、奈飞正在以基于数字化反馈流的算法自学习能力赢得优势。
这本书将为读者介绍数字时代技术与商业的第一性原理,在更普适的认知、科学、万物演化的背后,如何提出创造性地假设,如何高效率地反馈,如何建立模拟演化机制,是更为通用的反馈系统常识,为读者带来解决问题的全新视角。
这本书写给将生存在未来的读者,特别是对于那些希望在数字化时代持续创新的新一代管理者,以及新一代的跨界思考者。
埃隆?马斯克(ElonMusk)在一次访谈中被问到,人生中zui大的挑战是什么。他一反常态地沉思了很长时间后的答案是:确保你能有纠错反馈循环,然后,能够持续保持这个循环。
反馈在一个强调学习能力的时代尤其关键,它是一种测量,是一种分类,更是化解复杂性的根本方式,任何事物都能从反馈中找到打开新世界的线索,也能从反馈中找到改进的方向。
就像在练字的过程中,你要从字帖与自己书写的字之间的偏差找到改进方向。
就像在股票市场,特别是在复杂交互增加的环境下,只有持续的动态反馈机制才可以帮助我们更好地把握明确的机会。
在今天,你和你的组织,显然需要立基于高效的反馈系统,建立学习效率优势,获取快的进化速度。
当数字化和智能化的能力越来越普及,比软件、数据和算法这些工具更重要的是数字化和智能化的思想,我们是否建立了适合新时代的世界观、数字化思维方式和基础知识体系?正是当下的你需要突破的主要瓶颈。
微小的努力只要有反馈就有意义。身处数字化时代,再小的个体都要善于利用反馈效应,这将帮助你在变革业务、制定战略、优化决策及高效地处理复杂性问题等方面更快速地建立优势。
1.反馈是什么
在2019年,曾经有朋友和我讨论,传统搜索引擎的地位会被采用相近模式的新竞争者颠覆掉吗?我告诉他,概率不高。互联网超级应用核心的优势在于海量的用户反馈数据。在搜索引擎里,有亿万用户正在通过搜索与内容互动,这些反馈数据和其他信号一起对内容质量和相关性进行排序。更重要的是,反馈数据的规模已经形成不断自我强化的正反馈效应,越多用户搜索和点击,就越能准确地对内容排序,就有越多用户使用。如果不能用新一代的游戏规则建立新的正反馈效应,一般很难在存量市场里实现翻盘,就像很多搜索战争在成熟的PC搜索战场打响,却并未改变竞争格局,而短视频、社交等其他赛道的应用产品内的搜索则很难使用户对其形成第一认知,并以此促进用户规模和反馈规模的正反馈。不仅搜索如此,推荐引擎等几乎所有的互联网分发产品背后的运行逻辑也都是大规模的用户在以海量实时的浏览行为对内容、商品和服务的质量做反馈。
互联网的变革,本质上是大规模用户行为的实时数字化反馈。普通数据价值有限,反馈数据才更有价值,用户的应用反馈是基于某种假设的反馈,其中包含着需求的表达、质量的评估等关于世界在如何运转的规律。但是,这需要算法的自学习能力和符合高价值数据分布和算法自学习机制的产品架构,才能充分释放海量反馈数据中的潜在知识。
这一代人工智能技术也是基于反馈机制创新而实现了突破。对于样本数据中隐藏的规律,算法会有一个初始预测假设。然后,复杂的高维计算会被约简为梯度反馈问题来优化求解。也可以简单理解为,预测值与真实值的偏差度量会被反馈给模型,进而向偏差小的方向自动调整模型参数,并不断重复这个假设和反馈的循环实现持续学习的效果。就像练字的过程中,你要从字帖与自己书写的字之间的偏差找到改进方向。智能在并不追求细节准确的海量数据反馈下涌现,结合强大算力,神经网络这种计算模式在反馈机制创新的作用下,具备越来越强大的自学习能力。
DeepMind(一家AI研究公司)首席研究科学家、伦敦大学学院教授大卫?席尔瓦(David Silver)及其合作者在一篇题为 Reward is enough (奖励反馈)的论文里提到,人工智能及其相关能力不是通过制定和解决复杂问题而产生的,而是通过坚持一个简单而强大的原则:奖励大化,他强调的本质上也是一种反馈机制。
不仅是在互联网和AI领域,反馈还有更广义的存在价值和内涵。反馈是有假设检验能力的信息,能够基于此发挥着推动假设演变的交互作用。而假设是我们深入认识这个世界的动态过程中不断更新的认知和状态,假设也是世界自身向前演化的基础方式和起点。对于观察者的认知过程,假设就是A/B Test(假设测试)里面的题目,反馈就是结果。对于被观察者的演变过程,例如生物的基因变异在提出新假设,而自然选择就是反馈。观察者的认知和被观察者的演化,其实是同一个过程的两个视角。
一切只能证伪不能证明。波普尔说,一切真理换个角度看都是等待证伪检验的假设。反馈则是一种测量,是一种分类,是化解复杂性的根本方式。我们通过反馈对假设的检验来收敛相对分散的假设,并使我们有足够的信心将这些假设付诸实践。这个过程就是从假设与反馈的偏差中找到打开新世界的线索。只有你把脚伸进水里那一刻,你的皮肤感受到的刺激才能告诉你这里的水温适不适合游泳,你的感受就是反馈。就像励志的歌词里唱的不去开始就永远不知道,就是这个再简单不过的检验方式所包含的信息,在驱动认知与万物演化。
我们将要讨论的反馈和经典控制论里的反馈并不相同,反馈是因为基于主动、有倾向性的假设而具有意义,是对假设的测试、应用、模拟,是对假设的检验和推动。而假设也会在反馈的驱动下,基于从假设到反馈的快速循环形成知识进化和持续升级的复利效应。例如,算法模型的预测就是一个主动假设,并非被动和随机。建立假设的能力和反馈一样重要,假设和反馈共同决定了效率。更准确地界定是假设-反馈循环(Hypothesis Feedback loop,HFL)框架下的反馈。或许,我们称为数字认知论会更贴切一些。在这个框架里,抽象演绎体系和实证归纳体系统一在一起,并在相互推动中被不断加速。特别是以数字化的方式抽象概括、虚拟化之后,以数学逻辑的方式基于HFL可以实现更快演化。下一步,HFL还要将数字化升级为智能化,加速万事万物运转,使整个社会的成本历史性地下降。
反馈看起来极其简单而常见,但它的内涵远不仅是维纳(Wiener)早在经典的控制论中提到的,反馈是为了消除偏差带来控制,例如,今天更多是从偏差反馈中拟合、学习和解释世界。我们希望讨论的是,当它与具体的场景结合起来并运行于其基础层面时,呈现出的不同具体实践。
2. 反馈为什么如此重要
反馈在一个强调学习能力的时代尤其关键。我们的世界正在全球、国家、公司的不同层面上经历两种转变,一个是从水平、规模驱动的增长转向深度和创新驱动的增长。另一个转变是大环境正在加速复杂化。应对这些变化,都需要我们提升学习效率,而学习的本质就是假设和反馈的循环,特别是在数据和智能算法革命性加速反馈效率的新技术条件下。其实,认知的突破和世界的演进都是在反馈的驱动之下发生的。
复杂性和不确定性混淆的世界
复杂性、不确定性,这两者经常被混杂在一起。复杂性是计算问题,是由很多简单因素和规则的叠加、交互影响和反馈效应加速带来的。比如,少了一颗钉子,掉了一个马掌,失去一匹战马,输掉一场战争,灭亡一个国家的混沌现象,比如天体之间的三体现象。不确定性是世界运行规则及对其本质属性的认知问题,比如量子态。我们将重点讨论可计算的复杂性,人们平时所说的不确定性并不是量子物理所描述的不确定性,本质上是复杂性。为了保持语言一致,本书中也会使用不确定性这个词汇,其内含保持与大众用法的一致,即表达认知层面的不明确。
瑞典皇家科学院将2021年的诺贝尔物理学奖授予三位在复杂系统(Complexity Science)研究上做在突出贡献的物理学家,他们正在尝试以更多元的交叉视角来寻找对复杂系统的更好解释。今天的世界正越来越呈现出复杂系统的特点,创新和复杂性就是这个不断加速中的世界所呈现出的两面性。更加违反直觉的是,这种复杂性通常都是在没有控制的情况下,由极少数简单的反馈规则演化而来;开放系统的内外部反馈使其比封闭更容易在混乱中形成自发秩序;不精确的自适应性反馈驱动的演进也比控制更容易在快速变化中获得生存机会。无论你是否准备好,我们就生存在这些新假设下面。有很多你已经习以为常,却正在不断失效的做法,都需要在新的假设之下被重新评估。
以简单化解复杂的反馈机制
1997年击败国际象棋世界冠军卡斯帕罗夫的方法是基于人工规则的大规模的深度搜索,早期的翻译也是基于大量人工规则,然而这些方法后来都因为不可逆地变得越来越复杂而不可继续。基于通用、简单的反馈机制和算法规则配合算力和数据的放大来解决问题被证明是可持续的,算法会不断提升通用性,强化学习就是简单反馈规则在海量重复学习中涌现智能,ChatGPT(预训练语言大模型)代表的大规模预训练模型基于简单规则和海量数据就能涌现让人意外的语言能力。而基于人工规则的系统更适合在数据驱动的模式下做可靠性的底线保障。
进化过程中基因变异形成的新假设和自然选择的反馈,共同帮助生物向更高的适应能力演化;科学家的假想和思想实验,以及实验室内外不同形式的实验和实践反馈,在推动科学发展;互联网通过海量用户行为投票反馈来决定排序策略的预估模型,从而实现个性化;AI算法根据反馈数据调节模型参数和网络结构,从而涌现智能;反馈信息推动了脑和思维的形成。甚至,你身边的更多例子都是在基于这个朴素的方式在运行。就像你在读过这本书之后才能形成反馈,才会知道自己对它的预期是否准确,这可以帮助你在以后做出更好的判断。
这看似一个简单的框架,却在不同的组织团体内、在不同的生物神经系统内,在不同的具体情景下,表现为形式不同的反馈传递机制。而且,这种细小的差别会在反馈循环中被迅速叠加和放大,在不同的反馈循环之间又存在交互影响,这就造就了世界的复杂万象。反过来看,在同一类别、同一领域中,不同参与者、不同模式表现出的差异,就有来自不同假设与反馈机制的作用。这也是我想在这本书里讨论的,简单的规则在反馈机制作用下演化出一切,在案例、规律、原理三个层次分别展开。你的切入点可以是从反馈的结构、主体、关系、机制等角度,反馈数据的规模、速度等维度。
这个简单框架的复杂性还体现在,任何看似确定的假设都已经被市场充分消化,基于此的静态推演就不可靠,因为参与者总是会基于此做出进一步的反馈,就像股票市场。特别是在复杂交互增加的环境下,只有持续的动态反馈机制才可以帮助我们更好地把握明确的机会。
3. 数字化加速反馈,逼近认知加速的奇点
反馈本身也没有意义,如何以不同的方式更高效地转化和利用反馈中隐藏的信息,反馈才有了意义。如果说这个时代有什么特别,另一个很重要的变化是数字化从根本上改变了反馈数据的规模、全面性、速度、精度,在反馈数据质量和效率同步提升的背后是数字化技术创新与反馈结构、机制的共同进展。显著的例子,包括互联网和物联网节点的密度及其产生的实时数据流。也包括人工智能深度神经网络的深度和层次结构,在反向传播反馈机制下涌现的智能。还有,区块链技术支持下的个体对个体的去中心化反馈结构,以新信用机制催生Web3.0(第三代互联网)。基本的反馈机制规律会以不同的形式重复出现在不同的应用场景,并起到决定作用。
此外,AI在处理大规模数据方面也具备了统计潜在规律,并发现假设的能力,从而能够实现自学习。特别是在物理等自然学科陷入实验手段不足这一困境的阶段,新的研究范式出现是一个好消息。
这些重要的变化组合在一起,就形成了更加快速的HFL循环,就像把整个世界装进了数字化的加速器,随时有新的撞击帮我们打开新的世界。如果说互联网改变了连接价值的方式,那么数字化将改变创造价值的方式。当数字化和智能化的能力越来越普及,比软件、数据和算法这些工具更重要的是数字化和智能化的思想,我们是否建立了适合新时代的世界观、数字化思维方式
韩博,在BAT从事十余年集团战略改革与创新工作,推动AI业务落地,有多项个人人工智能算法发明专利授权。前奥美创意,服务IBM、Thinkpad等品牌,获得多项创意奖项。
前 言
第1章? 在数字化反馈中指数级加速
一切解决问题的方法都可以通过数字化反馈的方法来表示和优化。当反馈数据的速度接近实时,获取与计算成本无限趋近于零,我们就会接近认知的奇点,几乎一切社会效率都会因此提升,成本随之下降。算法探索新假设,海量数据反馈实时检验,演化周期无限缩短。
1.1? 认知加速的奇点? / 004
1.2? 数据经济新体系? / 023
第2章? 反馈效率决定进化速度
不同的世界基于不同的反馈机制运转,就有了不同的进化速度。当人类本能的内部世界还停滞在石器时代,外部世界则在数字化反馈驱动下不断加速,进化差距会被无限放大为首要挑战。
2.1? 连接网络如何在反馈中持续演化? / 036
2.2? 计算智能的局限和方向? / 083
2.3? 周期叠加新个人计算中心、元宇宙、Web3.0? / 117
2.4? 基本矛盾原始本能的慢反馈? / 141
第3章? 在新反馈系统中加速
突破原始生存模式下碳基自然形态的局限,带来增加的进化系统各自遵循不同的反馈规则,但同样可以帮助人们赢得优势,并充满新机会。
3.1? 满足新消费如何实现不可逆升级? / 165
3.2? 创造随机的超级个体,确定的To i生态? / 183
3.3? 组织反馈效率边界与再组织? / 198
3.4? 科技混合进化优势? / 227
第4章? 反馈效应和可持续商业
新商业成功的本质在于,充分利用数字化反馈流和自主学习的智能技术所代表的新生产力,这也是这个时代慷慨的红利,并建立适当的反馈效应来持续驱动。
4.1? 不确定性的化解之道? / 242
4.2? 反馈流和新商业? / 246
4.3? 适应修复市场不连续性的负反馈? / 268
4.4? 增长正反馈的非线性强化? / 288
4.5? 创新跨周期迁移? / 299
4.6? 智能商业的定义性模式? / 329
4.7? 复杂性螺旋? / 360
第5章? 运行在底层的反馈系统
更加普适的假设 - 反馈机制中,假设的创造性和反馈的数字化是两个第一性的驱动因素,而数字化仿真环境中的模拟技术会根本性地加速反馈。
5.1? 创造性假设? / 371
5.2? 反馈驱动智能体? / 387
5.3? 反馈、模拟和计算的未来? / 410
第6章? 来自未知的反馈
一切在我们假设预期之外的反馈往往被我们视为噪声,而正是这些信号,却连接着未来。基于假设 - 反馈的框架,借助数字化反馈和智能技术,融合多学科的进展并回归共性基础,更加通用的数据驱动的认知科学正在形成。
6.1? 认知的极限? / 429
6.2? 新认知科学? / 436
附录:关键课题快捷索引