AI变革的未来不是大模型，而是...｜万字精读

linbin123456 03-28 5

默认

【在售政府平台债每日一更】

摘要： AI变革的未来不是大模型，而是...｜万字精读最近，新的AI大模型Claude3火出圈，作为GPT-4的竞争者被寄予厚望，然而我们认为AI领域真正的爆发机会在别处—应用层。I...

微信号：18321177950
添加微信好友, 获取更多信息
复制微信号

AI变革的未来不是大模型，而是...｜万字精读
最近，新的AI大模型Claude3火出圈，作为GPT-4的竞争者被寄予厚望，然而我们认为AI领域真正的爆发机会在别处—应用层。
Index Venture和我们有相同的看法，为此这家投资机构撰写了4篇分析报告，详细阐述了看好AI应用的核心观点。
总结起来就是：人工智能时代软件产业将被重塑，每个软件都会叠加上AI技术，AI技术的扩散会像当年数据库一样，AI无处不在，但软件真正的竞争优势从来不是数据库，应用爆发才是未来！
数据库最终变成了一个重要的软件技术，但软件公司身价过亿，靠的是差异化能力，AI大模型也会走向同样的道路。
今天，我们为大家带来了4篇文章的完整翻译，方便你一次看懂专业投资机构如何看AI。
更多精彩内容和独家分析，欢迎点击文首入口，加入前哨科技特训营获取！
1.人工智能正改变软件产业价值链
正如云计算的崛起带来了软件即服务（SaaS）模式的诞生一样，面向AI原生架构的新商业模式也将随之涌现。
十五年前，云计算的兴起引领了软件产业的一次平台转换，开启了软件即服务（SaaS）的新纪元。
企业不再需要自行设置服务器和配置数据库，而是将其外包给专业团队，后者为成千上万的客户提供托管服务。
开发新软件产品的公司因此能专注打造卓越体验的产品，无需担心底层运行的各种数据库和服务。
SaaS模式使得公司能够将非核心业务的软件管理外包，软件产品因此更加经济、安全、可扩展，并且更新和优化的速度更快。
过去十年，我们见证了软件价值链的重大转变，这进一步推动了技术生态系统的深刻变革。很明显，当前正处于另一场由AI驱动的平台变革初期阶段。
这一变革建立在两个基本信念之上：
首先，未来十年内，AI将成为每一个开发和发布的应用软件的核心部分；
其次，这一转变将由基础模型的广泛采用推动。正如云计算的兴起重塑了软件价值链并催生了新的商业模式，随着AI理念的实现，你我将见证类似的变革。

这些新商业模式的具体形态尚不确定，但已经可以看到软件价值链变化的苗头，看到新模式的早期迹象。
在基础层面，正如十年前云服务商的崛起一样，一种新的公司出现了，他们专门负责维护基于最新研究而更新迭代的基础模型。
这一领域的公司数量不会很多，因为这既需要巨额投入，也需要深入的知识储备去训练和管理大型模型。

与云服务商类似，随着时间的推移，这些产品在某种程度上会变得标准化；它们的价值在于规模经济。大多数这样的公司，类似于云服务商，采取按使用量计费的商业模式。
在应用层面，随着时间的推移，商业模式将转向更多地捕捉AI释放的客户特定价值。
在这个世界里，客户可以根据产品的定制化或个性化程度来支付费用，比如说，根据特定行业、组织或个人需求微调的模型。
基于这一视角，我们投资了Gong和DeepScribe等公司，它们的商业模式是：产品随时间的增加而越来越定制化。
我们在2020年投资了Gong。他们的产品能够记录销售电话，领导者可以据此分析业绩，洞察客户反馈趋势，培训和指导销售代表。
当一个组织广泛采用Gong的产品时，它能够积累丰富的客户对话数据，这使得Gong能够根据具体企业的需求定制其服务，从而提升用户体验。
DeepScribe的产品能够利用AI记录医生与患者之间的对话，并为电子健康记录生成结构化的医生笔记。
这类产品的持续使用不断增加其对特定用户（例如，具有特定诊疗风格的医生）或特定用户群（例如，在同一医疗机构内，遵循一致标准的特定专业医生）的价值。
在这两种情况下，随着产品使用的不断深入，客户将更多自己的数据输入到系统中，AI能够以更加针对性的方式进行优化和改进。
这是AI原生公司构建竞争优势并实现长期价值增长的一条路径。
这还为一种新型的托管基础设施公司创造机会，这些公司帮助软件企业在基础模型供应商之上提供个性化服务。
新一代基础设施供应商的崛起，他们正在成为价值链中的一个重要环节，类似于近几十年来数据库供应商的发展。

我们的投资组合中的公司，如 Scale AI（Index 于 2018 年投资）和 Humanloop（Index 于 2020 年投资），正在简化团队在产品中部署模型的过程，即使他们没有大量的机器学习专业知识。
这些产品让用户能够利用人工标注和实时用户反馈来比较和微调模型的性能。
构建伟大AI公司的核心理念是：我们将持续支持那些专注于开发能为客户创造价值的卓越产品的创始人。
2.每个软件应用都将整合人工智能
原生的 AI 应用通常会超越那些后期加入 AI 功能的应用。
在过去二十年中，我们见证了 SaaS 产品的爆炸式增长，它们已成为日常工作中不可或缺的部分。
这一代应用程序旨在支持从头到尾的工作流程，并促进各利益相关方之间的协作。然而，许多应用本质上是数据库上的用户界面，用于跟踪项目、文档和操作的状态。
对于这些产品，AI 已经被用于特定任务，比如文档处理、语音转录或者辅助编码。
2018年，我们投资了由 Chris Urmson（Waymo 的 CTO）、Drew Bagnell（Uber 的自主架构师）和 Sterling Anderson（Tesla 的 Autopilot 主管）创立的自动卡车公司 Aurora。
2020年，我们投资了 Covariant，该公司专注于为机器人制造 AI 大脑，主要用于工业仓储和履约。公司由 AI 机器人技术领域的两位领军人物 Pieter Abbeel 和 Peter Chen 创立。

Covariant 致力于构建通用 AI 机器人大脑，现在他们能够在最小的 AI 培训下适应特定客户的硬件需求，这种做法正在取得成效。
最近在生成模型（如 ChatGPT 和 Stable Diffusion）方面的进展，将我们推进到一个 AI 的快速发展阶段，这激发了全球的想象力。
展望下一代 SaaS 应用，我们特别期待以下几点：
首先是利用 AI 支持头脑风暴、讲故事和开放式创新工作流程的产品。在概念艺术和文案创作领域已经看到了这些应用，这些领域因为风险低、过程高度依赖手工操作，并且人类参与其中，成为理想的用例。
其次是将 AI 应用于特殊知识工作领域，如工程、法律或医学的应用。这些领域人类专家仍然需要参与审核结果，但这些领域投资回报率很容易衡量。
第三是将更多 AI 工具嵌入企业和专业消费者工作流程的应用。
这一点通过我们在 2020 年对 Hebbia 的投资得以体现，Hebbia 是一个为知识工作者提供服务的 AI 驱动企业搜索平台。
这些产品将帮助用户更高效地沟通、吸收和搜索信息、快速行动，从而提高整体生产力。但这比前两点更具挑战性，因为企业需要稳定和安全的保障来确保提供一致的用户体验。
成功的初创公司应该构建直观易懂的产品，让人们不需要深入了解其背后的机制也能轻松学习和使用，顺畅地融入现有的流程和工作关系，并产出更精确、可预测的结果。
这些产品将提供细致的调控手段，以人体工学的方式让模型适应用户，而非让用户去适应模型。
AI 原生应用的世界令人兴奋之处在于，它提供了一个机会，可以从零开始设计直观的界面，并设置相应的安全边界。
展望下一代产品，它们将通过与用户的互动来学习，用户将拥有精细的工具来引导模型输出，使 AI 成为我们需要合成数据、生成内容或解决重复任务时的多模态助手。
3.基础模型最终将成为所有 AI 驱动软件的核心
机器学习新概念中的“基础模型”，指的是那些在没有特定终端用途考虑下，用大量数据预训练的大型人工神经网络。
OpenAI 的 GPT-3 就是一个知名案例，它的训练目的仅仅是预测给定文本前文后的下一段文本。然而，基础模型可以通过在较小的手工标记数据集上进行“微调”来执行特定任务，比如回答客户问题。
基础模型能够带来出人意料的类人通用技能。大多数 AI 模型都是针对特定任务的数据进行训练的：机器人手臂被训练用于拾起物体，自动驾驶车辆被训练用于驾驶。
基础模型消耗来自互联网各处的大量数据，编码了人类几千年来学到的大量知识，几乎任何 AI 应用都能从基础模型的基本使用中受益。

有些人类任务看似狭窄，比如驾驶、在仓库中装箱或回答客户问题，但我们经常将从生活其他方面获得的理解应用于这些任务。
这就是为什么机器人看到传送带上的猫时会不知所措，为什么遇到不合规则的交通场景时自动驾驶车辆会停下来的原因。
类可以基于对动物和建筑的知识，将这些情况放入当时的情景，并继续做出新的判断，机器不行，这就是我们的超能力。
随着时间的推移，工程师将越来越多地使用预训练的基础模型，然后对其进行针对特定任务的微调。
基础模型并不会使孤立的 AI 模型变得“人性化”，但其使用将帮助模型理解最不寻常的情况并解决它。
例如，理解人类司机的愤怒情绪将帮助自动驾驶车辆进行导航。识别一只误入仓库的猫并不应出现在传送带上，将帮助机器人处理这种混乱情况。
对几乎所有 AI 模型来说，最困难的情况是那些之前未曾遇到的“长尾”事件。
Cohere 是由 Aidan Gomez 共同创立的，他参与撰写了“Transformer”架构的论文。我们在 2021 年领投了该公司的 A 轮融资，认为像十年前的云巨头一样，会有少数提供商涌现，他们将简化开发、管理和托管这些模型背后的复杂性。
基础模型要想真正像人类一样理解事物的意义，还有很长的路要走，但它们正在以极快的速度进步。
4.AI普及类似数据库的历史
在过去的五十年里，数据库一直是应用软件的基础，而在接下来的五十年里，机器学习模型将成为这一基础。
对机器学习及其工作原理的基本了解将成为每位工程师工具箱中不可或缺的一部分，而不再是少数专家的专有知识。
虽然机器学习工程师总会有其位置，但他们的数量会变少，主要集中在少数大型供应商处，就像那些构建数据库引擎的人一样。
事实上，过去十年的AI进展与 20 世纪后期数据库领域的发展惊人相似。早期数据库的进步经历了几个特定的阶段，每个阶段大约持续十年。
步阶段（1960年代）：首批数据库问世。它们是一个强大的新概念，但使用起来非常困难。访问简单的数据都相当复杂，高效检索的责任完全落在开发者身上。
算力不足阶段（1970年代）：1970年，埃德加·科德（Edgar Codd）发布了一系列论文，提出了数据库的关系模型，带来了熟悉并喜爱的行和列的标准模型。
这种模型的优美之处在于其灵活性，可以适应各种用例。尽管这是数据库历史上的一个重要时刻，但最初十年却遭到很多怀疑。虽然这些系统使用起来和推理起来更容易，但它们需要更多的算力。
商业爆炸阶段（1980年代）：这十年见证了关系型数据库的繁荣。
随着计算资源变得更加经济，关系数据库的成本效益大大提高，易用性使它们成为今天的主要力量。
关系数据库利用查询优化将大部分性能管理从开发者转移到数据库本身，这使得使用这些系统的专业要求远低于之前的网络和层次数据库。SQL（1976年发明，在 80 年代中期标准化）成为数据库的通用语言，大型公司如甲骨文成为商业巨头。
无处不在的阶段（1990年代至今）：快进四十年，几乎世界上每个软件应用都在使用数据库（无论是关系型的还是其他类型的）。
了解数据库如何工作成为程序员学习的首要知识之一，且不同层次的开发者都至少需要基本了解它们以便有效工作。
没有哪家公司会考虑自己构建数据库——这样做在成本效益上是不现实的。相反，他们使用现成的产品，并在其上用特定用例的数据模型（架构）。
有趣的是，这一发展进程与我们在机器学习和人工智能商业采纳方面所见的情况非常相似。
仅限大公司阶段（2017年前）：起初，训练一个有实用价值的机器学习模型是一项高度专业化且非常复杂的工作。
你需要寻找自己的数据，找到足够的计算资源来训练这些数据，选择一个架构，还需要深入了解如何进行超参数调整以优化训练输出。
所有这些都是成本高昂的，并且非常困难。即使不使用任何深度学习技术，这也是真实的情况。
早期Transformer阶段（2017-2020年）：像数据库一样，一切始于一篇论文。
在 AI 领域，这篇论文名为《注意力就是一切》（"Attention Is All You Need"），介绍了一种称为Transformer的算法架构。
这很快被一系列预训练的基础模型（如 BERT、XLNET、GPT-2）采用，这些模型使用该架构实现了领先的结果，尤其是在语言领域。
模型随后被开源，类似于可以在关系数据库中添加模式以适应特定用例，用户可以在自己的数据上微调这些基础模型。
大模型创业阶段（2020年至今）：这个阶段始于 OpenAI 发布 GPT-3。
OpenAI证明Transformer模型可以扩展到数十亿参数，而性能不会降低，一个大型预训练的基础模型可以在许多不同任务上表现良好。
OpenAI 通过 API 提供 GPT-3，加上它的通用性，导致了像 Jasper 和 Copy.ai 这样的公司的爆炸式增长。
就像查询优化器将性能的复杂性从应用开发者转移到数据库供应商一样，AI 的这个阶段正见证训练的复杂性从最终用户转移到模型供应商。
无处不在的阶段（未来）：很快，说一个产品“使用 AI”将像说一个产品“使用数据库”一样显得平常和显而易见。
今天，普通开发者可能不知道查询规划器是如何工作的，但他们肯定使用数据库。
我们预计五年后的普通开发者可能不会了解Transformer是如何工作的，但他们知道如何使用模型。
Cohere 和 Twelve Labs 等公司已经为文本和视频创建了这些基础构建模块，用户能够像使用数据库一样轻松地访问强大的模型。
这些模型日益普及的一个证明是，无数公司将 AI 作为核心组成部分，但并不将其作为主要的差异化因素宣传，大模型本身会变成一个开发细节，它很重要却并非差异化因素。
真正的区别在于，利用模型构建的出色产品体验，这与 Salesforce 因其出色的产品体验而崛起一样，大家并不关心它的数据库性能怎样。