2024-10-11 18:43·特大号

在业界,有个著名的“不可能三角”

甲方乙方都懂的

想要又便宜又快又好的

那就只能做梦了

巧了,今天又看到一个

【大模型的不可能三角】

嘿嘿,风光无限的大模型

也逃不过三角形魔咒呀

成本指的是企业大模型落地的整体费用,包括大模型的训练成本、推理成本以及部署、运维和升级成本等。

企业有时仅关注有形成本:例如GPU购置费用、消耗的电费,或从第三方服务商购买模型服务的费用;而会忽略无形成本:包括为实现大模型服务而配置的人力成本,以及大模型在部署、训练或调试阶段消耗的时间成本等。

核算成本时,需要考量总持有成本,特别是不要忽略无形成本。按成本从高到低,一般为深度研发大模型、微调、RAG、提示词工程、直接调用


效果指的是大模型生成内容的质量,包括内容的准确性,是否存在幻觉问题,或是否会生成不合适的内容。

大模型效果可以基于“3H”原则进行评价:1)Helpful:内容可用有帮助,不要废话连篇、泛泛而谈;2)Harmless:内容合规无害处,符合伦理规范和监管要求;3)Honest:内容正确无幻觉,不要一本正经地胡说八道,甚至给出错误信息。

通常来说,大模型的参数规模越大,生成效果越好。因此,当业务需求对生成内容质量要求严苛时,应尽量选择参数规模更大的模型。

此外,目前市场上主流商业化模型的效果,大多优于同期同参数规模的开源模型。


性能指的是大模型服务的速度,包括大模型的训练速度,推理时的响应速度、生成速度等。

一般而言,大模型的参数规模越大,则需要的训练时间越长,即训练速度越慢,而其进行推理服务时的需求响应速度和内容生成速度也越慢。

因此,大模型的效果和性能不可兼得,当成本固定时,大模型的选择主要是在效果和性能之间进行平衡和取舍。对于性能要求较高而对效果有一定容忍度的场景,可以选择参数规模相对较小的大模型。

来源:GenAI技术落地白皮书

当然,这个三角很好

让痴迷大模型的甲方们认清现实

更加理性的去选择大模型落地路径

在成本、效果、性能间进行权衡和取舍

这三角不是我杜撰出来的

来自于我今天刚刚读到的一份报告

《GenAI技术落地白皮书》

新鲜出炉,干货不少

这份白皮书是阿里云研究院出品的

但几乎没有夹带任何“私货”

更没有吹自家的通义大模型多NB

而是站在客观立场,从企业视角出发

讲述大模型在企业落地的关键点

包括“选-育-用”三段论

基本上,做好这三步

企业的大模型,就算没白上

比如:在选择阶段

如何评估各种技术路线

如何权衡不可能三角

比如:在培育阶段

如何利用提示词工程、RAG、微调

来进行大模型工程化适配

每种方式的优劣和成本如何考量

比如:在使用阶段

企业的基础设施该如何建设

业务流程如何升级

GenAI时代的DevOps如何运转

大模型的安全与合规问题如何保障

总之,这份白皮书,站在企业视角

从大模型选择、适配、优化、业务整合

再到基础设施搭建、开发运维、模型安全

覆盖了整个生命周期

给出了很多真知灼见