在业界,有个著名的“不可能三角”
甲方乙方都懂的
想要又便宜又快又好的
那就只能做梦了
巧了,今天又看到一个
【大模型的不可能三角】
嘿嘿,风光无限的大模型
也逃不过三角形魔咒呀
成本指的是企业大模型落地的整体费用,包括大模型的训练成本、推理成本以及部署、运维和升级成本等。
企业有时仅关注有形成本:例如GPU购置费用、消耗的电费,或从第三方服务商购买模型服务的费用;而会忽略无形成本:包括为实现大模型服务而配置的人力成本,以及大模型在部署、训练或调试阶段消耗的时间成本等。
核算成本时,需要考量总持有成本,特别是不要忽略无形成本。按成本从高到低,一般为深度研发大模型、微调、RAG、提示词工程、直接调用。
效果指的是大模型生成内容的质量,包括内容的准确性,是否存在幻觉问题,或是否会生成不合适的内容。
大模型效果可以基于“3H”原则进行评价:1)Helpful:内容可用有帮助,不要废话连篇、泛泛而谈;2)Harmless:内容合规无害处,符合伦理规范和监管要求;3)Honest:内容正确无幻觉,不要一本正经地胡说八道,甚至给出错误信息。
通常来说,大模型的参数规模越大,生成效果越好。因此,当业务需求对生成内容质量要求严苛时,应尽量选择参数规模更大的模型。
此外,目前市场上主流商业化模型的效果,大多优于同期同参数规模的开源模型。
性能指的是大模型服务的速度,包括大模型的训练速度,推理时的响应速度、生成速度等。
一般而言,大模型的参数规模越大,则需要的训练时间越长,即训练速度越慢,而其进行推理服务时的需求响应速度和内容生成速度也越慢。
因此,大模型的效果和性能不可兼得,当成本固定时,大模型的选择主要是在效果和性能之间进行平衡和取舍。对于性能要求较高而对效果有一定容忍度的场景,可以选择参数规模相对较小的大模型。
来源:GenAI技术落地白皮书
当然,这个三角很好
让痴迷大模型的甲方们认清现实
更加理性的去选择大模型落地路径
在成本、效果、性能间进行权衡和取舍
这三角不是我杜撰出来的
来自于我今天刚刚读到的一份报告
《GenAI技术落地白皮书》
新鲜出炉,干货不少
↓
这份白皮书是阿里云研究院出品的
但几乎没有夹带任何“私货”
更没有吹自家的通义大模型多NB
而是站在客观立场,从企业视角出发
讲述大模型在企业落地的关键点
包括“选-育-用”三段论
基本上,做好这三步
企业的大模型,就算没白上
比如:在选择阶段
如何评估各种技术路线
如何权衡不可能三角
比如:在培育阶段
如何利用提示词工程、RAG、微调
来进行大模型工程化适配
每种方式的优劣和成本如何考量
比如:在使用阶段
企业的基础设施该如何建设
业务流程如何升级
GenAI时代的DevOps如何运转
大模型的安全与合规问题如何保障
总之,这份白皮书,站在企业视角
从大模型选择、适配、优化、业务整合
再到基础设施搭建、开发运维、模型安全
覆盖了整个生命周期
给出了很多真知灼见