图片

AI已经太久没有一个“哇哦”时刻了。

自ChatGPT首次惊艳世人以来已经过了快两年时间,人们似乎已经开始习惯了AI作为一个什么都“略懂”的万金油选手出现在身边。可这样的时间久了,难免会让人觉得稀松平常。今年5月,AI头部品牌发布了旗下最新版本的大模型,然而收获的不是“哇哦”,而是“即便能像博士一样推理,也比不出9.11和9.9谁大谁小”这样的吐槽。

的确,目前的AI,能力在提高,但是效果有限;场景没突破,功能不再惊艳。这也是AI大模型应用遇到的普遍困境。这尴尬的氛围正在外溢:比如,手机上的AI功能,作为人们接触AI门槛最低、最频繁、依赖性最高的使用场景,也因为AI行业整体的延宕而缺乏“爆点”。

客观的说,手机AI好不好用?当然好用。不然也不会有众多手机AI产品出色的活跃度和用户体量。但是如果深究到底有多好用?相信资深AI用户们只要深思熟虑一番,或多或少都会有些“摸到了AI的边界”的感觉。

但这种感觉对于一个被寄予“颠覆未来”厚望的品类来说却是大忌。行业也亟待扭转这种温吞的状态。问题是,如何扭转?

10月10日,vivo开发者大会(VDC)召开,vivo发布了全新AI战略:蓝心智能。同步发布的新产品还包括全面升级的自研蓝心大模型矩阵、OriginOS 5、蓝河操作系统2等。与此同时,vivo还披露了其在安全、人文、生态合作等方面的一系列最新成果。从这里,我们看到vivo对于AI的现状和未来确有独到的理解和尝试。同时,在审视vivo诸多能力落地的过程中,也碰撞出一些对于AI发展的新鲜观察。

图片 vivo副总裁、OS产品副总裁、vivo AI全球研究院院长周围

重新思考AI的位置

在今年初的MWC上有一种普遍的观点,那就是AI或许应该暂时被放在“副驾驶”的位置上。实际上,这种论调体现了当时人们对于AI既新奇又疏离的感受。智能硬件行业也是如此,即便2024年被称作“AI手机元年”,但在当时相对保守的氛围下,手机端的AI服务也大多以AI小助手、AI问答APP,甚至只是AI修图等形式呈现。

然而,这种仅仅把AI定义为“助手”的思维显然禁锢了AI在手机端发挥作用的潜力。如今,以vivo为代表的手机厂商开始重新审视AI的定位,尝试让AI发挥更大的主动性。

在vivo发布的“蓝心智能”全新AI战略下,vivo决定充分释放AI的能动性,将大模型技术与手机操作系统深度融合,利用 AI 赋能OS。

具体来说,vivo的实践将在重构人与设备的交互体验,重构人与数字世界的服务体验,重构人与物理世界的沟通体验这3个方向协同推进。

  • 在人与设备的交互体验方面,vivo向AI释放了手机端所有层面的交互能力。从简单的打字、语音,向包括圈、点、滑、拨,甚至声音的情感等不同的方面延伸。比如,在使用“小V圈搜”进行搜索时,用户可以长按导航条激活小V,还可以直接将图片、文件、文字拖拽给小V。甚至可以不输入命令,直接随手用指尖圈选内容发给小V。这就避免了很多“问不到点子上”的尴尬时刻。毕竟把自己想问的问题翻译给AI也很费神。在vivo的设计下,无论怎样交互,小V都会将想要了解的内容反馈给用户。

    图片

小V圈搜

  • 在人与数字世界的服务体验方面,vivo让AI与人的关系更近了。首先是将“垂直AI”的理念下放到手机端,除了助手小V以外,还通过“蓝心智能体广场”塑造了小V作业助手、小V运动教练等专家AI。这就从一定程度上解决了AI“泛泛而谈”的问题。此外,vivo让AI介入了人使用手机的痕迹,分析用户用手机的习惯,把用户喜欢的文章和视频等用更有逻辑的方式呈现出来。

  • 在人与物理世界的沟通体验方面,vivo努力让AI更加显示出积极主动的一面。此前,vivo的蓝心大模型已经升级了语言大模型和端侧大模型的能力,并带来vivo自研的语音大模型、图像大模型以及多模态大模型,拥有了听和看的能力。在此基础上,vivo让AI能够读屏,能够通过摄像头“看懂”外部世界。比如,在vivo的“看见”APP蓝心升级版中,视障人士就可以把手机镜头对准周围环境和物品,让手机成为他们的眼睛。此时,APP会自动播报它“看见”的内容和文字信息,让他们能够独自安全地走到更远的地方。因为有大模型的加持,用户还可以与AI进行多轮语音对话,得到更多细节信息。

图片

实际上,vivo提出了相当现实的愿景,却起到了根本逻辑上的改变。不用太多科幻的许诺,通过将前沿的AI大模型研究充分释放到手机端,vivo就能将AI从机械的你问我答的“副驾驶”身份中解放出来,适当地帮人类把握方向盘,甚至充当教练的角色。当人们体验了AI解禁后的洪荒之力,就像发现了老朋友的另一面,很难不“哇哦”一下。

正如vivo副总裁、OS产品副总裁周围所说,“手机不是一个神秘的东西,它就是我们生活、工作所依靠的东西。vivo就是想把它的基础体验做好,把基于产品的那些功能增强”。的确,手机本身已经成为人身体的延伸,手机中的AI没有道理不为人类承担得更多。

理念背后,AI能力落地的硬实力

可以看到,vivo的重构战略是将现有手机端AI能力整体向前推进了一大步。如何能够支撑这样的体系性进化?在VDC上,vivo公布了蓝心大模型矩阵和OriginOS 5,向世人集中秀了一波肌肉。

图片

一方面,此次蓝心大模型矩阵的集中展示是最令人激动的环节:

vivo几乎在大模型的所有前沿应用领域都有所突破,一口气拿出了升级版语言大模型,以及发布3B端侧大模型、蓝心语音大模型、蓝心多模态大模型等全线产品,可谓火力全开。

其中,升级后的蓝心语言大模型在上下文能力、推理能力、准确度以及时延上,均有明显提升。新发布的vivo自研蓝心语音大模型可以准确理解自然语义,实现超低时延对话,还可以感知人的情绪、模拟人的音色,像朋友一般与用户聊天,甚至担当同声传译的角色。这次新发布的还有蓝心图像大模型和蓝心多模态大模型。蓝心图像大模型强化了中国特色与东方美学的融合生成能力,是国内最懂中文语境的图像模型之一。而蓝心多模态大模型则提升了识别能力,能够更深层次理解用户的屏幕内容,还拥有更自然的视频流实时对话能力。

而此次的重头戏其实还应该放在新发布的全新端侧大模型蓝心3B身上。这款端侧大模型有30亿参数,但是能力却可以越级比肩拥有70亿甚至90亿参数的同类产品。对比蓝心自己的7B大模型,端侧大模型3B的覆盖场景更多。相比蓝心7B极致性能提升300%,平衡模式下功耗优化达46%,极致出词速度可以达到80字/s,系统功耗仅450mA ,内存仅占用1.4GB,打破了“模型小、能力强、功耗低”的不可能三角定律,实现了以小搏大的效果。

据vivo介绍,蓝心大模型3B已经获得了泰尔实验室端侧大模型综合能力的5星认证以及AIIA安全防范能力5星认证。更令人激动的是,3B还只是一个开始。明年,vivo还将发布端侧视觉大模型和多模态大模型。

考虑到目前vivo蓝心大模型已经在上海人工智能实验室大模型测评榜单、微软的MathVista测试榜单,以及ChartQA测试榜单上都取得了3B参数级排名第一的成绩。在以文本理解为代表的OCRBench榜单上,蓝心多模态大模型13B取得了所有模型参数的最高分,超过了GPT4o、qwen等一众超大规模多模态大模型,我们有理由期待未来vivo将手机的智能化程度推向一个新的层次。

另一方面,承载蓝心大模型矩阵诸多能力的,恰是全新升级的OriginOS 5:

在塞下了前面如此之多的AI大模型能力之后,vivo确实需要一个能够完全释放AI能力的操作系统了。因此,OriginOS 5既是AI的容器,也是AI的出入口。沉浸式嵌入OriginOS 5中的“蓝心小V”拥有了十八般武艺。比如,交互更灵便的小V搜索,推荐内容更精确的小V建议,能够梳理用户喜好按照逻辑呈现的小V记忆。而此前提到的“专家”AI选手们,则通过小V智能体的形式在小V智能体广场里呈现。

图片

同时,OriginOS 5也在流畅度、续航、通信方面针对AI能力的释放作出了相应的优化。实际上,AI的硬实力更需要操作系统的软实力来体现。操作系统优化的成熟与否,直接影响用户对AI的认可度。vivo推出OriginOS 5本身就是对AI与人类交互能力的一次长足探索。也正是对vivo立足“AI重构系统体验”的一次检验。

至此,vivo已经将AI推到了手机端服务C位的位置上。经过战略转变和能力落地,AI的效能得以全部释放,开始作为智力和精力的延伸,为人类赋能。

冷思考:多些务实,少些科幻

纵观vivo的全新AI战略,这其中的平实、务实令人感慨。

诚然,我们已经听过了太多关于AI的远大愿景和宏大叙事了。实际上,当我们将人们对AI的注意力引向科幻场景(比如终极人工智能、AI替代人类等等)时,其实是在消解大众探索AI帮助人类提高的努力。

在当前AI与人类都还在“教学相长”的阶段,我们更需要有人亦步亦趋地做好AI的普及。而这,何尝不是一种科技平权。

又或许,vivo内部“本分”的理念,让其更坚持用户导向,也让产品的功能能够回归本源。

对此,vivo副总裁、OS产品副总裁周围介绍到“我们的本分文化叫平常心文化”,他认为“vivo发展AI的思路和vivo的企业文化是完全一致的”。

周围认为,vivo是“回到本质去思考,本质的东西就是’因’层面的东西,我们把这些东西做好,自然’果’是水到渠成的”。言及至此,不得不提及一个小细节:此前我们评测手机AI应用的过程中发现,在二十余款AI应用中,能够在折叠屏手机展开横放的情况下自动变为横向显示的AI应用屈指可数。而蓝心小V不仅自动适配横向展开,而且还根据用户双手操作的特点进行了布局调整,可谓用心至深。

或许,凡此种种从用户需求出发的小细节叠加在一起,恰能体现vivo“本分”的初心。大概也是vivo能够从用户体验出发让AI重构系统体验的原动力。

无论如何,AI诞生的根本原因就是帮助人类,推动进步。而AI的下一个阶段也必然是渗透社会的方方面面,带来更大的变革。显然,此次VDC让我们看到,对于手机领域,vivo已经作出了根本性的决断,率先下出了先手棋。

特别策划