深入了解大模型的微调——什么是LoRA,PEFT,DeepSpeed,ZeRO

深入了解大模型的微调——什么是LoRA,PEFT,DeepSpeed,ZeRO

1个月前

自从谷歌的那篇开创性的论文《注意力就是你所需要的一切》发表以来,大型语言模型 (LLM) 就随着ChatGPT的发布而风靡全球,这导致了生成式人工智能和 OpenAI 等公司的兴起。现在,一些大型商业 …

在2024 VDC,听一曲“蓝心智能”的江河协奏

在2024 VDC,听一曲“蓝心智能”的江河协奏

1个月前

作为科技从业者,我们每年参加的终端产品发布会和开发者大会,少则几十场。说每一场都别有新意,那自然是不可能的,但每次去vivo的活动现场,总能给我耳目一新的感觉。 雨果说过,音乐可以表达难以用语言描述, …

谷歌提出视觉记忆方法,让大模型训练数据更灵活

谷歌提出视觉记忆方法,让大模型训练数据更灵活

1个月前

目前,多数大模型一旦经过预训练,其内部结构便难以改变,就像把知识刻在石头一样。如果你想对模型的数据进行更新,就需要对整个模型重新训练,消耗大量时间和AI算力。 为了解决这一难题,谷歌DeepMind的 …

一看就懂!AI 核心概念速通指南

一看就懂!AI 核心概念速通指南

1个月前

01 引言 在数据驱动的时代,机器学习已经成为企业和个人的热门选择。然而,很多初学者常常被一堆术语和概念搞得晕头转向。别担心,这篇文章将带你快速掌握机器学习的这几个核心概念,帮助你轻松入门AI世界! …

一键使用多个人工智能大模型搜索

一键使用多个人工智能大模型搜索

1个月前

常用人工智能大模型的有很多ChatGPT、通义千问、豆包、文心一言、讯飞星火、kimi等等很多,使用起来就像小学生问老师问题一样,需要一次次的重复跳转到多个大模型进行提问,再等待回答,然后再对比答案, …

国家人机混合增强智能重点实验室项目:利用生成世界模型优化多智能体系统决策

国家人机混合增强智能重点实验室项目:利用生成世界模型优化多智能体系统决策

1个月前

生成模型在单智能体场景中的应用已经取得了显著进展。例如,UniSim通过预测图像中的动作来推断未来的情景,展示了从广泛数据中学习的模拟器可以推广到现实世界,并弥合仿真与现实的差距。而Genie则允许用 …

铁矿评价及铁前一体化优化配矿模型研发与应用

铁矿评价及铁前一体化优化配矿模型研发与应用

1个月前

夏志坚1 ,瞿 涛1 ,吴洪义1 ,春铁军2 ( 1. 宁波钢铁有限公司,浙江 宁波 315807; 2. 安徽工业大学冶金工程学院,安徽 马鞍山 243032) 摘 要: 根据宁波钢铁公司原料及工艺 …

包教包会!仅用Joinpoint回归分析GBD数据库拿下一区top(IF=9.2)

包教包会!仅用Joinpoint回归分析GBD数据库拿下一区top(IF=9.2)

1个月前

引言 传统的回归模型无法呈现疾病分布趋势局部的变化特征,而Joinpoint回归模型却能完美解决这个缺点,方法简单,一学就会! 今天我们将详细介绍什么是Joinpoint回归模型,并用一篇GBD文章为 …

《空战中的战术和敏捷飞行动作生成:基于长短期时态融合Transformer学习》

《空战中的战术和敏捷飞行动作生成:基于长短期时态融合Transformer学习》

1个月前

在空战中,斗狗提出了错综复杂的挑战,需要同时了解战略机动和敏捷战斗机的空中动态。在本文中,我们介绍了一种新颖的长短时间融合变换器 TempFuser,该变换器旨在学习空中斗狗中的战术和敏捷飞行动作。我 …

移远通信新发布宝维塔™「匠心」平台,引领工业AI视觉新篇章!

移远通信新发布宝维塔™「匠心」平台,引领工业AI视觉新篇章!

1个月前

本文来源:智能通信定位圈 本文作者:露西 基于AI模型在提升效率与削减成本等方面的巨大潜力,多个行业正以高涨的热情投身于AI模型的研发与应用。 然而,打造一款成功的AI模型并非易事,它要求跨越重重挑战 …