趋势一:将会有更多多模态大模型
在最新公布的各种大模型中,几乎都离不开多模态,从GPT-4V(有视觉功能的 GPT-4),到AI视频生成工具Pika 1.0,再到谷歌发布的大模型Gemini,等等。
为什么呢?在一些典型AI应用中,多模态大模型都表现出极强的可交互性,可帮助开发者与最终用户精准理解输入信息的上下文关联和隐含信息。在行业实践中,多模态大模型能通过对多维度信息的强力感知,持续强化推理能力,拓展服务边界,提升应用场景中的全面性和可靠性。与语言/视觉大模型一样,多模态大模型也是当前大模型训练和开发的重要方向。
趋势二:大模型在端侧部署加速
随着大模型小型化、场景化需求增加,推理将逐步从云端扩展向端侧。如AI PC,继英特尔推出首个AI PC处理器后,联想集团、惠普、宏碁等厂商相继发布多款AI PC新品。联想表示,有超10款笔记本已经可以本地运行AI大模型,还有一批新品将陆续上市。
如AI手机,2023年下半年开始,小米、OPPO、vivo等手机厂商纷纷入场,在新系统中增加大模型能力。到2024年1月,中国手机市场Top5中,除苹果之外,已经全数发布自有端侧大模型产品。大模型在终端侧的部署加速,无论是在PC、手机,还是其他终端产品上。
趋势三:大模型不断深入垂直行业领域
三六零集团创始人周鸿祎近日在某活动上表示,千亿大模型是通才,但是在单项技能上,经过专业训练的垂直大模型只强不弱,面向企业级场景的百亿参数大模型成本更低,性价比更高,更适用于企业级场景。
垂直领域的大模型更专注于解决具体行业问题,它更能满足特定行业和领域的需求,具有更高的应用价值和商业潜力。根据机构调研,通用大模型趋于收敛,垂直行业应用成为大模型产业落地的关键赛道。大模型发展呈现出从技术到产品、再到商业化应用的发展路径,并不断深入垂直行业领域。
趋势四:智能化应用将呈现爆发式增长
2024年被认为是人工智能的应用之年,智能化应用将呈现爆发式增长,产业化和商业化进程不断加速。从ChatGPTS应用商店开始,到国内智谱AI智能体商店、钉钉AI助理平台,可以说是群雄逐鹿。根据IDC的预测,到2024年全球将涌现出超过5亿个新应用,这相当于过去40年间出现的应用数总和。
就今年1月OpenAI宣布上线的GPT Store应用商店而言,它与苹果App Store商店类似。GPT Store目前已有超过300万个自定义版本的ChatGPT应用。对于开发者收入方面,OpenAI表示,在今年第一季度,其将推出GPT创建者收入计划。这意味着以ChatGPT为代表的大模型在接下来商业化进程将会得到加速。
趋势五:生成式人工智能模式将不断扩展
过去一到两年时间,生成式人工智能不断突破,从文生图,到文生音频、视频、代码等。在文生视频方面,虽然已经取得重大进步,它已经能够在某些场景中进行使用,然而对于一些传媒行业来说,现在的文生视频还没有办法达到让人满意的程度,不过接下来会持续有突破。
同时,除了文本、代码、图像、视频和音频之外,生成式人工智能将拥抱更多身临其境的模式,包括调动三维、嗅觉和味觉等其他感知,帮助科学界研究蛋白质结构和材料。如,由谷歌Deepmind开发的GNoME模型已经在材料科学领域取得了突破性进展,发现了新的晶体结构,它将为计算机带来更好的电池。
趋势六:AI Agent成为AI应用主体形式
AI Agent通常被视为一种融合感知、分析、决策和执行能力的智能体,它可以具备相当显著的主动性,成为人类的理想智能助手。例如,AI Agent可以根据个人在线互动和参与事务处置时的信息,了解和记忆个体的兴趣、偏好、日常习惯,识别个体的意图,主动提出建议,并协调多个应用程序去完成任务。
调研机构数据显示,绝大多数企业认为AI Agent是AI发展的确定性方向,有50%的企业已经在某项工作中进行AI Agent试点,另有34%的企业正在制定AI Agent的应用计划。
趋势七:具身智能机器人渗透率加速提升
在具身智能状态下,机器人具备自主学习和计划能力,遇到障碍和困难可以自主反应、快速解决。行业人士认为,人形机器人实际上是一个载体,当大模型和人形机器人相结合时,机器人可以帮助AI大模型感知物理世界,操作环境上下文;机器人利用多模态感知控制自己的身体,完成复杂的任务。
数据显示,2023年至2025年期间,可以结合通用大模型,让机器人能够在工业和商业方面实现服务;到2025至2030年,机器人将更智能化,会涉及更多领域的场景应用,如知识陪伴和家庭陪护,机器人能够实现自主感知、认知和决策。
趋势八:大模型让数字人应用加速
大模型的出现,给数字人产业带来了根本性改变。传统数字人技术主要依靠预设参数和有限的模型训练,大模型技术则为其提供了近乎无限的训练参数和自主生成能力,使数字人更为真实多样。大模型在很大程度上解决了数字人的自然语言理解能力。
伴随着技术的长足进步,数字人产品和服务作为链接软硬件的入口级产品,正以更快的速度融入金融、物流、能源和建筑等领域,扮演主播、代言人、客服和智能助理等角色。也许在不久的将来,我们是身处陌生场所时,人类不再是第一求助对象,没有语言障碍的数字人将会是我们更好的选择。
趋势九:智算中心成为关键基础设施
算力是设备通过处理数据,实现特定结果输出的计算能力。算力可以分为通用算力、智能算力和超算算力。早前通用算力占整体算力的比重达到90%以上,近些年随着人工智能技术的发展,智能算力规模迅速增长。2023年来大模型迅猛发展,更是让智算中心成为建设的重点,各地方和企业都在积极建设智算中心来支持大模型的训练和部署。
同时,随着专有领域的计算需求提升,AI芯片追求更高的性能和更低的功耗,这将推动AI芯片的多样性和生态丰富性不断提升。
趋势十:合成数据打破AI训练数据瓶颈
数据瓶颈指的是可用于训练AI的高质量数据的有限性,合成数据有望打破这一瓶颈。合成数据是在模仿真实数据的基础上,由机器学习模型利用数学和统计科学原理合成的数据。
有论文表示,模型的规模至少要达到620亿参数量后,才可能训练出“思维链”能力,即进行分步骤的逻辑推理。但人类产生的不重复、可供训练的优质数据并没有这么多。而使用ChatGPT等生成式人工智能以前所未有的数量产生高质量合成数据,未来的AI将由此获得更高的性能。