“AI应用正率先在B端爆发。由企业级大模型工程平台、异构算力平台组成的新型AI基础设施,将替代传统云计算,为大模型应用在企业生产力场景中的规模落地提供关键支撑。”11月12日,在上海举行的百度世界2024现场,百度集团执行副总裁、百度智能云事业群总裁沈抖说。
目前,百度智能云拥有中国最大的大模型产业落地规模,超过六成的央企和大量的非公有制企业,正在联合百度智能云进行AI创新。百度智能云千帆大模型平台已经帮助客户精调了3.3万个模型、开发了77万个企业应用、文心大模型日均调用量超过15亿次。
2024年,大模型产业落地显著提速,在行业场景覆盖广度、落地深度等方面都有显著提升。目前,百度智能云已经在能源、电力、制造、金融、交通、政务、互联网、教育、电商等数十个行业、几百个场景中落地大模型应用。
在能源电力行业,国家电网正在围绕文心大模型、千帆平台,结合电力行业高质量数据,联合百度共创电力行业大模型基础底座,并在调度、设备、营销等六大专业领域深入探索。目前,已经在电力设备运检、供电服务等电力行业核心场景成功完成应用落地。
在餐饮行业,中国最大的餐饮公司百胜中国,基于文心大模型打造了AI智能客服系统,为旗下包括肯德基在内的多个品牌提供服务。百胜中国CTO张雷表示,目前,AI客服每天能够为百胜中国处理超过15万次消费者沟通,问题解决率高达90%;在辅助人工方面,AI客服能快速归纳、总结消费者诉求,辅助客服更快速、更精准地回复,整体效率提高10%!此外,大模型还能够实时评估客服服务质量,帮助百胜中国逐步提升服务水平。
目前,百度智能云已拥有中国最大的大模型产业落地规模。已有超过六成的央企和大量的非公有制企业,正在联合百度智能云进行AI创新,文心大模型日均调用量超过15亿次。
沈抖认为,AI应用正率先在B端爆发,而“企业级”AI应用大量涌现的背后,是产品服务形态的突破性变革与能力的大幅拉升。
以百度智能云“曦灵”数字人平台为例,全新升级的“文生3D数字人视频”功能,能够大幅度的提高电商、教育、文旅等行业的内容创作、营销推广效率,大幅度降低成本支出。
比如,在电商领域,过去拍摄制作真人产品推广短视频要专业团队花费几天时间才能完成。而“文生3D数字人视频”只需一句话,就能生成符合不一样的行业场景特色的3D数字人形象和专业灵动的视频,成本仅有传统方式的1%,工作效率提升超过1倍!
沈抖表示,无数的AI应用,正在重新定义人与数字世界、物理世界之间的交互方式。现在,这些应用已经深入到企业“研产供销服”的所有的环节,并成为企业提升竞争力的关键要素。
传统的企业业务中,复杂的工作和任务往往过度依赖专家经验和固有流程,即工作流;即便在数字化系统中,传统工作流配置依旧是没有“大脑”的机械执行,难有实质性的突破。
大模型具备强大的意图理解和泛化能力,能够充分理解工作流的目的与内涵,相当于一颗会思考的“大脑”;通过与企业工作流相结合,又可以有效解决大模型“幻觉”问题,增强大模型“控场能力”,保障复杂任务的决策与执行准确。二者结合,构成了智能时代企业真正需要的“数字员工”。
本次大会,百度智能云千帆大模型平台正式对外发布“工作流Agent”功能,旨在帮企业快速开发出面向复杂对话场景的AI应用,快速拥有专业水平的“数字员工”。通过学习各种企业流程与规范,工作流Agent能适应不同岗位职责,快速规模化复制,大幅度的提高企业运转效率。
“我们在实践中发现,行业应用要达到更专业的效果,需要深入模型层面进行定制开发或精调。精调模型的数量某些特定的程度上反映了大模型与产业结合的深度。这个数量今年增长地特别快,在千帆大模型平台上,每天有超过一半的调用量是来自精调后的模型。”沈抖说。
而针对数据积累不足,难以承担人工精标数据成本的企业,千帆平台全新推出模型蒸馏解决方案,帮企业利用文心旗舰级大模型生成专业数据,完成全流程的数据准备工作,加速启动模型精调工作。
大算力是大模型落地的基础条件。为满足企业落地大模型从集群创建、开发实验,到模型训练、模型推理的全旅程算力需求,百度智能云推出百舸AI异构计算平台 4.0,服务了中国石化、中海石油、长安汽车、上海交通大学、地平线等行业有突出贡献的公司和机构,目前已具备了成熟的10万卡集群部署和管理能力。
沈抖表示,为了支撑大模型的进一步快速地发展,百度智能云提前布局,是行业内最早打磨10万卡集群能力的厂商之一,并通过技术创新解决了集群算力供给、跨地域部署两大核心难题。
首先,在算力供给方面,百舸平台兼容昆仑芯、昇腾、海光DCU、英伟达、英特尔等国内外主流AI芯片,支持同一智算集群中混合使用同一厂商不同代际芯片、不同厂商芯片,最大限度上屏蔽硬件之间差异,帮助中国企业摆脱单一芯片带来的高溢价和供应链风险。
目前,在万卡规模集群上,百舸能够将两种芯片混合训练大模型的效率折损控制在5%以内,达到业界最领先的水平。未来,“一云多芯”将成为中国企业的必然选择。
另一方面,10万卡规模超大集群需要占据大概10万平方米空间,相当于13个标准足球场;每天则要消耗大约300万千瓦时的电力,相当于北京市东城区一天的居民用电量。这种对于空间和能源的巨大需求,远超传统机房部署的承载能力,而跨地域机房部署又会给网络通信带来非常大挑战。
通过设计高效的网络拓扑结构,结合模型切分优化和跨地域无拥塞高性能网络方案,百舸能够在横跨几十公里的多机房组成的万卡规模的集群上,将单一模型训练任务的性能折损控制在4%以内,达到业界最领先水平。