在数字经济与实体经济深层次地融合的今天,智能化转型正成为各行业高水平发展的核心驱动力。从金融到能源,从汽车到电商,大模型技术如同
正如现任百度集团执行副总裁,百度智能云事业群总裁沈抖在《大模型浪潮》一书所揭示的,大模型正在催生全新的商业范式。书中收录了多个行业案例,对于想要抓住
机遇的从业者来说,这就是一本实用的行动手册:既能把复杂的技术原理讲清楚,又能直接教你制定可行的方案。在
曾经汽车只是单纯的交通工具,而互联网则让汽车摇身一变成为移动的智能终端。通过车联网,车主在出发前就能用手机远程控制车内温度,提前营造舒适的驾乘环境。导航不再是模糊的地图指引,实时路况信息让出行路线规划更加合理。
大模型的出现,则让汽车的智能性、舒适性得到逐步提升,从交通工具、智能终端,化身为广大购买的人在家和办公场所之外的“第三空间”。大模型和座舱的结合,就更重要。大模型可以让人车交互更高效,也可以让旅行更有趣。
随着汽车行业的竞争越来越激烈,电池等硬件差异缩小,各大车企纷纷将智能座舱作为重要卖点来吸引消费的人。大模型技术的横空出世,为智能座舱的进化再次注入了动力。大模型带来的提升可以划分为三个代表性阶段。
第一,基础阶段,车企们期待大模型能够像一位耐心的导师,增强基本的语音交互理解能力,实现对话流畅、指令形成等基本功能,让车内交互不再生硬。这就好比为汽车装上了一颗初步感知世界的“心”,开始懂得驾驶者的简单诉求。
第二,进阶阶段,大模型的多模态能力成为关键。车企们期望它能像一位敏锐的艺术家,不但可以精准识别周边风景,更能如同一位经验比较丰富的旅行管家,可以与餐饮、酒店、景区、加油站等旅途所需的服务场所建立紧密的生态合作,实现信息的无缝对接。此时的汽车,已不再仅仅是一个交通工具,更是一个贴心的出行伙伴。
第三,高级阶段,大模型要与座舱系统实现深层次地融合,如同水融一般,彻底提高汽车整体智能化水平。每家车企都渴望借助大模型,形成独一无二的特色能力,为广大购买的人带来专属的非凡体验。要实现这些美好期待,大模型的理解、识别、生成、记忆、交互、多模态等能力缺一不可。
如今大模型已经具备了高级阶段的能力。当然,要将这些能力完美落地,离不开车企智能硬件的有力支持。增加摄像头、雷达等配置,就如同为大模型开启了更多感知世界的“眼睛”,让它能够充分的发挥多模态能力,更好地服务于驾乘人员。
大模型在汽车座舱中的作用,与在智能手机领域的作用有着诸多相似之处,比如提升语音识别能力、交互更便捷等,在此不再赘述。不同之处在于,其知识库融入了更多与汽车紧密相关的内容,比如汽车故障排除、旅途经典信息等,如同一位专业的汽车专家随时待命。
使用场景也和手机端有许多类似之处,比如聊天陪伴、语音控制、智能提醒等。而主动故障提示和紧急主动救援,则是大模型在汽车领域的重要应用,能提高驾驶安全性。尤其是故障发生后,如果车内驾驶人没办法完成报警,大模型就可以基于碰撞数据主动发起报警,并自动上传地点数据,增加救援时间。
更进阶的无人驾驶,大模型可以全面赋能感知、预测、决策等各环节。比如在感知方面,大模型多模态能力可以融合摄像头、激光雷达等多传感器数据,增强对动态场景(如无车道线道路、拥堵路段)的感知能力。
在预测、决策方面,由于大模型的引用,无人驾驶从“规则前置”转向了“自主学习”。传统无人驾驶的做法是进行模块化设计,也就是制定规则、模型识别状况、选择正真适合的规则、执行规则。但是,由于现实路况很复杂,不仅有地区差异,还有天气影响,即使编写各种各样的规则,也无法穷尽。这不仅非常消耗人力、智力资源,而且在遇到一些突发事件时,如果没有提前定义规则,有几率会使无人驾驶无法执行。
在国内,百度是最早布局无人驾驶的企业,并在2024年5月发布了ApolloADFM(无人驾驶大模型),这是全球首个支持L4级无人驾驶的大模型。“萝卜快跑”发布了第六代无人驾驶汽车,全面应用“百度ApolloADFM大模型+硬件产品+安全架构”方案,能够预判和规避潜在风险,明显提升无人驾驶的安全性,已经在武汉等地进行了规模化运营。
金融作为国民经济的血脉与国家核心竞争力的关键支柱,其细致划分领域广泛,涵盖银行、证券、保险、信托、资产管理、金融科技、投资顾问、信用评级、租赁以及金融监督管理等众多范畴。
金融行业作为信息化程度最高、信息技术应用最密集的行业之一,在每一次的科技革命浪潮中,总是勇立潮头、一马当先。从早期的会计电算化起步,历经金融电子化(电子银行)、互联网金融(移动银行)、金融科技(开放银行),每个阶段都带来金融行业在技术应用与服务模式上的重大飞跃,深刻改变着金融生态。如今,金融行业正站在数字化转型的关键节点,变革序幕已经拉开,迫切地需要一场华丽的蝶变。而大模型技术的横空出世,恰似一股强劲东风,为金融服务装上了智能的翅膀,开启了金融行业智能化的崭新时代。
金融行业以知识密度高、时效性强、严谨性高等特性著称,对从业者提出了极高的专业性要求。那么,大模型怎么样才能解决金融行业的需求呢?
大模型解决金融行业的需求并非一蹴而就。通用大模型在训练中金融语料占比往往较低,数据滞后,且金融专业度不足。因此,一定要通过知识增强和专业工具组合来确保大模型生成内容的专业性。这一过程包括预训练、二次训练、精调、检索增强生成等多个环节,以应对不同的专业要求。在工程化落地过程中,大模型隐性知识和图谱显性知识需要相互补充,开放问题和封闭问题是需要结合处理,大模型和小模型需要协作决策,以确保服务业务的严谨性和专业性。
大模型在金融领域的训练过程,犹如员工从青涩到成熟的成长历程。基础大模型经过预训练后,相当于一个学富五车的高材生,有着非常丰富的社会通识和强大的语言、情感及推理能力,但在金融领域尚显稚嫩。随后,结合金融行业的公开数据来进行第二次预训练,大模型便升级为金融科班的从业者,具备丰富的金融学识和专业的行业技能。
然而,这仍不能够满足金融机构的实际的需求。因此,根据银行的具体岗位要求,对大模型进行模型精调,通过有监督微调、人类反馈强化学习等方法,使大模型成为具备专项能力的业务专员,既具备特定技能,又熟知业务规范,还能够最终靠金融行业的合规考核。
精调后的大模型虽然已具备较强的专业能力,但为了更好地使用户得到满足的特定要求,还需继续增强其能力。通过检索增强生成技术,让大模型基于金融机构自有的知识库、代码库、数据等来执行业务,此时的大模型便如同一位特定银行的初级学员,熟悉行内知识、规范及产品详情。在此基础上,进行工程优化,包括提示词学习、智能体开发等,使大模型从初级学员成长为熟练员工,金融机构也由此拥有了一批数字化员工,如数字化风险专员、数字化零售专员、数字化财富专员等。这些智能体不仅具备良好的业务技巧,还能根据特定偏好持续学习,并根据指标考核一直在优化策略。
在大模型迭代过程中,金融机构能够准确的通过自身需求选择正真适合的解决方案。如果希望采用初级的预训练大模型,可基于百度智能云的公有云服务获得;如果希望进行进一步的预训练、微调、检索增强生成、提示词和智能体工程优化等开发工程,则可在百度智能云千帆大模型平台上进行,同时百度智能云还提供私有化方案,确保用户数据、隐私的安全性。
能源是涵盖广泛领域的综合性行业,包括煤炭、石油、天然气,以及光伏、风电等新能源。当前,能源行业的一个大趋势就是,数智化要求越来越迫切。
一方面,传统能源领域告别了过往快速地发展的阶段,进入了平稳的新常态,对公司而言,通过降本提效来改善业绩,就显得更为有必要性,数智化就是很好的途径。另一方面,光伏、风电等新能源的发展改变了传统能源结构,给发电侧、传输侧、用电侧都带来了变化,提升了数智化的必要性。
将大模型、AI应用于能源领域,并不是增加成本,而是带来收益。这也是响应国家号召,形成能源领域新质生产力的重要方式。大模型会为能源领域带来哪些传统技术所不具备的优势呢?
首先,能源领域有许多流程固定的业务场景,而大模型的流程拆解与规则建模能力,也就是前文阐述的智能体的开发,能够迅速学习SOP(标准作业程序)文档、操作手册,实现工单自动生成、合规检查自动化,带来的效率提升是传统技术所不能够比拟的。
其次,能源领域的数据类型多样,既有一些结构化数据,也有非结构化数据;既有文本信息,也有许多图像信息,例如巡检场景下会产生视频数据。传统技术难以处理如此庞大、多类型的数据。但大模型的多模态解决能力、强大的数据处理能力,不仅提高了传统视觉场景的效率和准确性,也能扩大覆盖那些传统技术所不能触达的场景。
最后,能源领域也很注重行业知识的构建和传承,尤其在安全生产等领域,操作规范也是员工培训的重点。传统依靠“师傅带徒弟”的模式,效率不高;集中培训的方式,对偏远地区的一线员工并不友好,也不能满足技能不断迭代的需求。而大模型能够迅速、全面地构建行业知识图谱,将各类型的知识进行归集,助力企业内部的知识迁移、传承,加强人才体系建设。
电网能轻松实现能源的传输,是能源领域的重要支撑。电网企业的数智化最重要,对外起到承上启下的作用,确保电力行业稳定、高效发展,对内致力于提升企业效益。
在电力专业应用场景下,数据资源虽然丰富,但从海量数据中提炼有效信息,构建实时、高效、准确的语义理解与缺陷预测仍然是一个艰巨的挑战。
因此,国家电网有限公司作为特大型国有重点骨干企业,以及行业领军企业,也一直在探索解决行业难题,推动AI在行业的落地。从2020年起,国家电网和百度合作,先后完成人工智能“两库一平台”(“两库”指模型库、样本库,“一平台”指包含运行环境和训练环境的人工智能平台)智能基础设施建设。
2024年,国家电网发布国内首个千亿级多模态电力行业大模型——光明电力大模型,为电网安全稳定运行、促进新能源消纳提供“超级大脑”,并基于该大模型,探索了电网规划、运维、运行,以及客户服务等大模型应用的实践。
设备巡检是一项很重要的工作,旨在确保设备的正常运行,预防故障和事故,延长设备常规使用的寿命,保障生产安全。
传统巡检有较多问题,比如效率低、人员成本高、故障识别率低、信息化水平不足、应急准备不足、环境差导致工作量大且难以执行。随技术的发展,传统的手工巡检方式正逐渐被智能化、自动化的巡检设备所取代,大幅度的提升了巡检的效率和准确性,比如采用无人机巡检、建立视频智能识别系统等。然而,传统视频智能识别系统依然面临两个难点:第一,由于缺乏判断超低频异常事件的样本,系统很难实现冷启动;第二,过去的模型能力较为专一,在不同场景下使用效果不同,很难实现优化。
一方面,可以在原系统上进行视觉大模型升级,从而再次大幅度提高准确度。另一方面,考虑到大模型算力和功耗要求高,不适合用于边缘侧,但边缘侧的小模型准确率和泛化性不如大模型,因此,可以将大模型和小模型进行整合,在边缘侧用小模型进行初步判断,在中心侧用大模型进行复判,同时形成误报数据的标注和数据回流,不断的提高模型准确率。
通过CV(计算机视觉)大模型的使用,发挥其泛化性、通用性,也解决了样本少、冷启动难、不同场景快速优化难等问题。在多数场景中,要求缺陷数据样本量达到500才能启动训练,现在降低到样本量达到150~200就可以启动训练,效率提升3倍以上。
大模型的多模态能力、良好的泛化能力,正改善着能源行业的多个环节。能源行业越来越享受高科技的驱动力,在科技、信息化、数字化、智能化方面的投入和建设密度,都处于各行各业的前列。
电商的核心业务始终围绕“交易”展开,所有业务环节和动作的最终目标都是促成用户下单购买商品。
从电商企业的视角来看,如何通过营销手段赋能交易是核心问题。电商营销流程通常包含四个关键环节:首先,引流获客,即通过社会化媒体、广告投放等渠道吸引潜在客户进入平台;其次,激活转化,即通过个性化推荐、限时促销等方式引导客户完成购买;再次,售后服务,即通过高效的退换货、售后咨询等服务提升客户满意程度和忠诚度;最后,复购增购,即通过会员体系、积分奖励等机制激励客户重复购买,提升客户生命周期价值。
近年来,营销领域正经历深刻变革,尤其是大模型技术的应用,为电商公司可以提供了新的增长引擎。大模型不仅仅可以优化个性化推荐、精准广告投放等环节,还能通过数据驱动的洞察提升客户体验,成为公司竞争中的关键得分点。在这一背景下,电商企业要积极拥抱技术变革,将大模型等创新工具融入营销全流程,以在激烈的市场之间的竞争中占据优势地位。
第一,营销形式的转变。传统图文模式逐渐被直播、短视频等形式取代,这一趋势催生了对数字人的需求,同时对营销的即时性提出了更加高的要求,例如实时互动与快速响应。
第二,内容与社交的重要性提升。社交网络在线营销和内容营销成为关键,企业要具备强大的内容生产能力和潮流洞察力,以增加用户黏性,实现事半功倍的效果。
第三,个性化需求崛起。花了钱的人“千人千面”的个性化内容需求日益增强,定制化营销成为提升转化率的重要手段。
伴随着营销趋势变化,希望做电商营销的企业也遇到了三个能力挑战:一是流量获取成本高,企业要探索如何通过多元渠道获得流量,并提高转化率;二是用户黏性不足,企业要探索如何通过丰富内容生态、个性化推荐、体验提升等方式,提高留存率和复购率;三是售后服务需求过载,企业要提高反馈流畅度,提升用户满意度。
做好营销,一个很重要的因素是创意,但大量的执行工作却牵扯了有关人员的精力,从而无法更好地发挥创造力。如今,依靠大模型极强的通用能力,以及基于大模型开发的各类应用,可以良好应对上述变化和痛点。
比如,大模型的多模态能力,可以对用户画像进行更为详细、精准的分析,实现个性化营销;实时行为理解以及对推荐系统的升级,能提高转化;多轮对话、对情感的精准分析能力及知识图谱的构建,能提高售后服务质量,并挖掘售后服务价值。
最终,可以让电商营销领域内流程化的事情更加智能化,让创意化的工作更加个性化,带来传统人工智能不具备的体验。
大模型在各行各业中的应用,不胜枚举。所有实践案例,都有几个显著特点。第一,实施方案“可大可小”,要结合用户所需。既可以从算力底层开始,重构以大模型为核心的数智化体系,也可以直接部署一些成熟的AI应用。第二,大模型可以和现存技术、应用相结合,也可以基于大模型重构,而重构往往会带来更高效率。第三,针对一些重复的、流程化的业务,应用大模型开发智能体的效果很好。
另外,大模型在各行各业的应用,不仅需要有领先的技术,更需要“挽起裤腿、踩到泥地”,真实了解行业需求。百度会持续深耕一线场景,提供端到端的大模型解决方案落地服务,包括咨询、方案设计、应用梳理定制、模型调优,以及以效果为导向的运营和能力培训等。
对于读者而言,无论处于什么行业,都可以用开放的心态来使用大模型。既可以在一些小场景里应用,建立对大模型的熟悉度和信任度;也可以从顶层设计开始,思考以大模型为中心的业务重构。无论何种方式,相信带来的都一定是新体验。
2022年末,ChatGPT在全球的风靡,让大模型随之出圈。大模型带来的机遇是人类突破能力边界最大的一次飞跃。未来基于AI或将实现“想象即现实,所想即所得”,这将是一次巨大的飞跃,远超于之前蒸汽机和电气两次工业革命带来的变化。 中国、美国以及欧洲各国纷纷出台有关政策,将推动人工智能发展、大模型迭代作为重要的创新引擎。 了解、应用大模型,既是时代的要求,也是产业高质量发展的必需。但是在实践中也发现,大家对大模型的了解并不深刻,甚至时常被技术名词“劝退”。因此,迫切地需要一本著作,能融合学术理论与产业实践,通俗且系统地阐述一系列话题,例如:AI是如何一步步发展到令人惊叹的阶段的?大模型的能力有哪些特点,可以产生怎样的商业经济价值?为什么应用大模型正当其时?企业与个人如何高效便捷地基于大模型做开发?哪些产业慢慢的开始应用大模型且有了显著效果?企业落地大模型还需要注意哪些要素?解答这样一些问题也正是撰写本书的初衷,相信本书能回答读者的关切,为大模型的落地提供新思路。 立足当下,如果用一句话来总结大模型的状态,那就是:大模型已经从最初尝鲜、体验的场景,进入了实际的生产环境里,成为生产力。智能体等产品形态的发展,则将人从重复、机械的工作中解放出来,最大限度地发挥创新的力量。
沈抖,现任百度集团执行副总裁,百度智能云事业群总裁,分别在香港科技大学、清华大学、华北电力大学获得博士、硕士和学士学位,先后在国际学术会议和期刊上发表约40篇论文,拥有多项人工智能相关领域的专利技术。
2012年加入百度,先后担任百度网盟、搜索策略、百度金融等业务研发负责人,2019年起负责百度移动生态事业群组、2022年起负责百度智能云事业群组。加入百度前,曾就职于微软(西雅图),后创办Buzzlabs公司,被CityGrid Media公司收购。
现担任KDDC(ACM数据挖掘中国分会)副主席,华北电力大学人工智能学院院长(兼)。曾担任第22届国际数据挖掘大会(SIGKDD 2016)的工业程序委员会主席、第18届国际数据挖掘大会(SIGKDD 2012)的大会副主席等学术职务。