每日热门：大模型落地，跑得快更要跑得稳

在WAIC 2024上，参观者在某大模型演示屏前体验交流。新华社记者方喆摄

比盛夏的上海更火热的是2024世界人工智能大会暨人工智能全球治理高级别会议（以下简称“WAIC 2024”）。大会线下参观人数突破30万人次，创历史新高。

值得注意的是，WAIC 2024的首发首秀不仅涉及模型更新换代，还涵盖应用、平台、系统等。行业和观众的目光更多投向与模型落地紧密相关的交互体验、商业模式等领域。

(相关资料图)

一个引发广泛关注的问题是，随着大模型能力不断增强，其安全性、可靠性、可控性也日益受到挑战。尤其是面对行业用户合法合规、精准可控等要求，大模型可能存在的数据安全、幻觉等成为绕不过的问题。

中国信息通信研究院华东分院人工智能事业部主任常永波说，应用价值与应用安全是大模型发展的两翼，当前大模型已进入快速迭代期，在积极探索落地应用的同时，大模型厂商也要高度重视应用场景需求下对安全的行业要求。

技术自身缺陷不容忽视

依托庞大参数规模、海量训练数据、强大算力资源，大模型作为人工智能领域最热门的技术分支，已在多个领域表现出超越人类的能力。

“金融、医疗、教育、政务、制造等众多领域都在积极探索大模型安全应用范式，以应对大模型安全风险。”常永波介绍，伴随大模型的深度应用，产学研用各方都在加强大模型安全威胁和防御技术体系研究。在原有可信人工智能治理体系框架基础上，提升大模型的鲁棒性、可解释性、公平性、真实性等能力成为行业研究热点。安全评测技术和安全防御技术的不断成熟，有效护航大模型发展。

WAIC 2024上，清华大学、中关村实验室、蚂蚁集团等机构联合撰写的《大模型安全实践（2024）》白皮书（以下简称“白皮书”）正式发布。白皮书显示，大模型技术存在自身缺陷，包括生成内容不可信、能力不可控以及外部安全隐患等问题。

“幻觉是大模型目前比较难解决的问题。”常永波说，模型在遵循语法规则的同时，可能产生虚假或无意义的信息。这一现象源于大模型基于概率推理的输出方式。它可能导致对模糊预测的过度自信，从而编造错误或不存在的事实，影响生成内容的可信度。“智能涌现”是大模型的另一种效应，它可以让模型展现出色性能，也具有突发性、不可预测性和不可控性等特征。

另外，大模型的脆弱性和易受攻击性使外部安全隐患难以消除。相关数据显示，随着大模型技术快速发展，相关网络攻击也在增多。

聚焦安全可靠可控性建设

大模型带来的种种风险，对监管方、学术界、产业界是全新且不可回避的问题。

近年来，《互联网信息服务算法推荐管理规定》《互联网信息服务深度合成管理规定》《生成式人工智能服务管理暂行办法》《科技伦理审查办法（试行）》等政策法规相继发布，搭建起我国人工智能治理的基本框架。一系列政策法规坚持发展与安全并重原则，强化科技伦理风险防控，从技术发展与治理、服务规范、监督检查与法律责任等层面对大模型安全发展提出要求。

白皮书提出，构建大模型安全政府监管、生态培育、企业自律、人才培养、测试验证“五维一体”的治理框架。

在监管方面，常永波介绍，敏捷治理正成为一种新型治理模式。该模式以柔韧、流动、灵活及自适应为特点，倡导多元利益相关者共同参与，能快速响应环境变化。在实施治理策略时，结合柔性伦理规范和硬性法律法规，构建完善的治理机制，在规制大模型风险的同时平衡创新与安全。

“为确保大模型在实际应用中发挥最大效能，防止潜在风险和滥用，大模型建设通常会聚焦三个重要维度：安全性、可靠性和可控性。”蚂蚁集团安全实验室首席科学家王维强解释，安全性意味着确保模型在所有阶段都受到保护，防止任何未经授权的访问、修改或感染，保障人工智能系统无漏洞、免诱导；可靠性要求大模型在各种情境下都能持续提供准确、一致、真实的结果，这对于决策支持系统尤为重要；可控性关乎模型在提供结果和决策时能否让人类了解和介入，以便人类根据需要进行调适和操作。

王维强特别提到时下备受关注的Agent（智能体）。他说，Agent是目前大模型落地的关键路径，但复杂的Agent体系进一步扩大了大模型风险敞口。目前RAG（检索增强生成）、指令遵循、知识图谱嵌入等方法可有针对性地提升模型输出的可控性和准确性。

合力推动人工智能健康发展

“目前来看，让大模型完全不犯错几乎不可能，但减小犯错几率，减弱错误危害性，是可以做到的。”常永波说，安全治理需产学研共同发力，中国信息通信研究院已开展一系列标准和测评研究，头部厂商也在加速构建自身的安全和治理体系。

蚂蚁集团安全内容智能负责人赵智源介绍了相关经验。一方面，在大模型产品投入应用前，企业需做好全面评测，对暴露出的安全问题展开针对性防御，把好入口关；相关产品进入市场后，也要时刻监控可能出现的风险隐患，进行技术补救和改进。另一方面，模型技术通常跑在安全技术前，行业研究要保持一定前瞻性。

“我们很早就开始探索基于安全知识构建视觉领域生成内容风险抑制的技术。在多模态大模型发布后，我们又将这一技术集成到多模态基座中，降低风险内容生成比例。”赵智源介绍，蚂蚁集团已构建起面向产业级应用的大模型安全一体化解决方案“蚁天鉴”2.0版本，形成包括大模型基础设施测评、大模型X光测评等在内的测评和防御技术链条，并已运用于金融、政务、医疗等专业场景下的AI应用全流程。

常永波说，大模型落地门槛正在大幅降低，大量中小企业在模型安全治理方面的能力较弱，有些甚至不符合基本的合规要求。解决这些问题，需要监管的进一步引导和头部厂商的能力释放。

“我们现在已把‘蚁天鉴’的测评能力框架开源，将来也会把检测能力以及对风险的认知更多分享到平台上，它可以适配较多模型。希望我们提供的开放能力能帮助大模型行业持续健康发展。”王维强说，模型厂商离用户最近，可第一时间发现安全隐患，并通过和监管保持良性沟通互动，助力大模型安全落地。

清华大学长聘副教授李琦认为，大模型安全应用是一个新兴领域，研究和应用尚处于起步阶段。随着新的实践不断深入发展，相关技术也会持续升级，为建构大模型安全实践范式打造高价值参考体系。

人工智能治理是全球性问题。WAIC 2024开幕式上发布的《人工智能全球治理上海宣言》提出，高度重视人工智能的安全问题。宣言强调，以发展的眼光看问题，在人类决策与监管下，以人工智能技术防范人工智能风险，提高人工智能治理的技术能力。宣言呼吁，推动制定和采纳具有广泛国际共识的人工智能的伦理指南与规范，引导人工智能技术的健康发展，防止其被误用、滥用或恶用。

推荐内容

Van Oord 完成英国索菲亚海上风电场电缆安装

郑州富士康iPhone 17港区产线已接近满产，近20万人两班倒赶工|即时

阿里本地生活战略升级提振港股SaaS概念股，微盟集团、汇量科技等表现强势 看热讯

8000万元！晶科能源拟出售新材料公司 视点

每日头条!服贸会机器人展区最热门 现存机器人相关企业超96.6万家

汉中市西乡农商银行召开银企座谈会

悦己新生·私密臻宠|予乐昕采私密抗衰中心启幕，致力领航女性私密健康行业发展

合租夫妻生娃后与室友发生租住矛盾被投诉 律师：如影响其他合租用户，可以依约劝退

最新：美国大幅下调年度就业增长数据

涨停雷达：储能+算力+通信运维 元道通信触及涨停_每日动态

人工智能下半场：普通人如何抓住“破局点”？——走进「AI出圈」

8月份中国电商物流指数公布 继续创年内新高|观察

今日聚焦!来凯医药(02105)折让约9.5%配股 净筹约5.78亿港元

国家统计局：8月份工业生产者出厂价格同比降幅收窄 环比由降转平 每日速读

投资房产时，如何控制持有成本？

氢动科技氢车纯氢运营总里程超过70000000公里|每日看点

国家统计局：8月份PPI同比降幅收窄 环比由降转平

挺进四强！帕帕尼古拉乌：我们还没取得任何成就 为梦想全力以赴_每日看点

伽澜健康3458全生命周期健管服务体系&六新一结果核心理念入驻百科官方词条

看我干什么？看黑板啊！ 资讯

今日热搜:9月10日生意社锡基准价为270170.00元/吨

低杠杆、强运营、正现金流 新城控股上半年实现净利润8.95亿|今日报

92.5MW氢能项目开标！本周13个氢能招中标信息！【氢能项目·周分析】

微速讯：事关你的“小电驴”！新国标，今起实施！

买满299元至高可返999元超市卡！京东秒杀×京东超市99周年庆大牌爆款真5折

LDH DESIGN刘道华｜武汉宴.禧樽：江风入宴，如繁花盛开

恒泰证券正式更名为金融街证券，开启战略转型崭新篇章

利德治疗仪入秋怎么“养”健康?

中国民生银行乌鲁木齐分行助力两笔区域首单创新类REITs成功发行

答卷酒业高速广告正式上刊！

快乐为民智能便利店加盟扶持多吗?前景如何?

为生命科学全球化赋能：法大大 Nota Sign 发布业内首个 GxP 合规电子签方案

保障消费者金融权益 助力美好生活 ——太平财险广东分公司建设“网点+上门”便民服务工程

科技点亮梦想！汇付天下第九届钛客科技节开幕

兴和集团开通中山南朗直达香港巴士，助力大湾区“一小时生活圈”加速形成

三维天地亮相全球工业互联网大会 分享AI赋能数据治理前沿实践

康旅易购：构筑中老年人的品质生活新家园！

CCRT深度解读：紧凑型新能源SUV销量分化加剧，用户分层趋势凸显

高浪控股探索东西部协作教育赋能新机制，打造“永不结营”的筑梦班

开学军训怕脱水？东鹏补水啦让你活力满格向前冲

撬动制造全场景增效，法大大多维助推开利空调数字化战略

李佳琦畅谈国货出海新路径：文化融合与硬实力赢得世界市场

聚焦眼科年会，国内首款无需冷藏盐酸奥布卡因滴眼液重磅上市

佳木斯万达9月开展沿途花开活动，打造6万方沉浸式向日葵主题广场

2025WAIC|中科视语入选《企业级 AI Agent 价值及应用报告》，彰显工业 AI Agent 技术落地硬实力

德阳中康医院：不止是男科诊疗中心，更是男性健康的 “定心丸”

军地应急救援总队管理条例

水井坊获权威年份酒认证，高端白酒赛道迎品质高标准

亚果微生物菌剂：小微生物大能量，推动农业可持续发展

传递生育健康理念！郑州长江中医院助力 “生育友好公益讲堂走进焦作”

融合装饰：在《融合装饰》中，图案如何成为共处的政治学

人文为核，科技为用：雅兰深度解码“体验价值”，构建可复用的增长方法论

家里第一台浴缸，就选 T&W特拉维尔

第十五届智博会在宁波开幕 AI赋能引领数智新未来

从母婴到银发：一位创业者的十年积淀与时代选择

国字号双誉加冕！鹏鸿以生态板为基，多元产品矩阵领跑全国市场

谷医堂科技中医“新阅兵”：传统智慧与现代科技的融合创新

从粮油到网红零食,从进口精品到非遗手作:深圳礼品展打造2025年食品福利一站式采购平台

2025年工商数据公司推荐完整名单及综合评估报告

肌肤的"心声"：与善年轻氨基酸饮的温暖对话

专为中老年定制的“营养金盾”——明一健盾奶粉受青睐

男子深夜关灯玩电脑，眼压飙升风险超手机3倍！威立亮成护眼关键

科大国盾上市前后QKD市场预期与现实对比

破局周期浪潮 蓄力价值新机：世荣兆业 “多元产投 + 科技筑房”打开增长新空间

艾拓南方科技公司专注品质服务，守护成人情趣行业生态

强强联手，宫品海参应邀参加老百姓大药房订货会

2025年NMN产品推荐：五大高口碑抗衰产品盘点，助力消费者科学选择

NVC雷士电工DP12超薄感应灯轨道插座，打造插座界的六边形战士

成都经方堂医院：中西医理念交融，探索中医男科诊疗的现代传承路径​

圣天行智慧生鲜驿站打造“健康厨神培育+无人零售”模式

三班倒作息乱怕伤心脏？威立芯 0.3mg 硝酸甘油备好，预防心绞痛超实用！

登场即焦点：海景房桌搭音箱，你的桌面艺术品

沃壹健康负离子不释放危害健康的臭氧、正离子，不形成静电场

近视防控新品优悦控近视管理镜片

利德治疗仪 夏季康复关节疾病

穿越四百年的味觉重逢：葡小玥，酿一杯中葡文化交融的微醺

用勤哲Excel服务器做广告企业管理系统

绵阳高水医院：打破传统就医体验！诊疗、设备、服务升级，守护男性健康

抢滩东盟・商通蓝海！2025东南亚专场活动圆满落幕！

阿里本地生活战略升级提振港股SaaS概念股，微盟集团、汇量科技等表现强势看热讯

8000万元！晶科能源拟出售新材料公司视点

每日头条!服贸会机器人展区最热门现存机器人相关企业超96.6万家

合租夫妻生娃后与室友发生租住矛盾被投诉律师：如影响其他合租用户，可以依约劝退

涨停雷达：储能+算力+通信运维元道通信触及涨停_每日动态

8月份中国电商物流指数公布继续创年内新高|观察

今日聚焦!来凯医药(02105)折让约9.5%配股净筹约5.78亿港元

国家统计局：8月份工业生产者出厂价格同比降幅收窄环比由降转平每日速读

国家统计局：8月份PPI同比降幅收窄环比由降转平

挺进四强！帕帕尼古拉乌：我们还没取得任何成就为梦想全力以赴_每日看点

看我干什么？看黑板啊！资讯

低杠杆、强运营、正现金流新城控股上半年实现净利润8.95亿|今日报

保障消费者金融权益助力美好生活 ——太平财险广东分公司建设“网点+上门”便民服务工程

三维天地亮相全球工业互联网大会分享AI赋能数据治理前沿实践

破局周期浪潮蓄力价值新机：世荣兆业 “多元产投 + 科技筑房”打开增长新空间

成都经方堂医院：中西医理念交融，探索中医男科诊疗的现代传承路径

利德治疗仪夏季康复关节疾病

固德热光伏直驱空气能全面领先的五大优势

长城皮卡1-8月全球累计销售12.3万辆同比增长4.8%

整合军地资源筑牢安全防线多家权威机构联合倡议发起“国家军地应急救援总队”