品牌 资讯 搭配 材料 时尚 热点 行业 首饰 玉石 行情

蚂蚁集团发布AI安全检测平台“蚁鉴2.0” 可实现用生成式能力检测生成式模型

2023-07-08 15:54:50 来源:环球网

7月7日,2023世界人工智能大会(WAIC)“聚焦·大模型时代AIGC新浪潮—可信AI”论坛举行,蚂蚁集团联合清华大学发布AI安全检测平台“蚁鉴2.0”。蚁鉴2.0可实现用生成式AI能力检测生成式AI模型,可识别数据安全、内容安全、科技伦理三大类的数百种风险,覆盖表格、文本、图像等多种数据和任务类型,是业内首个实现产业级应用的全数据类型AI安全检测平台。据了解,该产品还入选了本届大会的“镇馆之宝”。

AIGC安全成为当前人工智能研究发展的重要议题。中国科学院院士何积丰发表《可信人工智能展望》主题演讲。他认为,“不能再将人工智能视为简单的技术工作,而是成为整个组织的变革引擎。可信人工智能要致力于保障数据安全可信、系统行为可追责、算法模型可解释、网络环境可信、法律伦理可信等问题。”


(资料图)

在该论坛上,蚂蚁集团同时宣布,“蚁鉴2.0”全面开放,面向全球开发者免费提供AIGC安全性、AI可解释性、AI鲁棒性三项检测工具,可服务于数字金融、教育、文化、医疗、电商等领域的大规模复杂业务场景。

据了解,“蚁鉴2.0”的两项硬核能力,一是实现了用生成式能力检测生成式模型。检测标准覆盖内容安全、数据安全、伦理安全三大类,可对大模型生成式内容完成包含个人隐私、意识形态、违法犯罪、偏见与歧视等数百个维度的风险对抗检测,并会生成检测报告,帮助大模型更加有针对性地持续优化。

蚂蚁集团大安全事业群技术部总裁李俊奎表示,“生成式大模型是一种‘深黑盒’技术,‘蚁鉴2.0’通过智能博弈对抗技术,模拟黑产以及自动化生成海量测试集,可实现‘生成式机器人’对‘AIGC生成式模型’的诱导式检测计算,很像一个24小时不眠不休的‘安全黑客’在找茬大模型,从而找到大模型存在的弱点和安全问题所在。这种AI对AI的评测,也是教学相长。好比生成式考官考核生成式运动员,在对抗中双方能力互相提升,进一步提高整个行业的AI安全水位。”

另一项硬核能力是,“蚁鉴2.0”融入了可解释性检测工具。综合AI技术和专家先验知识,通过可视化、逻辑推理、因果推断等技术,从完整性、准确性、稳定性等7个维度及20余项评估指标,对AI系统的解释质量量化分析,帮助用户更清晰验证与优化可解释方案。

据了解,“蚁鉴2.0”集成了蚂蚁近10年可信AI实践、1000余项可信AI专利,支持零编码测评。开发者通过API接口,将AI模型接入蚁鉴,就可以一键识别和挖掘模型漏洞。

蚂蚁集团认为,人工智能的深度应用,不仅对数据、算法、算力提出了更高要求,也对安全、隐私、伦理提出更多挑战。在确保数据安全和隐私保护、健全人工智能伦理与安全的前提下,才能让AI技术真正地释放应用价值。

此次论坛上,中国信通院、上海人工智能实验室、武汉大学、蚂蚁集团等多家单位共同发起的《AIGC可信倡议》。该倡议得到数十家单位参与,围绕人工智能可能引发的经济、安全、隐私和数据治理等问题,提出构建AIGC可信发展的全球治理合作框架,采用安全可信的数据资源、技术框架、计算方法和软件平台等全面提升AIGC可信工程化能力,最大限度确保生成式AI安全、透明、可释。

论坛现场还发布了由中国信通院、清华大学、蚂蚁集团联合编纂的《可信AI技术和应用进展白皮书(2023)》。该报告基于统一的可信AI认知维度,梳理总结可信AI发展现状,提练了面向新阶段大模型和AIGC引发的新需求,形成以技术为保障的可信AI评估体系和工具,探索新一代可信人工智能发展。

标签:

(责任编辑:)

相关文章

蚂蚁集团发布AI安全检测平台“蚁鉴2.0” 可实现用生成式能力检测生成式模型

​蚂蚁集团联合清华大学发布AI安全检测平台“蚁鉴2 0”,可识别数百种风

2023-07-08 15:54:50

显卡电源线怎么接(8pin显卡电源线怎么接)

​显卡电源线怎么接,以精影GTX660TI为例,显卡电源线的接法如下:1、首

2023-07-08 14:27:43

机械女皇怎么打_女机械怎么玩2021

​今天,我们来简单介绍下机械女皇怎么打这个问题。机械女皇怎么打?《英

2023-07-08 13:04:35

小巧实用派!EDC工具——傲雷Seeker4 mini双光源手电实测

​前言:记得前几年,很多手电爱好者都是追求高亮度、长续航等特性,这也

2023-07-08 12:18:57

稳步降低行业综合费率水平 多家头部公募宣布降费

​7月8日,多家头部公募基金公司齐发公告,宣布降低旗下部分产品管理费率

2023-07-08 11:47:47

兰州大学举行校友“双招双引”系列活动协调会

​6月27日,兰州大学校友“双招双引”系列活动协调会在城关校区西区大学

2023-07-08 09:11:08

5500万欧!曝曼联敲定新门神 德赫亚+马奎尔将离队

​5500万欧!曝曼联敲定新门神德赫亚+马奎尔将离队,大卫·德赫亚,马奎尔,

2023-07-08 07:55:38

酷睿i5好吗?(酷睿i5怎么样值得购买吗)

​答案是酷睿i5性能很好值得购买。从酷睿3代i5起来,几乎每代i5都是主流

2023-07-08 06:58:17

格灵深瞳(688207):7月7日北向资金增持21.7万股

​7月7日北向资金增持21 7万股格灵深瞳。近5个交易日中,获北向资金减持

2023-07-08 05:11:27

A与B

​夜行动物NocturnalAnimals我理解为这是一个双重复仇的故事,两个世界,

2023-07-07 23:29:38

库尔勒梨城机场单日旅客吞吐量突破1万人次大关 创历史新高

​7月7日,新疆库尔勒梨城机场单日旅客吞吐量突破1万人次大关,创机场通

2023-07-07 22:05:55

remark是什么意思中文(remarks)

​remark是什么意思中文,remarks这个很多人还不知道,现在让我们一起来看

2023-07-07 21:13:57

亮相巴西市场,比亚迪海豚出海进程再加速

​近日,比亚迪官方宣布,比亚迪海豚正式在巴西市场上市,这也是比亚迪在

2023-07-07 20:55:36

盘古大模型3.0发布 华为云CEO张平安:盘古大模型不会写诗,只会做事

​L1层是指N个行业大模型,华为云既可以提供使用行业公开数据训练的行业

2023-07-07 19:44:07

保险业数字基建新进阶 众安保险展示AIGC数智融合新实践

​7月7日,在2023世界人工智能大会(WAIC)“数字基建新进阶,保险生态新价

2023-07-07 18:56:38

外交部驻港公署:国安执法符合国际通例,外部干预凸显伪善双标

​据“外交部驻香港特派员公署”微信公众号7月7日消息,针对英国议会一些

2023-07-07 18:24:46

退票难、售后差,演出市场大爆发,为何大麦被骂惨?

​在黑猫投诉平台上,不止一位用户表示主办方和票务平台应该主动告知演唱

2023-07-07 17:42:27

银发红衣真就鬼泣但丁?《FF16》曾有银发克莱夫方案

​《最终幻想16》设计师高桥和哉接受采访,讲述角色秘闻,表示初期也有“

2023-07-07 17:24:59

架管吹填 高效疏浚

​“工匠绝活”架管吹填高效疏浚(主题)人民日报记者李家鼎【绝活看点】

2023-07-07 17:04:04

公司是否有人形机器人技术或产品?佳禾智能回应

​每经AI快讯,有投资者在投资者互动平台提问:公司是否有人形机器人技术

2023-07-07 16:31:28

Win11系统打开显卡设置的方法

​很多喜欢在电脑上玩游戏的人希望通过设置显卡来提高游戏性能,获得更好

2023-07-07 15:57:42

浦银国际:维持李宁(02331)“买入”评级 目标价51.9港元

​智通财经获悉,浦银国际发布研究报告称,维持李宁(02331)“买入”评级

2023-07-07 15:14:42

Model Y的对手来啦 中型纯电轿跑SUV小鹏G6今日上市

​小鹏全新G6将正式上市发售。该车是SEPA2 01扶摇技术架构的首款战略车型

2023-07-07 14:18:26

山东人长啥样(为什么山东人长相特殊简介介绍)

​对于为什么山东人长相特殊这个问题感兴趣的朋友应该很多,这个也是目前

2023-07-07 13:53:45

周思权:黄金若再度探底刷新,1850将是最佳的抄底机会

​周五黄金探底依旧按照推演的第二阶段在运行第一阶段反弹1930后走跌已经

2023-07-07 12:33:55

中国女足出征!水庆霞率队着正装出发 开启世界杯之旅(图)

​北京时间7月7日消息,中国女足今天正式从广州启程,飞赴澳大利亚阿德莱

2023-07-07 11:59:58

俄乌战争还没有结束,美国就企图吞并乌克兰财产?

​最近的一则消息引发了全球的关注和忧虑,报道称美国投资巨头贝莱德与乌

2023-07-07 11:17:03

高通钱堃:以5G+AI技术赋能移动生态创新

​7月6日,2023全球数字经济大会“知识产权与数字经济发展”专题论坛在北

2023-07-07 10:46:22

文班亚马回应保镖掌掴小甜甜布兰妮 基本情况讲解

​大家好,今日关于【文班亚马回应保镖掌掴小甜甜布兰妮】迅速上了的热搜

2023-07-07 10:28:36

夏日健康帖丨高温卷土重来,实用指南帮你应对酷热晴晒

​夏日健康帖丨高温卷土重来,实用指南帮你应对酷热晴晒---你可能已经中

2023-07-07 10:13:01