导读:本报告基于统一的可信 AI 认知维度,梳理总结可信 AI 技术和应用发展现状,提炼面向新阶段大模型和 AIGC 引发的新需求,形成以技术为保障的可信 AI 评估体系和工具。全文主要观点如下:
一是归纳了可信 AI 发展变迁的产业技术背景,即近期算法、算力、数据基础不断夯实,人工智能固有技术风险持续放大,可信 AI技术成为 AI 领域关键底层能力,各国也正在围绕生成式人工智能监管、人工智能伦理等推动治理。
二是梳理了现阶段可信 AI 四大技术方向发展情况。可信 AI 已在行业领域落实成具体产品和实践案例,总体上正从创新整合解决方案阶段迈向形成可信系统机制的阶段,完整的实践链路、健全的标准和系统机制将逐步落地。
三是概括了面向大模型和 AIGC 的可信 AI 探索,即大模型时代下可能面临的安全可信挑战,主要包括大模型的生成式攻击和防御大模型自身的安全风险和隐患、大模型的可解释性和公平性问题等三大类。
四是构建了以技术为保障的可信 AI 评估体系,面向产业发展需求,构建了包括隐私保护检测、可解释性检测、公平性检测和鲁棒性检测的可信 AI 检测指标体系,并提出了具体的评估内容、指标和方式,并可进一步赋能大模型与 AIGC 发展。最后,本白皮书从技术、产业、生态和监管维度对可信人工智能发展提出了建议,对趋势进行了展望,将迎来研究应用更加均衡、内在动力更加多维、外在监管更加全面的发展局面。
免责声明:
来源: 清华大学&中国信通院&蚂蚁集团,数智观察推荐阅读,版权归作者所有。文章内容仅代表作者独立观点,不代表数知观察立场,转载目的在于传递更多信息。如涉及作品版权问题,请联系我们删除或做相关处理!