导读:面向生产服务场景,建立语言大模型、行业大模型、多模态大模型、智能体应用、安全评测等五大评测基准,围绕 评测数据、指标、方法与分析三大建设方向,高效开展综合全面的大模型评估评测。
模型接入生产系统时,需要经过一系列“全面考验”,接入生产开始服务后,要开展“持续考验”,根据用户市场真实反馈,形成动态反馈机制持续优化提升大模型的落地成效。
免责声明:
来源: 中国移动,数智观察推荐阅读,版权归作者所有。文章内容仅代表作者独立观点,不代表数知观察立场,转载目的在于传递更多信息。如涉及作品版权问题,请联系我们删除或做相关处理!