新闻动态
您当前的位置:云南网 >> 教育频道 >> 新闻动态 >> 正文
重庆首个自主研发大语言模型发布
发布时间:2023年07月17日 02:30:11  来源: 科技日报

原标题:重庆首个自主研发大语言模型发布

记者7月15日获悉,上海交通大学重庆人工智能研究院“兆言”大模型发布会日前在西部(重庆)科学城召开,会上发布了该研究院最新成果——“兆言”大模型产品(以下简称“兆言”大模型),这是重庆首个自主研发的大语言模型。

据了解,“兆言”大模型是上海交通大学重庆人工智能研究院基于其AI大模型技术研发出的最新成果。它通过积累海量数据,运用独特的数据处理和AI训练技术,达到了精准、专业的文本输出,实现了以自然语言选择、调用应用程序。

“和通用大模型相比,‘兆言’大模型拥有领域精调效率高、训练推理成本低、人机交互能力强的特点。”上海交通大学重庆人工智能研究院院长、首席科学家金石介绍,通用大模型在行业落地方面面临许多困难。比如,未经行业精调的通用大模型在行业应用中表现不佳、通用大模型需要的算力资源不易进行私有化部署、自然语言转应用程序接口(API)调用不稳定等。

“兆言”大模型较好地解决了这些问题。该模型采用启发式数据过滤及增强、模型预训练和精调自适应比例混合、人工和自动评测相结合等方法对模型进行垂直领域精调,解决了精调中的数据质量差、模型训练效率低等行业难题,使模型答案质量有了较好保障。

在研发过程中,研究团队把该模型的小型化部署作为研发重点,大幅降低了模型训练和推理成本。在商业化所需特定任务上,该模型在不降低回答质量的前提下,调用成本仅为小型化前的四百分之一,从而保障了以该模型为基础的产品在市场上的竞争力。

为解决在自然语言转API调用任务上模型发挥不稳定的问题,研发团队还建立了专有的自然语言调用语料和指令数据集,从而实现了大语言模型对其他系统的精准调用。(雍黎)

责任编辑:小云
关注云南发布
关注云南网微信
关注云南日报微信
新闻爆料热线:0871-64160447 64156165 投稿邮箱:ynwbjzx@163.com
云南网简介 |  服务合作 |  广告报价 |  联系方式 |  中央厨房 |  网站声明
滇ICP备08000875号 互联网新闻信息服务许可证编号:53120170002 信息网络传播视听节目许可证号:2511600
互联网出版许可证:新出网证(滇)字 04号
广播电视节目制作经营许可证号:(云)字第00093号
增值电信业务经营许可证编号:滇B2-20090008 ® yunnan.cn All Rights Reserved since 2003.08
未经云南网书面特别授权,请勿转载或建立镜像,违者依法必究
24小时网站违法和不良信息举报电话:0871-64166935;举报邮箱: jubao@yunnan.cn