阿里巴巴申请模型训练相关专利,解决信息抽取效率低准确性差问题
金融界2025年5月1日消息,国家知识产权局信息显示,阿里巴巴(中国)有限公司申请一项名为“模型训练方法、数据处理方法、系统及存储介质”的专利,公开号CN119886362A,申请日期为2025年3月。
专利摘要显示,本申请公开了一种模型训练方法、数据处理方法、系统及存储介质,涉及大模型技术、数据处理领域。其中,该方法包括:采用上游任务数据对初始语言模型进行预训练,得到预训练模型;基于目标提示与目标训练文本对预训练模型进行模型微调,得到目标语言模型;其中,目标提示用于按照预定义模型输出的结构化格式引导预训练模型执行信息抽取任务,目标训练文本由多模态训练数据转换得到,目标语言模型用于对多模态应用数据进行信息抽取以得到目标抽取结果。本申请解决了相关技术在处理文档抽取任务时存在的信息抽取效率低、准确性差的技术问题。
天眼查资料显示,阿里巴巴(中国)有限公司,成立于2007年,位于杭州市,是一家以从事软件和信息技术服务业为主的企业。企业注册资本15459.89659万美元。通过天眼查大数据分析,阿里巴巴(中国)有限公司共对外投资了60家企业,参与招投标项目85次,财产线索方面有商标信息5000条,专利信息5000条,此外企业还拥有行政许可18个。
本文源自:金融界
作者:情报员