华为与清华大学联合申请的语言模型推理专利公布

🤖 由 文心大模型 生成的文章摘要

近日,一项由华为与清华大学携手申请的专利引发了广泛关注。天眼查财产线索信息显示,3月25日,双方联合申请的“一种语言模型推理方法以及推理装置”专利正式公布。​

该专利聚焦于提升语言模型在处理特定任务时的表现,尤其是在理解和规避预设内容方面。随着人工智能技术的快速发展,语言模型在诸多领域得到了广泛应用,从智能客服到内容创作,从信息检索到自动翻译,语言模型的身影无处不在。然而,在实际应用中,如何确保语言模型的输出符合特定的要求,避免出现不必要或敏感的预设内容,成为了亟待解决的问题。​

此项专利提出的创新方法,为解决这一难题提供了新的思路。其具体操作流程如下:首先,系统会依据第四问题生成第五问题,这个第五问题有着特殊的设计,它不仅涵盖了第四问题的核心内容,更重要的是,它向语言模型明确提示,在回答第四问题时,回复中不应包含预设内容。随后,语言模型基于这个精心构造的第五问题进行运算和思考,最终输出第三回复,且该回复严格遵循要求,不包含任何预设内容。​

更为关键的是,该专利还涉及到语言模型参数的动态更新机制。语言模型会根据第一问题输出第一回复,而后相关系统会对这些回复进行评估,生成评价数据,这些评价数据主要用于指示第一回复是否包含预设内容。语言模型会依据这些评价数据对自身参数进行更新,通过不断地学习和优化,持续提高对预设内容的理解能力,进而更加精准地抑制模型输出预设内容。​

举例来说,在一些内容审核场景中,如果预设内容是某些敏感词汇或不适当的话题,通过该专利技术,语言模型能够在理解用户问题的同时,准确判断并避免在回复中涉及这些敏感内容,大大提升了内容输出的安全性和合规性。在智能客服领域,当用户咨询某些产品信息时,语言模型可以避免输出可能存在误导或不符合公司规定的预设内容,为用户提供更加准确和合适的解答。

「93913原创内容,转载请注明出处」