[00280750]基于改进的Nivre算法构建越南语依存树库的方法
交易价格:
面议
所属行业:
其他电子信息
类型:
发明专利
技术成熟度:
正在研发
专利所属地:中国
专利号:CN201610599528.4
交易方式:
技术转让
技术转让
技术入股
联系人:
昆明理工大学
进入空间
所在地:云南昆明市
- 服务承诺
- 产权明晰
-
资料保密
对所交付的所有资料进行保密
- 如实描述
技术详细介绍
本发明涉及基于改进的Nivre算法构建越南语依存树库的方法,属自然语言处理技术领域。本发明首先构建初始训练语料、扩展语料和测试语料;然后利用构建的初始训练语料基于改进的Nivre算法训练出两个依存分析弱学习器S1和S2作为两个充分冗余的视图;再利用训练出的两个弱学习器S1和S2对扩展语料进行依存分析并构建越南语依存树库模型;最后对测试语料进行依存分析测试并最终构建出越南语依存树库。本发明能够对越南语的句法分析、机器翻译和信息获取等上层应用提供有力支撑;能有效避免了人工标记越南语句子依存关系的过程,节省了人力物力的时间;能够有效利用大量无标记的越南语句子级语料提升依存分析的准确率。
本发明涉及基于改进的Nivre算法构建越南语依存树库的方法,属自然语言处理技术领域。本发明首先构建初始训练语料、扩展语料和测试语料;然后利用构建的初始训练语料基于改进的Nivre算法训练出两个依存分析弱学习器S1和S2作为两个充分冗余的视图;再利用训练出的两个弱学习器S1和S2对扩展语料进行依存分析并构建越南语依存树库模型;最后对测试语料进行依存分析测试并最终构建出越南语依存树库。本发明能够对越南语的句法分析、机器翻译和信息获取等上层应用提供有力支撑;能有效避免了人工标记越南语句子依存关系的过程,节省了人力物力的时间;能够有效利用大量无标记的越南语句子级语料提升依存分析的准确率。