[00281126]一种融合越南语语法特征的短语树到依存树的转换方法
交易价格:
面议
所属行业:
其他教育休闲
类型:
发明专利
技术成熟度:
正在研发
专利所属地:中国
专利号:CN201610064305.8
交易方式:
技术转让
技术转让
技术入股
联系人:
昆明理工大学
进入空间
所在地:云南昆明市
- 服务承诺
- 产权明晰
-
资料保密
对所交付的所有资料进行保密
- 如实描述
技术详细介绍
本发明涉及一种融合越南语语法特征的短语树到依存树的转换方法,属于自然语言处理技术领域。本发明包括步骤:首先构建越南语短语树库;利用融合了越南语语法特征的中心子节点过滤表以及依存关系标注器完成越南语短语树库中的短语树到依存树的转换,得到一级越南语依存树库;根据人工标注后的一级越南语依存树库的语料训练得到MSTParser模型,利用MSTParser模型进行一级越南语依存树库的扩展,得到扩展后的二级越南语依存树库;利用依存关系校正器对扩展后的二级越南语依存树库的语料进行校正,得到最终的三级越南语依存树库。本发明避免了人工收集和标注越南语依存树库的过程,节省了人力和构建树库的时间,准确率明显提高。
本发明涉及一种融合越南语语法特征的短语树到依存树的转换方法,属于自然语言处理技术领域。本发明包括步骤:首先构建越南语短语树库;利用融合了越南语语法特征的中心子节点过滤表以及依存关系标注器完成越南语短语树库中的短语树到依存树的转换,得到一级越南语依存树库;根据人工标注后的一级越南语依存树库的语料训练得到MSTParser模型,利用MSTParser模型进行一级越南语依存树库的扩展,得到扩展后的二级越南语依存树库;利用依存关系校正器对扩展后的二级越南语依存树库的语料进行校正,得到最终的三级越南语依存树库。本发明避免了人工收集和标注越南语依存树库的过程,节省了人力和构建树库的时间,准确率明显提高。