[01090491]多体蒙古文(混排汉英)印刷文档识别暨统一平台少数民族文字识别系统
交易价格:
面议
所属行业:
印刷
类型:
非专利
交易方式:
资料待完善
联系人:
所在地:
- 服务承诺
- 产权明晰
-
资料保密
对所交付的所有资料进行保密
- 如实描述
技术详细介绍
该项目提出了一种基于统计鉴别分析的多字体多字号蒙古文字符识别的方法,对蒙古文的常见多种字体(白体、黑体、报体、哈旺体、楷体等二十余种字体)具有良好适应性,单字测试平均识别率达99%以上;项目提出并实现了多字体蒙古文文本切分方法,在提取单词基线位置后,通过定义代价函数,综合分析字符几何位置、形状等多种信息,取代价函数极小值处作为切分点;提出了蒙汉英语种判别方法,结合汉、英文识别技术,实现蒙汉英混排文本识别。文本识别率可达96.8%以上。该系统具有蒙古文印刷文档版面分析方法,可分析处理文本、图片、表格区域。项目还研制了字符形码到Unicode标准蒙古文编码转换方法。
该项目提出了一种基于统计鉴别分析的多字体多字号蒙古文字符识别的方法,对蒙古文的常见多种字体(白体、黑体、报体、哈旺体、楷体等二十余种字体)具有良好适应性,单字测试平均识别率达99%以上;项目提出并实现了多字体蒙古文文本切分方法,在提取单词基线位置后,通过定义代价函数,综合分析字符几何位置、形状等多种信息,取代价函数极小值处作为切分点;提出了蒙汉英语种判别方法,结合汉、英文识别技术,实现蒙汉英混排文本识别。文本识别率可达96.8%以上。该系统具有蒙古文印刷文档版面分析方法,可分析处理文本、图片、表格区域。项目还研制了字符形码到Unicode标准蒙古文编码转换方法。