摘要 工程图纸扫描图象的图文分割是一个重要问题。本文在构建单义域邻接图基础上来提取字符及其特征。图文分离先从单义域中筛选字符笔划域,进行初步分离。然后,以字符笔划域为起点,遍历邻接图来搜索邻接字符笔划域,提取字符域,分析特性作进一步筛选。以字符域邻近与共线为判据来组合字符串域,字符域邻近是用其外接膨胀矩形相交来判定。利用共串字符域外接矩形中心及所附图形对字符域进行定向。对非水平字符域旋转至水平,并构建其单义域邻接图,以表达几何与拓扑特征,为后续识别作准备。实例表明,本算法可以较好地处理字符与图形的粘连问题,提取效果很好,且能够描述字符整体特征。 单义域邻接图,图文分离,字符笔划域,字符提取,特征提取。 1 引言 工程图纸扫描图象的识别与理解是目前学术界和工程界研究的热点,在机械、电子、建筑及地理信息系统等应用领域中具有重要的实际意义。图样中有两部分信息,一是图形,由几何图素组成,用来表达产品形体;二是文字,用来定义产品尺寸及描述其它信息,有的附于图形,如尺寸数字等,也有独立存在的,如技术要求等。文字是图样中非常重要的信息。因此,工程图纸扫描图象的字符提取与识别是一个重要问题,对进一步的尺寸理解、图像理解等高层次理解都有较大作用。工程图样中的文字包括多种字符,如汉字、数字、字母及符号等。字符情况较为复杂,有自己的一些特点:字符多为手写,具有一定的随意性,不同于印刷体;具有多种方向,不仅有水平书写,而且有的垂直放置,还有其它各种角度的斜向;有直体与斜体;有时字符与字符及图形粘连,增加了图文分割及字符提取的难度;位置分散,大小不一。上述情况在字符的分割及识别时都必须考虑。所以,工程图样字符提取及识别是一个十分困难的问题。 |
- 上一篇:论我国电子商务发展趋势
- 下一篇:基于单义域邻接图的圆弧与圆识别
查看评论
已有0位网友发表了看法