问答文章1 问答文章501 问答文章1001 问答文章1501 问答文章2001 问答文章2501 问答文章3001 问答文章3501 问答文章4001 问答文章4501 问答文章5001 问答文章5501 问答文章6001 问答文章6501 问答文章7001 问答文章7501 问答文章8001 问答文章8501 问答文章9001 问答文章9501

凌谊视觉网上有,OCR/CCD识别系统,是什么意思呢?

发布网友 发布时间:2022-04-30 19:41

我来回答

1个回答

热心网友 时间:2022-06-30 05:58

cognition,(光学字符识别),是属于图型识别(Pattern Recognition,PR)的一门学问。其目的就是要让计算机知道它到底看到了什么,尤其是文字资料。

由于OCR是一门与识别率拔河的技术,因此如何除错或利用辅助信息提高识别正确率,是OCR最重要的课题,ICR(Intelligent Character Recognition)的名词也因此而产生。而根据文字资料存在的媒体介质不同,及取得这些资料的方式不同,就衍生出各式各样、各种不同的应用。
在此对OCR作一基本介绍,包括其技术简介以及其应用介绍。

一、OCR的发展
要谈OCR的发展,早在60、70年代,世界各国就开始有OCR的研究,而研究的初期,多以文字的识别方法研究为主,且识别的文字仅为0至9的数字。以同样拥有方块文字的日本为例,1960年左右开始研究OCR的基本识别理论,初期以数字为对象,直至1965至1970年之间开始有一些简单的产品,如印刷文字的邮政编码识别系统,识别邮件上的邮政编码,帮助邮局作区域分信的作业;也因此至今邮政编码一直是各国所倡导的地址书写方式。
OCR可以说是一种不确定的技术研究,正确率就像是一个无穷趋近函数,知道其趋近值,却只能靠近而无法达到,永远在与100%作拉锯战。因为其牵扯的因素太多了,书写者的习惯或文件印刷品质、扫描仪的扫瞄品质、识别的方法、学习及测试的样本……等等,多少都会影响其正确率,也因此,OCR的产品除了需有一个强有力的识别核心外,产品的操作使用方便性、所提供的除错功能及方法,亦是决定产品好坏的重要因素。
一个OCR识别系统,其目的很简单,只是要把影像作一个转换,使影像内的图形继续保存、有表格则表格内资料及影像内的文字,一律变成计算机文字,使能达到影像资料的储存量减少、识别出的文字可再使用及分析,当然也可节省因键盘输入的人力与时间。其处理流程如下图:
(在下面的站点上)

从影像到结果输出,须经过影像输入、影像前处理、文字特征抽取、比对识别、最后经人工校正将认错的文字更正,将结果输出。
在此逐一介绍:
影象输入:欲经过OCR处理的标的物须透过光学仪器,如影像扫描仪、传真机或任何摄影器材,将影像转入计算机。科技的进步,扫描仪等的输入装置已制作的愈来愈精致,轻薄短小、品质也高,对OCR有相当大的帮助,扫描仪的分辨率使影像更清晰、扫除速度更增进OCR处理的效率。
影象前处理:影像前处理是OCR系统中,须解决问题最多的一个模块,从得到一个不是黑就是白的二值化影像,或灰阶、彩色的影像,到独立出一个个的文字影像的过程,都属于影像前处理。包含了影像正规化、去除噪声、影像矫正等的影像处理,及图文分析、文字行与字分离的文件前处理。在影像处理方面,在学理及技术方面都已达成熟阶段,因此在市面上或网站上有不少可用的链接库;在文件前处理方面,则凭各家本领了;影像须先将图片、表格及文字区域分离出来,甚至可将文章的编排方向、文章的题纲及内容主体区分开,而文字的大小及文字的字体亦可如原始文件一样的判断出来。
文字特征抽取:单以识别率而言,特征抽取可说是OCR的核心,用什么特征、怎么抽取,直接影响识别的好坏,也所以在OCR研究初期,特征抽取的研究报告特别的多。而特征可说是识别的筹码,简易的区分可分为两类:一为统计的特征,如文字区域内的黑/白点数比,当文字区分成好几个区域时,这一个个区域黑/白点数比之联合,就成了空间的一个数值向量,在比对时,基本的数学理论就足以应付了。而另一类特征为结构的特征,如文字影像细线化后,取得字的笔划端点、交叉点之数量及位置,或以笔划段为特征,配合特殊的比对方法,进行比对,市面上的线上手写输入软件的识别方法多以此种结构的方法为主。
对比数据库:当输入文字算完特征后,不管是用统计或结构的特征,都须有一比对数据库或特征数据库来进行比对,数据库的内容应包含所有欲识别的字集文字,根据与输入文字一样的特征抽取方法所得的特征群组。
对比识别:这是可充分发挥数*算理论的一个模块,根据不同的特征特性,选用不同的数学距离函数,较有名的比对方法有,欧式空间的比对方法、松弛比对法(Relaxation)、动态程序比对法(Dynamic Programming,DP),以及类神经网络的数据库建立及比对、HMM(Hidden Markov Model)…等著名的方法,为了使识别的结果更稳定,也有所谓的专家系统(Experts System)被提出,利用各种特征比对方法的相异互补性,使识别出的结果,其信心度特别的高。
字词后处理:由于OCR的识别率并无法达到百分之百,或想加强比对的正确性及信心值,一些除错或甚至帮忙更正的功能,也成为OCR系统中必要的一个模块。字词后处理就是一例,利用比对后的识别文字与其可能的相似候选字群中,根据前后的识别文字找出最合乎逻辑的词,做更正的功能。
字词数据库:为字词后处理所建立的词库。
人工校正:OCR最后的关卡,在此之前,使用者可能只是拿支鼠标,跟着软件设计的节奏操作或仅是观看,而在此有可能须特别花使用者的精神及时间,去更正甚至找寻可能是OCR出错的地方。一个好的OCR软件,除了有一个稳定的影像处理及识别核心,以降低错误率外,人工校正的操作流程及其功能,亦影响OCR的处理效率,因此,文字影像与识别文字的对照,及其屏幕信息摆放的位置、还有每一识别文字的候选字功能、拒认字的功能、及字词后处理后特意标示出可能有问题的字词,都是为使用者设计尽量少使用键盘的一种功能,当然,不是说系统没显示出的文字就一定正确,就像完全由键盘输入的工作人员也会有出错的时候,这时要重新校正一次或能允许些许的错,就完全看使用单位的需求了。
结果输出:其实输出是件简单的事,但却须看使用者用OCR到底为了什么?有人只要文本文件作部份文字的再使用之用,所以只要一般的文字文件、有人要漂漂亮亮的和输入文件一模一样,所以有原文重现的功能、有人注重表格内的文字,所以要和Excel等软件结合。无论怎么变化,都只是输出档案格式的变化而已。
声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com
HPV16阳性就是宫颈癌吗 防静电工作台销售前景怎么样 在深圳,精益管工作台的价格一般是怎么样的? 防静电式PCB周转车有没有按需定做的生产厂? 深圳全百捷公司主要做什么的 深圳哪一个厂家的信誉比较好。 广东防静电工作台哪里的比较好 男人补精吃什么男人补精10大食物 什么是甲骨文认证教育 甲骨文证报考条件 毛晓彤杨玏情侣拍照模版登上热搜,这种模板拍出的照片真的好看吗? 石家庄40中学有小语种班么?和43中比那个好啊?等等... 天津市第四十一中学有高中部吗?教学质量怎么样? 今年宝坻区中考有多少学生降20分线的? 南都实验学校有小语种班吗? 天津外国语大学暑期小语种班 问问大家,成立小语种班级的目的是什么? 读外国语中学开设的小语种班,有什么优势和劣势? 某些学校有小语种班级,谁能讲讲? 怎样办预防近视的手抄报? 问问大家,直升小语种班级学生和正常班级学生参加高考有何不同? 天津市第41中学小语种班 请问今年天津中考的考生有多少人?市五所收多少?市重点招多少? 天津市第四十一中学怎么样? 在我国,无论小学生还是中学生,学习的外语都是英语,我想问,有学习西语的小学或中学吗? 天津第四十一中学(外大二附中)小语种班怎么样。费用大概是多少?求大神解答,谢谢 天津四十一中学小语种班要交多少钱? 抽芯铆钉与闭口铝铆钉的区别 铝铆钉比铁铆钉贵还是便宜 铝拉铆钉多少温度融化 苹果手机怎么退出app? Line怎么下载?? 为什麼大陆的手机下载不了line? 你好请问一下如果申请过网贷还可以在银行申请贷款吗?批的几率大不 第一个吃西红柿的人是谁? 那些人适合吃柿子? 世界上谁是第一个吃西红柿的人? 什么节日吃柿子 天安门 柿子被谁吃??? 中国第一个吃西红柿的人是谁 谁是清华附中第一个吃柿子的人 哪些人不宜吃柿子 柿子和弥猴桃谁好吃? 中毒了,中毒了,怎么办?我一打开cad软件就弹出窗口说:“发现程序正在创建系统登录账户” 如以下图片 中望CAD注册。怎么办? 手机用了四年了,本想换个新手机,现在华为出了个内存升级 我是换新手机还是升级多用几年? 打开CAD出现这种问题怎么解决,以前没有这种情况。我用的是中望CAD 中望CAD注册出现的问题 我在电脑上登录CAD时出现这个对话框是哪里出现了问题?我要怎么解决?说的详细一点我刚开始用CAD。 我下的中望CAD2015+怎么点开就显示这个呢??