毕业设计开题报告 联系客服

发布时间 : 星期六 文章毕业设计开题报告更新完毕开始阅读767d58ddcc1755270622085f

本科毕业设计(论文)手册

(理工科类专业用)

毕业设计(论文)题目 基于TesseractOCR和Baidu语音的证件识别系统 专 题 题 目______________________ ________________________________

设计(论文)起止日期:2016年3月20日 至 2016年6月1日

计算机科学与技术 学院 软件工程 专业 XX 年级 X班

学指

生导

姓教

名 ____XX_ ___ 师 ____XX______

教研室(系)主任 ____XX______ 教年

学月院

长 ___ XX______ 日 __2016年4月20日___

须 知

一、本手册第1页是毕业设计(论文)任务书,由指导教师填写;第2页是开题报告;第3页是答辩申请事项。答辩时学生须向答辩委员会(或答辩小组)提交本手册,作为答辩评分的参考材料,没有本手册不得参加答辩。本手册可以使用电子版打印,但签署姓名和日期处必须手工填写。本手册最后装入学生毕业设计(论文)档案袋。

二、毕业设计(论文)期间,要求学生每天出勤不少于6小时,在校外进行毕业设计(论文)或实习(调研)者,应遵守有关单位的作息时间,学生如事假(病假)必须按规定的程序办理请假手续,凡未获准请假擅自停止工作者,按旷课论处。

三、学生在毕业设计(论文)中,要严格遵守纪律、服从领导、爱护仪器设备,遵守操作规程和各项规章制度;自觉保持工作场所的肃静和清洁,不做与毕业设计(论文)工作无关的事情。

四、学生要尊敬指导教师、虚心请教,并主动接受老师的随时检查。 五、学生要独立完成毕业设计(论文)任务,在毕业设计(论文)过程中要有严谨的科学态度和朴实的工作作风,严禁抄袭和弄虚作假。

六、毕业设计(论文)成绩评定标准按五级:优秀(90分以上)、良好(80分以上)、中等(70分~79分)、及格(60分~69分)、不及格(59分以下)。

毕业设计(论文)任务书(指导教师填写)

设计(论文)题目:

基于TesseractOCR和Baidu语音的证件识别系统

设计(论文)主要内容(包括主要技术参数):

证件的识别出现在日常生活中的各个场合,例如通过校园网的一卡通考勤系统,入住酒店时需要使用身份证实名认证,交警在处理交通事故的时候也需要对驾驶员的驾驶证进行核对。常见的图像获取和识别通过扫描仪实现,但是不便于携带。随着智能手机的普及,使用手机的摄像头实现基于Android或IOS系统证件识别系统是更加方便、高效的解决方案。

本毕业设计拟利用TesseractOCR技术和Baidu语音,采用JAVA语言,开发基于Android的证件识别系统。主要包括如下功能:

第一,实现基于Android的APP,完成用户的UI交互和摄像头的图像采集。 第二,实现基于TesseractOCR的包含不同字体汉字数字的证件格式化OCR识别。 第三,利用Baidu语音云服务,实现对识别信息的阅读。

主要参考资料:

[1]池浩,一个基于TesseractOCR Engine的Wrapper的设计与实现[J],科技传播,2011:34~36.

[2]朱怀中,基于Android的手机OCR识别技术设计与实现[J],电子科技,2012:9~12. [3] I Marosi,Industrial OCR approaches: architecture, algorithms and adaptation techniques [C]. Document Recognition and Retrieval,SPIE,2007:6500-6510.

[4] A Khan, S Mahmood, W MRST. A New Technique for Information Summarization. Transactions on engineering, Computing and Technology, 2005:1305~1313. [5]刘爽,一种名片识别系统的实现方法.现代计算机,2011,11:12~13.

[6]金鑫,中英文混排名片识别系统研究[硕士学位论文],南京航空航天大学,2011.

指导教师签名____ ____

年 月 日

1

毕业设计(论文)开题报告

一、选题目的及背景

身份证、学生证作为个人信息行之有效的管理工具,已经运用到了生活的方方面面,证件信息的获取具有十分重要的作用。目前,身份证和学生证的信息搜集大多采用人工录入方式,或者利用设备读取其中的磁信号,这两种方式存在着不可忽略的问题。 (1) 人工录入方式。耗时耗力,效率低下,且可能因为人工原因导致信息

错误录入,造成不必要的麻烦和损失; (2) 利用设备读取证件磁信号。或因证件被消磁等原因无法广泛使用。

于是,急需开发出一种高识别度、易于操作和管理的证件识别系统,使终端设备能够自动识别证件信息并将其保存,便于人们使用。

基于TesseractOCR的证件识别系统可解决上述问题,其优点是从图像处理入手,利用机器抓取图像信息并进行自动识别。所谓的OCR技术,指的是光学字符识别,即Optical Character Recognition的简称,是利用扫描把所有书籍、文稿及材料进行扫描,再对图片文稿做一下研究分析,取得字符和版面上信息的一个过程[1][2]。其次,老年人与现在的互联网时代是脱节的,他们或许会因为眼神不好,无法看清重要证件上的关键信息,则证件自动识别并自动播报尤为重要,可为老年人提供便利。因此,基于OCR和Baidu语音技术进行证件识别,具有非常重要的实际意义。

二、国内外研究现状

1999年,汉王公司推出了第一个中文名片识别系统,历经9年的发展,识别技术水平越来越高,功能越来越强大。目前,在国内市场上销售的中文名片识别系统有北京汉王科技有限公司的汉王名片通、台湾蒙恬公司的蒙恬名片王、清华紫光公司的紫光名片大事、新加坡维优公司的维优名片管家等。“汉王名片通”的研发起步最早,识别率最高,从1999年开始已开发出十几个版本,占中国大陆中文名片识别市场份额的90%以上[2]。 现今,有很多关于名片识别方法的文献,文献[3]提出了一种多阶段识别方法,采用不同类型的神经网络识别中文名片;文献[4]构造了一个完整的中文名片识别系统,但只能处理纯横排或纯竖排的名片,且在已知待识别的字体前提下;文献[5]采用模板匹配的方法分析名片版面,故只能处理固定版面的名片。以上文件未考虑实际复杂情况,例如:名片文字横竖行混排;

2