清华紫光OCR(TH-OCR)是一款拥有完全知识自主产权的图像汉字识别软件,由清华大学1985年开始研发,对中日韩文与英文混排文档的识别水平超过国外同行效果。连续3年被中国软件行业协会评为优秀软件产品,成为汉字输入技术的一座里程碑。 小编注解:OCR是英文Optical Character Recognition的缩写,意思为光学字符识别,通称为文字识别,它的工作原理为通过扫描仪或数码相机等光学输入设备获取纸张上的文字图片信息,利用各种模式识别算法分析文字形态特征,判断出汉字的标准编码,并按通用格式存储在文本文件中,由此可以看出,OCR实际上是让计算机认字,实现文字自动输入。它是一种快捷、省力、高效的文字输入方法。 清华紫光OCR(TH-OCR)突出特点 汉英双语同时混排,识别率最高,居世界领先水平。 可以识别黑白、灰度、彩色图像,可以读取多种图像格式。 首创对识别结果进行电子文档版面复原功能,所见即所得。 首创日文、韩文、日英混排、韩英混排识别功能,识别率98%以上。 清华紫光OCR(TH-OCR)功能特色 1、是唯一可以识别2万多汉字的多体文字识别系统,汉字识别国内最优。 2、汉字和英文混排、日文和英文混排、韩文和英文混排同时识别。 3、汉字识别率最高。文通TH-OCR经过“863”智能专家组对数十万字的指标评测和中国软件评测中心对产品的严格测试,识别正确率超过99.5%,代表了目前印刷体文字识别的最高水平。 4、支持多种环境接口。文通TH-OCR支持WINDOWS环境和GB、BIG5、GBK、JIS、 SHIFT-JIS和KSC等多种内码,可以用于 WINDOWS NT和WINDOWS 98/2000/XP,适合全球各个地区使用。TH-OCR还具有自学习功能,不论什么生僻字,都可以通过键盘输入进行学习,大大拓宽了OCR系统的识别字符集。 5、历次国内鉴定均被中国科学院院土和中国工程院院土等专家组成的鉴定委员会评定为“具有世界领先水平”。 清华紫光OCR(TH-OCR)更新日志 1、优化内容 2、修复bug