【#第一文档网# 导语】以下是®第一文档网的小编为您整理的《计算机中文信息处理技术》,欢迎阅读!

计算机中文信息处理技术
计算机中文信息处理技术需要解决的首要问题就是汉字的输入技术,主要方法有键盘输入、联机手写输入、语音输入、光电扫描输入几大类。
键盘输入方法是通过键入汉字的输入码方式输入汉字,通常要敲击1~4个键输入一个汉字,它的输入码主要有拼音码、区位码、纯形码、音形码、形音码等,用户需要会拼音或记忆输入码才能使用,一般对于非专业打字的使用者来说,速度较慢,但正确率高;其中好的形音码或音形码则可以做到速度即快,正确率又高。
联机手写输入是近年来发明的一种新技术,手写输入系统一般由硬件和软件两部分构成,硬件部分主要包括电子手写笔和写字板,软件部分是汉字识别系统。使用者只需用与主机相连的书写笔把汉字写在书写板上,写字板中内置的高精密的电子信号采集系统,就会将汉字笔迹的信息转换为数字信息,然后传送给识别系统进行汉字识别。利用软件读取书写板上的信息,分析^p 笔划特征,在识别字库中找到这个字,再把识别的汉字显示在编辑区中,通过“发送”功能将编辑区的文字传到其他文档编辑软件中。汉字识别系统的作用是将硬件部分传送来的信息与事先存储好的大量汉字特征信息相比较,从而判断写的是什么汉字,并通过汉字系统在计算机的屏幕上显示出来。这种输入法的好处是只要会写汉字就能输入,不需要记忆汉字的输入码,与日常写字一样,但受识别技术的限制,速度一般。手写输入系统的难点在于汉字笔迹的识别,因为每一个人的书写汉字笔迹都不一样,因此手写笔迹比较系统就必须能允许一定的模糊偏差,才能有较高的识别率。目前已经开发了许多种手写输入系统,简称为“手写笔”系统。有些手写笔可以代替鼠标进行操作。
语音输入也是近年来一种新技术,它的主要功能是用与主机相连的话筒读出汉字的语音,利用语音识别系统分析^p 辨识汉字或词组,把识别后的汉字显示在编辑区中,再通过“发送”功能将编辑区的文字传到其他文档的编辑软件中。语音识别技术的原理是将人的话音转换成声音信号,经过特殊处理,与计算机中已存储的已有声音信号进行比较,然后反馈出识别的结果。这项技术的关键在于将人的
第 1 页 共 2 页
话音转换成声音信号的准确性,以及与原有声音信息比较时的智能化程度。语音识别技术是人工智能的有机组成部分。这种输入的好处是不再用手去输入,只要会读出汉字的读音即可,但是受每个人汉字发音的限制,不可能都满足语音识别软件的要求,因此在实际应用中错误率较键盘输入高。特别是一些专业技术方面的语言,识别系统几乎不能确认,错误率较高。
光电扫描输入是利用计算机的外部设备--光电扫描仪,首先将印刷体的文本扫描成图像,再通过专用的光学字符识别(ocr-optal character recognition)系统进行文字的识别,将汉字的图像转成文本形式,最后用“文件发送”或“导出”输出到其他文档编辑软件中。这种输入方法的特点是只能用于印刷体文字的输入,要求印刷体文字清晰,才能识别率高,好处是快速、易操作,但受识别系统识别能力的限制,后期要做一些编辑修改工作。
第 2 页 共 2 页
本文来源:https://www.dy1993.cn/VzzK.html