输入法的发展

由于汉字有数以万计,电脑键盘不可能为每一个汉字而造一个按键。因此,人们需要替汉字编输入码(检索出汉字的代码),用数个键来输入一个汉字。中文输入法的发展过 程,是“万码奔腾”的过程,在30年间出现了上千种编码方法。

最早的汉字输入法,一般认为是从70年代末期或者80年代初期有了个人电脑PC开始诞生的,虽然更早有电报码,用0──9十个数字中的四位组合构成每一个汉字,便于邮电局发送电报之用,但通常意义上,人们还是认为从1981年国家标准局发布《信息交换用汉字编码字符集基本集》GB2312-80以来,个人计算机上开始使用五笔或者拼音输入汉字才是输入法广为使用的真正开始。在台湾的汉字输入法历史则可追溯至1976年由朱邦复发明的之仓颉输入法。

汉字输入法的发展,一方面是输入法软件的功能的改进和完善,另一方面是新型输入法编码的不断涌现。前者主要是针对拼音输入法,后者则出现了“万码奔腾”的局面。早期的输入法软件大都为收费软件,很多企业或个人依靠销售输入法软件挣钱,如今收费的输入法已经很少,绝大多数输入法软件都是免费的产品。 拼音类的输入法包括大陆的拼音输入法和台湾的注音输入法等。拼音输入法相比其他输入法有着天然的优势,因为现代每一个接受教育的中国人在还没学习汉字前就先用大量时间学习汉语拼音或注音符号,原本只是用来标记汉字读音的拼音也就可以轻松地作为汉字的输入编码。拼音输入法另一个优势就是接近口语,所以拼音输入法可以在短时间内适应。

但是拼音输入法有着致命的弱点,就是汉字输入法编码时,单字重码率相当高,即使词组重码率也是非常高。为了让拼音能够较快速的录入汉字,只有借助复杂的输入法软件来提高拼音输入能力,比如支持智能排序,以词定字,整句输入,云输入功能等,纵观拼音输入法的发展,也即拼音输入法软件的发展。

在中文输入法诞生之初就最先出现拼音输入法,但是当时的拼音输入法软件功能差,字序固定,不支持词组和整句输入,甚至文字不能和编码一起显示。在输入汉字过程中常常要翻很多页才能找到需要的汉字,输入效率非常低下。虽然当时很多人都只会用拼音输入法,但大部分人都不满拼音输入法的输入效率。

20世纪90年代后,拼音输入法软件开始支持词组输入和整句输入。1993年出来的中文之星输入法软件能够做到单个字词的即时显示,即一边打拼音,同时显示汉字。中文之星软件进行一些巧妙设计,如空格确认、逗号句号选重码、允许模糊音容错和自定义字符串等,这些功能已经成为当今所有拼音输入法软件的必备功能。1993年初北京大学的朱守涛先生发明发明了智能ABC输入法,后被微软收购内置到Windows系统中。在随后几年中智能ABC输入法成为了中国大陆使用人数最多的输入法软件。

1994年的出来的自通输入法软件和1996年的黑马神拼输入法软件,这两种输入法都实现了汉字整句输入(又称语句输入)能力。汉字整句输入可追溯到20世纪80年代末期,哈尔滨工业大学在校博士生王晓龙进行了汉字分词方面研究,并申请了863课题,写出了“最小分词问题及其解法”方面的论文,从而奠定了拼音整句的输入的理论基础。微软从Windows 95中文版开始,在系统内置支持整句输入功能的“微软拼音输入法”。

然而当时的拼音输入法普遍智能化程度不高,整句输入不成熟,输入过程中错误率高,而且不能够与所敲拼音同步显示汉字(微软拼音是滞后一个字、自通是滞后几个字、黑马拼音是需要最后确认才出现汉字),整句输入过程中修改拼音选择汉字不方便,大大限制了整句拼音输入法的使用,所以很多用户还在继续智能ABC。直到1998年谭亚军发明的拼音之星软件,才完全支持“实时显示”的方式,不管输入多少拼音,每个字母按下去,汉字就同时显示,拼音有错误,用户就会立即发现,又由于支持自动分词与整句输入,用户不用去担心是输入一个词语还是一句话,系统都能够进行处理,如果没有该词语,系统也能够自动学习并存盘,似乎具有了词语输入法的方便性与整句输入法的智能性。到了1999年出现了另外几个拼音输入法软件:拼音加加、自由拼音输入法和考拉输入法,拼音加加软件开始支持在不切换输入法情况下直接用Enter直接键入英文字母。

在90年代,双拼输入法和相应的输入法软件也得到了快速发展。双拼输入法诞生了多种方案,如自然码输入法软件提供的自然码方案,更采用双拼加偏旁或笔划的音形结合方式编码,提供了一种快速输入汉字的途经,这已经超出了拼音输入法的范畴,严格来说自然码双拼不属于纯拼音,而是一种音形码。此外微软、拼音之星、拼音加加、小鹤双拼等都提供了各自不同的双拼方案。

进入新世纪后,拼音输入法软件功能趋于成熟,正式进入了智能拼音输入法时代,这时产生的拼音输入法软件主要是整合以前拼音输入法软件优点,提供了更大的词库,软件的智能性也更强,还拥有了更强的学习能力。

2000年初出来的智能狂拼也提供了更智能的输入方式。而紫光拼音输入法是在考拉输入法的基础上开发而成,提供了一个更大的词库,增加了智能组词,也就是说用户连续输入9个字以内的拼音串,系统能够自动转换成汉字,而不论是否有这个词语,系统根据词频高频先见的方式给出一个词语串的组合。紫光输入法最终成了用户最喜欢的输入法之一。

随着互联网的快速发展,2006年6月由搜狐公司推出的一款Windows平台下的搜狗拼音输入法。搜狗拼音输入法是基于搜索引擎技术的新一代的拼音输入法产品,用户可以通过互联网备份自己的个性化词库和配置信息。搜狗拼音输入法一经出来很快取代了智能ABC输入法而成为中国现今主流汉字输入法。

在搜狗输入法出来后,谷歌、腾讯、百度和微软也相继推出了同一类型的智能拼音输入法:谷歌拼音输入法、QQ拼音输入法、百度输入法、必应输入法。

随着智能手机和平板电脑的流行,很多IT企业又开发了Android、iPhone、iPad的拼音输入法,如百度手机输入法、QQ手机输入法、搜狗手机输入法等。这些输入法延续了电脑上输入法的特点,同时输入法软件针对触屏的特点,从而提供了更为灵活的输入方式。

在台湾的拼音输入法则以注音输入法为主,与大陆类似都是在输入法软件方面不断得到完善和改进,变得更加智能。与大陆不同的是,大陆拼音输入法一致采用英文26键作为拼音输入法的键位,而台湾使用的注音输入法键位设置没有一个统一的标准,从40键到30键,再到26键都有人使用。因为注音符号与键盘的英文字母并不是一一对应的,所以注音符号设置键位的时候往往采用数字键和符号键作为编码。

在香港人则流行粤语拼音输入法(又名广东话输入法),利用汉字的粤语读音,在电脑上输入汉字。由于粤语拼音缺乏统一的拼音标准办法,各种软件的拼音法并不一致,故有碍粤语拼音输入法进一步的发展和普及。 电脑在中国普及,第一个急需要解决的问题就是,如何将汉字输入到电脑中,拼音虽然可以作为汉字的编码,制作成拼音输入法,但是很长一段时间拼音输入法的输入汉字效率极其低下。为了能够让中文快速的在电脑上输入,有的人抛弃英文键盘布局而另外设计了专门的中文键盘,这些键盘作为编码的键数量有的为几十个,甚至有的达到几百个,但是这些方案并没有实现中文的轻松或快速录入。

直到 1983年8月,王永民推出了划时代的五笔字型输入法。五笔输入法采用普通的电脑键盘,只使用英文字母键其中的25个参与编码,不但可以让我们输入汉字,而且也极大的解决了输入速度这一顽症。五笔字型完全依据笔画和字形特征对汉字进行编码,是典型的“形码”。五笔字型在发展过程中先后诞生了三种编码方案,即86版和98版和新世纪版。作为国内第一个推广的形码输入法,一经推出来,即受到很多用户的热捧,在80年代和90年代,很多人学习电脑的第一要务就是学习五笔字型输入法,五笔的教学培训班也遍地开花。

在80年后期还出现了另一个著名的形码输入法——郑码输入法。郑码是郑易里和女儿郑珑***同发明的一种中文输入法,郑码相比于五笔更加规范,而且郑码输入法要比五笔更加广泛,因为微软从Windows 95系统开始就内置郑码输入法,成为系统默认自带的输入法,直到2012年的Windows 8才取消内置郑码输入法。郑码推出后很快获得中、美、英国专利授权,并通过国家级的鉴定,曾荣获北京国际发明金奖和最优秀发明大奖;荣获第22届日内瓦发明金奖。为了解决繁体字与简体字通用的问题,郑码采用字根双编码方式减少字根重码,因采用按特征检索基根和区码方式以及大多采用标准的偏旁部首记忆量增加不大较为易学。

在80年代和90年代,由于国家教委尚未有推荐输入法方案,所以在中小学里教的汉字输入法相当多,各个学校教汉字输入法也不尽相同,有的教五笔字型,有的教自然码,有的教肖码等。虽然五笔字型输入法可以快速录入汉字,也在全国范围内得到较为广泛的商业推广,但是五笔因为学习难度高,而且五笔编码本身有不少存在不合理的地方,比如字根不符合汉字基本部件与违反笔顺的问题,所以一直无法成为国家教委的推荐输入法。

进入90年代后,国家教育委员会批准了关于研发输入法的“八五”重点攻关项目。在1992年8月1日至3日,国家教委基础教育司及直属的全国中小学计算机教育研究中心在北京召开了 “全国中小学教学汉字编码规范与计算机汉字输入系统”的研讨会。最后与会代表认为,在当前的中小学计算机教学中,应主要使用汉语拼音方案作为计算机汉字输入方法,而对形码的选择应持特别慎重态度,目的在于避免对语言文字的“污染”,并坚决反对用商业竞争或行政命令手段在中小学中强制推行不规范的汉字输入编码方案的做法。两年后项目课题组推出了名叫“认知码计算机汉字输入系统”的形码输入法, 1995年国家教委推荐中小学使用认知码,向全国中小学校全面推广。

可是,由于认知码自身存在很多欠缺,在推行之中遇到很大争议和阻力。不少学术刊物纷纷载文讨论认知码,因为认知码自身的致命缺陷,比如重码率相当高、编码规则复杂、易学性差、字根选择缺乏正确的规范、简码的使用不科学,使这种后来研制出的官方编码被批评家批驳得体无完肤,一蹶不振。最后认知码全面推广之事也不了了之。

在国家教委想方设法研发一种易学规范而又快速的输入法同时,一种更优秀的输入法——二笔输入法已经在民间诞生。二笔输入法是陈劲松于1992年发明的音形码输入法,采用拼音首字母与笔画(两个笔画取一键)相结合的方式取码。二笔输入法直到2000年1月成立的广东二笔软件有限公司向外界推出二笔输入法软件后,才正式出现在大众的视野中。二笔输入法不但易学,还可以输入文字打出像五笔一样速度。二笔输入法具有规范、易学、快速的特点,因此顺利通过国家教育部基础教育课程教材发展中心评审而获准进入中小学基础教材,这是截止2013年唯一获得批准进入中小学基础教材的汉字输入法。

由于广东二笔软件有限公司以高价销售二笔输入法软件,而且当时(2000年到2004年期间)已经得到广泛使用的智能ABC输入法和五笔输入法是免费的产品,只有很少人愿意尝试使用二笔。最终导致以经营二笔输入法软件为主要业务的广东二笔软件有限公司在2004年濒临倒闭。在另一方面,二笔输入法以其优秀的特性吸引了不少二笔爱好者,还有些爱好者对二笔进一步改进和优化,同时对二笔输入法软件进行维护。二笔输入法软件大都能够在互联网上免费获得和使用。

而随着智能拼音输入法时代的到来,特别是在2006年搜狗拼音输入法的诞生后,非拼音类的形码或音形码输入法受到的关注也就越来越少,而且不再有国家相关部门参与开发和推广输入法。但这并不影响众多输入法爱好者对输入法编码方案研究的热情。很多爱好者研究输入法都会从多面方面考虑,比如重码率、易学性、对大字库的支持、输入法按键的舒适程度等。

一些输入法爱好者仍然想得到一个超低重码率的输入法,所以也就产生了GB2312-80字符集的6763个汉字中只有14个重码字的张码输入法。在支持大字库方面,除了输入法编码本身外,更要输入法软件和字库或词库的支持,所以诞生了海峰五笔软件。而在输入法编码方案易学方面,至今依然没有一个能够超越二笔输入法的编码方法,能够做到既高效又易学。

在台湾,中文输入法也出现了非常多的输入法编码方案。1976年朱邦复发明第一个形码输入法——仓颉输入法,发明输入法后,朱邦复公开该输入法,不收分文,使电脑汉化得到很大的进展。所以台湾的Windows操作系统都内置有仓颉输入法。也成为台湾最流行的形码输入法之一。成仓颉输入法出来之后又诞生了一批形码输入法,像王赞杰发明了大易输入法,廖明德发明了行列输入法,和仓颉输入法一样,这些输入法作者开放输入法专利,所以同样内置到了Windows系统中。在台湾使用人数最多的形码输入法是呒虾米输入法,这是在20世纪80年代后期,台湾人刘重次发明的一种形码输入法。