刘皓明:谈谈数字化书写
书写方式在文学乃至文化形成中所起的作用,可能至今还没有得到充分认识。在书写方式已经进化到数字化的今天,我跟用中文写作的绝大多数人一样,直接在键盘上输入汉字。比起中文计算机化的初期,现在的输入法使用起来方便了很多。但我恐怕这样的方便主要来自计算机整体技术水平的提高——处理器的速度、内存的扩大等等——而不是输入法本身有了多大改进。我甚至觉得,这几年各种中文输入法在语言水平上不进反退,以至于如今坐在计算机前写作就像从塌方的房子里搜寻财物,灰头土脸,费力地拨开错字的瓦砾和脏话的污秽,把埋在里面的东西刨出来,然而无论怎样擦洗,遭此劫难的幸存物上还是有污渍。
我用过的汉字输入系统近年来有两种,应该也是今天最广为人使用的那两种,而且我只用拼音输入法。作为学者,汉字输入系统的用途对我来说主要当然是学术写作,但是如今用通用的汉字输入系统打任何业务文件,无论是学术的还是其他一般性的公文,都很费劲。因为按照拼音打出的字词,排在前列的有大量的字或词条是网络语、脏字、表情图甚至是内容猥亵的图案。
我不知道汉字输入软件在业务性(相对于娱乐性)的使用上占全部使用的比率是多少,是否娱乐性而不是业务性的使用占了全部使用的绝对多数,也不知道使用者的年龄分布和受教育程度的分布,是不是二十五岁以下的占绝对多数,但是我所接触的几种主流汉字输入法肯定主要是为青少年娱乐设计的,是网吧风格的、混混儿风格的、网瘾患者友好型的,但绝不是服务于成年人乃至青少年从事其各自业务和用于学习的。
这种状况跟我所熟悉的英语德语计算机输入状况乃至更广泛的社会书写规范化的相对严格形成鲜明对比。诚然,英德等西方语言除了手机输入法有文字联想功能外,计算机文字输入的确都是一个个字母的输入,不像中文这样需要拼音输入然后在大量的同音字词中选择正确的字词。但是英德文字输入软件带有拼写检查、语法检查、同义词近义词词库等功能,这些功能类似于中文输入法的联想功能的地方在于,两者都体现了产品生产者在语言规范标准上的立场与政策。两者之间不同的,则是这些西文软件绝不像中文输入软件那样,努力迎合任何一种新的口语和网络语的语用潮流而无视语言学家们制定的标准语言规范,更不会推广脏话。
如果网络语乃至脏话泛滥旨在迎合年龄和教育水平处在低端的用户,旨在服务于业务性应用的功能也同样问题重重。我这里不想说词库中的词组常常包含错字、非词语组合大量出现在词库等等情况,只想说说繁体字的问题。由于需要引用古籍,我常常要输入繁体字,但是繁体字库中错字连篇。比如最常用的字“爲”,无论拼音输入后的首选字还是含爲字的多音节词,都被设计成“為”,甚至所有以这个字为偏旁的汉字例如“僞”、“潙”等也都用这种异体繁体字。这样的混乱不仅见于网络,连正式出版的古籍都这么印,例如新近出版的《杜甫诗全集校注》。仅次于“為”的繁体字滥用大概要属“著”,被用来取代一切“着”字。据我所知,这种混乱的原因主要是在字体选择和设计上依从了台湾地区流行的字体,而台湾地区使用的繁体字体又常常受到日文简化汉字的影响,“為”应该就是依据“爲”的行草字体简化来的,而不是依从了语言文字学的经典和机构。
众所周知,语言是随着时间而不断变化和变异的,但是在成熟的现代社会里,语言就像任何流通物品一样,是被规范甚至是被立法的。这些规范和立法总的来说偏向于保守,它会有选择地承认和接受伴随日新月异的现代科技所产生的新名词新术语,但是绝不会承认、鼓励、散布网络俗语、脏话、不规范缩写简称等等语言污染。的确,没有任何机构可以阻止人们在口语中发明和使用新俚语新俗语等规范之外的语言,而且也实在没有必要阻止。但是一旦进入书写,情况就不一样了。早在一个多世纪前,H.W. Fowler和F.G. Fowler在其名著《标准英语》(The King’s English)中就说过,俚俗语(slangs)除了在对话里外不应该出现在写作中,这话我看一百多年后的今天仍然有效。
当然今天的情况复杂些。在数字化书写的今天,并非所有数码输入的文字都是写作。社交媒体的文字输入的确就是口语对话的另一种形式而已,算不上是写作。但是使用WORD等文件软件时的文字输入则都应是这种或那种形式的写作:无论写的是应用文,记叙文、论说文,还是文学创作。换句话说,在计算机上使用办公软件输入文字时应该被视作是文字输入软件的业务应用。那么,用于这样输入文字的软件是应该首先甚至是排他地方便使用规范语言的合理合法使用呢还是要增加合理合法使用规范语言的难度而给不规范使用大开方便之门呢?是服务于业务使用呢还是服务于娱乐呢?答案是不言而喻的。
造成汉语文字输入目前这种混乱状况,除了马虎的工作态度和习惯外,一个更深层的原因是长期存在于中国社会中的对成规的轻视甚至无视。这些年来风行的网络语有不少就是无知者们狂欢的产物,比如近年来流行的“囧”字等等。变化无常的网络流行语和相对稳定的书面语是要划出一个界限的,就像民间与体制、一时的时尚与历史久远的传统之间是有区别的;书面语是需有规范的,就像社会有法律规范一样。
并不是任何事物都可以通过当下流行度来决定,而民科民哲民骂并不能因为来自草根就应被视作天然具备高于体制的道德水平乃至专业水平。不尊重规范、纵容无知对规范的冲击行为就如同纵容医闹一样,最终损害的是全社会的利益,败坏的是我们整体的文明水平。
原载2016年9月14日《文汇报·笔会》
中州韻輸入法引擎(http://rime.im/)也许可以满足作者的要求,它没有糟糕的词库,可以区分大陆繁体与台湾正体(https://www.byvoid.com/zhs/blog/recommend-rime),只是默认词库比较小,软件需要时间来学习用户的输入模式。对非技术用户来说,这个输入法配置起来可能有点麻烦,需要读官网的各种说明文档。另外官网的小狼毫的Windows 10支持不太好,Windows 10用户也许需要这个版本https://github.com/osfans/PRIME/releases 。