|
其实直接用罗马字也就没那么多事了,不知道为什么有人对罗马字抱有某种偏见。
使用汉字就必须符合当代人使用汉字的需要。比如哪些字可以在网络上使用,哪些字不可以;哪些字是异体字等等。文字现代化在西方早已实现。西方文字比较简单,只需制定字母表,即可确定文字的排列、形状、读音等。相比较而言,汉字的定形、定序、定音、信息化等工作要难得多。1950年代以来中、日、韩、台、港、澳、新加坡等国的教育部门都作过相当多的工作,但是这些工作都是建立在完善华语或者日语、韩语、粤语书写的基础上的,从来没有过完善吴语书写的工作。上海闲话abc主编的《吴语小手册》里的吴语字表是一项重要的成果,但是这个字表使用的音系比较杂乱,《手册》里收录的有些音节在许多吴语音系里是不存在的,其次对于吴语专用字也没有完整的收录,再者就是脱离现在生活的需要,某些不必要的字被收了进来。
建立汉字音表,就不得不考虑到汉字信息化的实际情况。胡乱造字无法让信息社会接受,这样做的成本也极高。根据中国社会的实际情况,我们认为以gbk字符集作为字表用字最为合适。在中国大陆通用的字符集只有3个,一个是gb2312字符集,有人认为这个字符集收字太少(仅6000余字),另外这个字符集只有简体字,对于吴语来说相当不适用,比如吴语里“並”和“并”是不同音的,假如使用gb2312字符集将造成比较大的麻烦;第二个是gbk字符集,收字约2万余,目前已经在中文网陆上畅行无阻,这个字符集不仅有简体字,还有繁体字,但有一些吴语的常用字,比如上海话第二人称复数na没有收录;第三个字符集是gb18030字符集,收字2万7千余,尽管这是中国的国家标准,但是至今仍未普及,如果将来能够普及,当然是一件好事情,像上海话第二人称复数na字的问题也可以解决了。
总而言之,现阶段最合乎实际的做法是使用gbk字符集作为吴语汉字音表的标准。以后gb18030字符集普及以后再做gb18030的字表不迟。unicode并不是一个实际的想法,世界上大多数网页并不采用unicode。
使用gbk字符集就必须要字符集里的文字进行处里,比如繁体字和简化字的问题、异体字问题等等,最终目的是建立一个一个语素只有一个标准字的字表,繁体字和异体字附于标准字的下面,不做独立汉字处里。
拼音问题
gbk字符集收录2万余汉字,必须由一个团队协作合作才能完成。考虑到目前拼音杂乱的事实,建议统一以国际音标标音,国际音标用lucida sans unicode字体,必须注出上海音(中派上海话),其余如果有人想注苏州音杭州音宁波音等等随意,但仅作参考。 |
|