第七百四十一章 生僻字的重要性(1 / 2)
“是吗?”周至说道:“那为何我研究过一些关于文字系统的论述,结果发现一般中文应用系统,也需要一万三千个左右的汉字;而大型的中文应用系统,则需要两万三千个左右的汉字;政府机关的专用中文应用系统,则需要四万八千个左右的汉字;而大型图书馆用的中文应用系统,需要的汉字可能超过十万呢?” “哪里这么夸张?”李红江是计算机信息技术的大拿,然而对汉字编码也是半路出家,对于编码算法,字库编程,函数耦合等技术性的东西有丰富的经验,然而大型图书馆需要超过十万的汉字这种概念,也彻底颠覆了他的认知。 “的确有这么夸张。”辜老说话了:“光康熙字典,就有四万七千零三十五个汉字,也就是说,如果我们图书馆要对康熙字典进行数字化采集,你们这个还没有投入的GB13000,将有一半的汉字,在系统当中显示不出来。” 辜振铎也开口了:“我主持编纂的《汉语大字典》,收入的单字也有五万六千个,如果用GB2312标准,只够一个零头,如果用GB13000,也只够一小半。” 旦增大师作为历史系的重要人物,今天也参与了这个会议,这时候也说道:“大家不要忘了,我们祖国是一个多民族的国家,除了汉语以外,还有藏文,蒙文,壮文,维吾尔文等十多种文字,这些少数民族文字的信息化编码工作,也是应该要纳入考虑的。” 辜振铎听着都觉得有些过分,这最大最主要的语种都还没有搞定呢,哪里顾得到其他,于是说道:“这个要求也实在太苛刻了,得让搞信息技术的同志们一步步来嘛……” “还不止这些啊!”旦增不退反进:“除了少数民族文字,还有古代文字呢,比如甲骨文,啊甲骨文不算,可以算作一种字体,但是突厥文,回鹘文、于阗文、西夏文,这些不能不算吧?” “旦增主任,我们先解决主要矛盾,主要矛盾。”麦主任听得头都大了:“次要矛盾先放一放……” “不用放,无解。”李红江将手一摊:“码位就好像放字的盒子,码位就那么多,因此能放的字也就那么多,GB13000标准两万一千零三个汉字,是我们经过辛苦的研究才搞出来的。” “况且我们使用GB2312编码这么久了,除了一些生僻字以外,还是基本能够满足需要的嘛,这么多年都这么过来了,现在又扩展了这么多,应该满足绝大多数应用场景了嘛。” “哈哈哈哈……”辜幼文听到这个说法,不禁没有生气,反而像听到一个懵懂的孩童讲出无忌的童言那般给逗乐了:“小王是理科生,以前是搞数学的是吧?所以你有这个想法我们也不怪你。” “我给大家讲一个历史故事吧。” “大禹治水的故事,大家都知道吧?” 所有人都是点头。 “那大禹的父亲,因为治水失败而被舜殛死于羽山的鲧,大家知道吗?” 这下理科参会者那边,点头的就少了一半。 “大禹的父亲,名字叫鲧,鲧字有三种写法,大家知道吗?” 这回连文科这边的教授都有不清楚的了。 “肘子,你来讲。”辜老将装逼的机会留给了周至。 周至只好接着:“鲧字有三种写法,一种是大家熟悉的,一个鱼,一个系;第二种是一个鱼,一个玄;第三种是一个骨,一个系。” “鲧是禹的父亲,相传为颛顼之子,一说颛顼五世孙,姒姓,字熙。居于今河南嵩山一带,当时是崇地,所以称有崇氏,又称崇伯。” “尧时洪水泛滥,鲧受四岳推荐治水,用筑堤堵水之法,九年不成,被舜殛死于羽山,其子大禹改堵为疏,最终治水成功,到后来将天下传给儿子启,开启了华夏‘家天下’的时代,这就是夏朝。” “辜老想说这个故事,我想是因为另一个生僻字。” “很多记载,说尧令祝融杀鲧于羽山,鲧化为黄能,沉入羽渊。” “关于这个字,有很多记载,《归藏·启筮》云:‘化为黄龙。’《左传·昭公十七年》云:‘化为黄熊。’《国语·晋语八》云:‘化为黄能。’《拾遗记·卷二》云:‘化为玄鱼。’” “晋代郭璞引《开筮》曰:‘鲧死,三岁不腐,剖之以吴刀,化为黄龙也。’” “明代李时珍《本草纲目·人部》曰:‘黄熊,龙类也。’” “明代陈士元《名疑》曰:‘鲧封于崇,《国语》谓之崇伯,《左传》作崈伯,郑子产谓鲧殛羽山,其神化为黄熊,入羽渊。黄熊或云黄龙。” “到底该是哪个字呢?其实以上说法都错了。这个字的写法,却是熊字少了一点,读音为‘尼’。” “现在
↑返回顶部↑