沟通古今,提供汉字准确属性信息
实现让通用规范汉字沟通古文字、繁体字,是该资源库的又一重要特征。据介绍,系统的主体字集是国家语委2013年公布的《通用规范汉字表》的8105个规范汉字及其关联字形。《通用规范汉字表》属于简化字系统,分为一级字表(即常用字表,3500字)、二级字表(3000字)、三级字表(1605字)。《通用规范汉字表》作为数据库子库的B库,直接和A库(传承字、繁体字和隶定字)关联,进而与小篆等古文字(C库)关联,从而实现了古今、简繁汉字的有效贯通。
如何保证对收录的每个汉字形、音、义解释的权威性?
王立军介绍,系统的处理方法是:选取历代具有代表性的辞书,并选择最优的版本作为搭建框架的基础素材,以此为基础建构数据之间的深度关联。选择的辞书包括从《尔雅》《说文》《释名》《方言》《广韵》《集韵》《康熙字典》《汉语大字典》《新华字典》和《通用规范汉字字典》等。在字形方面,简化字的部首采用2009年国家语委发布的《汉字部首表》,即201个主形部首和99个附形部首,非简化字采用214部首体系,来源于《康熙字典》。简化字和繁体字的笔画数属性参考《通用规范汉字字典》等。结构类型(六书)属性参考《说文解字》。字音方面,现代汉语拼音和注音字母主要参考《通用规范汉字字典》和民国时期《国语辞典》等;近代音来源于《中原音韵》;中古音来源于《广韵》。字义方面,常用义项来源于《通用规范汉字字典》,并给出历代辞书的释义内容。
多种属性的综合呈现,可以加深人们对每个汉字的理解。比如“既然”的“既”和“即使”的“即”,在使用过程中容易混淆,但参考小篆字形就不会了——“既”是一个人背对着饭桌,表示吃完了,这个字就是表示已经发生了;而“即”是一个人正对着饭桌,靠近它,还没吃饭,所以是表示即将进行的。了解了这一层面,理解就加深了,也就很难出错了。
汉字不是一个个“孤零零”的符号,汉语文献正像躯体的血肉,丰富着汉字殿堂的内容。在每个字的“用例”一栏,系统选取具有代表性的传世文献作为古籍用例的来源,包括十三经、二十五史、二十二子等三大典籍系统,提取汉字在这些文献中的使用例句,供研究者参考使用。
多种检索,满足不同用户需求
与查字典类似,方便检索也是系统的一大特征。为方便使用者更便捷地输入需要检索的字,系统提供了单字、拼音、部首、部件、笔画等五种可输入的检索方式,使用者可以根据自己的喜好和需求,选取适合自己的方式。除单字检索外,还可以满足综合检索、专书检索和历代字形检索。
“你看,‘典’字是两只手捧着书卷,这多么形象,对于文史研究者来说用于研究也太方便了,我现在就想拥有。”刚刚演示完动画,现场主持人、北京师范大学文学院教授康震兴奋地说。
“资源库可作为文字和文化爱好者提高文化知识和综合素养的学习平台,为传统文化爱好者提供权威的学习内容;可以作为基础教育及汉语国际教育领域的教学平台,为学生学习、教师备课提供丰富的教学资源,从而更好地服务我国基础教育;可作为文字学及相关专业领域专家学者的科研平台,为专家学者提供对数据资源进行深度挖掘的工具,弥补传统手工获取资源、联系资源方式的局限;可作为汉字类数字化产品的开发平台,为开发者提供海量的经过专业学术加工的可靠汉字属性资源。”王立军指出。
(本报记者 周世祥 靳晓燕)



×