登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

国学

木秀于林,凤必垂之------做中国最专注的学生国学 创造一个学习国学的完空间

 
 
 

日志

 
 

董 芳 罗 刚 水书水字类属码的研究  

2008-12-21 14:22:18|  分类: 周易 |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |

文章来源: 神秘水书 - 神秘水书

水书水字类属码的研究
发表日期:2008-11-26        来源:三都水族网       作者:董 芳 罗 刚      
 
 

 

水书水字类属码的研究

董 芳   罗  刚

(黔南民族师范学院  贵州  都匀  558000)

 

摘要:在我国贵州南部至今还使用一种古老的民族宗教典籍“水书”。水书水字的字形复杂,按照汉字编码理论提取的部件或码元很难与水字字形对应。水字的发音较难,采用音码理论实现水字的有序性也较困难。本文提出了水字类属码的编码模式。按照水字内容给予归类,由四位编码组成,第一码位为水字的类别码,区分正体水字和异体水字。第二码位为水字的属性码,根据水字内容进行编码。第三四位编码为水字在各属性中的摆放顺序位置。概述了实现水字可视化输入法的思路。

关键词: 水书,水字,类属码;

中图分类号:H269.2;TP3                        文献标识码 A

 

1 引言

在我国贵州省南部的三都水族自治县、荔波县等水族聚居地区,至今还使用流传着一种古老的民族宗教典籍“水书”,见图1。在水族人的社会生活中,水书至今还起着很重要的作用,特别是丧葬、营建、出行、过节、占卜、农事等活动中发挥着指导规范的作用。水书水字中蕴藏着的语言、文字、天象、历法、宗教等方面的丰富资料,具有重要的学术价值[1]。水书在2006年入选为国家第一批非物质文化遗产名录。水书中所用的符号大致有1200多个,其中异体字很多,将异体字除外大致有500余个。长期以来,国内外许多专家学者对水书进行了深入的研究,在研究过程中需要对大量的水书文献进行信息化处理,水书文字的编码已成为人们关注的问题。本文对水书水字的特点进行了分析,提出了水字类属编码的模式。


 

 

 

2 水字的构形规律

水字即水书中所用的符号,按形体及音义对应关系,可分为图象符号和文字符号两类。水字图象符号所代表的含义大致可以理解,但读音不够明确,主要有象形水字与图画水字;水字文字符号则形、音、义俱全,其构形主要有指事、会意、假借以及汉字的反写等几类。

21 水字图象符号

象形水字,占比重较大,约占水字单字总数的30 以上,这类字抓住实物的特征,用简单的线条来表示[2]。例如:(1)以动物形体特征造字;(2)以植物形体造字;(3)用物质现象造字;(4)模仿用具造字;(5)有的描摩人体器官造字,见图2

图画水字则是水族原始宗教的各种密码符号等,见图3

 


22 水字文字符号

指事字,多为表示方位的字,也有指明某一现象的,约占水字单字的20%。会意字,以两个以上符号或单字合在一起造字,约占水字单字的30% 。假借字,借用已有的字来表示某个同音字。汉字的反写,在水字构成中,有相当数量的汉借字是汉字的反写、倒写、侧写等,所以当地人习惯把水书又叫做“反书”,这些“反书”都用水语认读。水书中的多数干支和数目字是汉字的反写,见图4。

水书是一种比较原始的文字系统,水书文字因为都是手写,显得随意,古拙,与甲骨文字形特征有相似之处[3 ]。水字大都具有图画性,即使是一些指事字、会意字也是以象形字为基础。水族文字的发展因受到各种条件的限制,均系手写抄录而没有统一的刻版,因此字形的异体字相当多,个别水字的异体字达20~30来个。

 

3 汉字编码与水字

3.1 汉字编码方式与水字编码要求

目前汉字编码方式可分为形码、音码和音形码三类。形码是按照字形构造特征进行的编码,大致有笔形码,以李金铠的笔形码为代表;字根码,以五笔字形为代表等。形码的思路是将一个字拆分成各个部位,然后根据部位的字形特点进行编码。笔者在前期的研究中,也按照汉字形码的模式,对水书文字进行了编码,提出了水书文字拆分原则和部件形态特征近似归类,并按其归类特征与键盘符号近似实现映射[4]。对于字形复杂的图画水字来说,用汉字形码的模式进行水字编码有很多不足,首先是水字字形复杂,大多不甚规则,在此基础上提取的部件很难与实际的水字字形准确对应,并且很多水字没有明确的分界,无法进行拆分。汉字音码是按照汉字的读音特征进行的编码。由于水字的音节较多,并且发音较难,使用音码来实现水字的有序性也比较困难。音形码是字形和字音的混合编码,其基础必须有字的读音和规则的字形,这对水字也不合适。


3.2 水字“象形”编码模式

由于水字与甲骨文字形相似,参照甲骨文“象形”编码,笔者也试图从水字的“象形” 模式入手构建水字编码。水字“象形”码固然能体现水字图画符号的特点,但由于水字字形复杂,大多不甚规则,在此基础上提取的码元很难与实际的水字字形准确对应。其次是码元较多,记忆很困难,在键盘上执行操作也困难,实用性不足。

2.3 水字“部首”编码模式

传统研究汉字结构的模式是把汉字分解成三级:字符/部首/笔画,以此排列汉字的生成序列。笔者也曾以部首模式进行水字文字符号编码,但这种模式只能解决水字中部分合体结构的字。更确切说,只解决部首具有一定规模的字,而对独体字和少量不具部首规模的合体字,则不好归属,尤其是形体复杂的水字。

4 水字类属编码模式

从上面的分析,可以看出传统的汉字编码模式不适用于水字编码,水字编码要有自己的编码模式。笔者本着科学、实用、易学的原则[8],提出水字类属编码模式,下面就其编码模式进行介绍。

4.1 水字类属码

水字类属码按照水字内容给予归类,由四位编码组成,第一码位为水字的类别码,其类码内容为:0 正体水字码,是指遵从某种选字规范和标准,确立了官方地位的水字;1 异体水字码,标明该水字为异体水字;第二码位为水字的属性码,根据水字内容的属性进行归类编码,具体为:0 星宿鬼神属性码,1 天地属性码, 2 禽兽属性码,3 鱼虫植物属性码, 4 房屋器具食物属性码,5 人体人事属性码 6 季节时辰属性码,7 方位形状属性码,8 数名属性码,9 行为属性码,见表1。第三四位编码为十六进制顺序码,指明水字在各属性中的摆放顺序位置。异体字除第一码位为1外,其他码位内容都相同。

 


 

例: 汉字译意为马,正体字,禽兽属性,排列为04,类属码为0204

汉字译意为上,正体字,方位形状属性,排列为24,十六进制为19H,类属码为0719

42 水字类属码的特点

         水字类码可以标明正体水字和异体水字,这对异体字较多的水字来说,特别适合。

     目前,经过校勘和甄别的正体水字有500余字;异体水字有700余字。水字类属码后两位十六进制顺序码可容纳256字;加上10位属性码,可容纳2560字;再加上2位类码,可容纳5120字,对只有1200余字的水字来说,完全足够。每位属性码的水字统计数见上表。

     水字类属码在水字录入时,不用对水字进行折分,特别适用于可视化录入。2种类码和10种属性码,记忆量很小,只要了解水字的含义就能很方便地进行查找寻入,当然水字可视化输入是不可少的。

43 水字可视化输入法的实现

水字可视化输人法有别于一般意义上的输人法,它是通过鼠标点击输人水字,而不是编码输入,既形象又不需要记忆。水字可视化输入包括两部分:字库、水字类属码转换码表和输入程序。

字库采用的是黔南民族师范学院自主版权的水书字库,该字库所有水字都是依据水书中较常见字形,经过水书研究人员临摹并加校勘、释文收录正体水字471个.异体水字613个,按照Unicode编码存放于EUDC用户自定义区。

水字类属码转换码表中一个水字对应一条记录,一条记录中有5个字段,各字段间用分号分开。第一字段为水字Unicode编码,指水字存放在用户自定义区Unicode编码的值,也是机内码,用十六进制表示;第二字段为水字汉译名称;第三字段为水字类码;第四字段为水字属性码;第五字段为顺序码。例: 汉字译意为马,类属码为0204,其存放码位值为E020H。在水字类属码转换码表中对应记录应为:E020;马;0204

输入程序读入水字类属码转换码表后,在窗口中显示正体字的全体属性码,鼠标点击某个属性码后,窗口显示选中属性码对应的全部水字及汉译名称,双击某个水字即可在字处理软件(如Word等)输入该水字。

5 结论

本文对水书水字的特点进行了分析,认为传统的汉字编码模式不适用于水字编码,水字编码要有自己的编码模式,提出了水字类属码的编码模式,概述了实现水字可视化输入法的思路,希望得到专家与同行的指正。

 

参考文献

[1] 曾晓渝,孙 易. 水族文字新探[J].民族语文, 2004年第 4 期:13页—18页.

[2] 蒙景村. “水书”及其造字方法研究[J].黔南民族师范学院学报, 2005年第 1 期: 23页—26页.

[3] 邓章应. 水书造字机制探索[J].黔南民族师范学院学报, 2005年第 2 期: 68页—73页.

[4] 董 芳.“水书”文字编码方法研究[J].黔南民族师范学院学报, 2006年第6期: 1页—4页.

[5] 韦宗林. 水族古文字计算机输入法[J].贵州民族学院学报(哲学社会科学版), 2000年第4期: 13页—19页.

[6] 谢谦,芮建武等. 编码字符集标准及分类研究[J].中文信息学报, 2006年第20卷第4期: 83页—89页.

[7] 肖明,赵慧等. 甲骨文象形码编码方法研究[J]. 中文信息学报, 2002年第15卷第5期: 60页—65页.

[8] 孙基寿. 汉字输入编码优劣评测方法的探讨[J]. 中文信息学报, 2006年第20卷第5期:97页—104页.

 

Research on the classified-attributive code of the Sui script

DONG  Fang   Luo  Gang

( Qiannan Normal College for Nationalities, Duyun 558000, China )

Abstract  So far an ancient ethnic and religious scripture “ShuiShu” has also used in the south of Guizhou province in our country. Since the font style of the Sui script is complex, it is difficult to correspond to the fonts style of the Sui script for components and the code dollar in the Chinese character coding theory. It is more difficult to pronounce the words of the Sui script characters, and It is also more difficult to actualize its order by adopting the voice code theory. This article puts forward the coded mode of the class attribute code of the Sui script and also categorizes according to its content. The mode is made up of  four codes. The first code is classified code, which is to differentiate between the upright sui character and sui xenogenous character. The second is attributive code, which is to code the content of the sui script.The third and fourth are to put ordinal positions of the Sui script in every attribute.

Key words  the characters of Shui minority, the sui script, the classified-attributive code

 

 

 

 

 

附:水书正体水字Unicode编码表

作者:董 芳,男,1957年生,教授,专业方向:网络与数据库、民族文字编码研究

联系地址:贵州省都匀市黔南民族师范学院,邮编:558000

联系电话:13885408538       Email: FDong_gz@Tom.com

科研项目:全国社科规划课题:水族水书语音语料库系统研究;编号:07XMZ004

 


 

 
 
  评论这张
 
阅读(247)| 评论(0)

历史上的今天

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2018