人類文明史上,共有四大象形文字,其中的三種,即埃及的圣書字,蘇美爾人的楔形字(又稱丁頭字)以及瑪雅文,早已成為歷史的陳跡;唯有中國的漢字久盛不衰,得以獨存。也許,漢字是人類文化史上迄今僅存的最具藝術價值的圖形文字。雖然漢字幾經(jīng)變革,許多字早已失卻了造字時的“理據(jù)”,但至今仍有許多漢字繪形繪色,仍然可從字的結構中體味祖先造字之用心良苦,有時一個漢字就是一個故事。比如“笑”,可謂是造字史上的一個杰作:無論你怎么看,都可清楚地看到“笑”得又甜又美的樣子;再如“休”,那便是一個人靠在樹上不干活的寫意。
如果說漢字在數(shù)千年的文明進程中,在多數(shù)文字都走入“拼音”這一軌道之后,卻居然可以“從一而終”,以其“中國特色”執(zhí)迷于“象形拼形”而不悟,算得上人類文明史上的一大奇跡的話,那么,在電腦信息時代,這種古老的、被國內(nèi)外一些專家學者稱之為“極端落后”、責之曰“誤民誤國”的方塊漢字,在世人的聲討中,在國人的焦慮中,僅僅經(jīng)過十幾個春秋,又居然逃脫了“死刑”而活了下來,又居然枯木逢春,傲傲然矗立于世界文字之林,悠悠哉通行于信息社會,這應該稱得上是一個更偉大的奇跡了!
一代人為拯救漢字而上下求索,為漢字輸入電腦而嘔心瀝血。這是中華民族文明史上光彩奪目的一頁,是中華民族偉大復興之宏偉樂章中的一個強勁旋律。
如今,在漢字電腦化這一問題上,我們的“主旋律”既不是“漢字能否進入電腦”,也不是進入電腦的效率“能否與西文同日而語”了。我們的興奮點是:在未能把漢字輸入大規(guī)模地納入中小學教育之前,如何讓青年人、中年人,甚至老年人,盡快完成漢字輸入的“補課”教育。
因為我們沒有像美國人那樣,從兒童時代起就會打鍵,把電腦玩得滾瓜爛熟;
因為我們未曾像學習漢語拼音那樣,在小學里花過一兩年功夫;
因為我們忙于工作、忙于旅游、忙于打麻將和唱卡拉OK,很難擠出兩三天時間;
又因為我們的漢字,不是由少數(shù)幾個字母拼寫而成的,跟洋人的鍵盤很難配套;
所以,我們常常一邊抱怨著祖先缺乏先見之明,一邊把手放到鍵盤上發(fā)呆:一個字一個鍵該多好!搞什么拆分編碼?誰知道一個漢字要拆成幾塊,要編哪幾個碼?甚至于將“橫豎撇捺折”用12345來代表,一些人也難以對號入座!
鍵盤不能將就漢字,漢字只能屈從于鍵盤。為了向電腦輸入漢字,拆分漢字,確定編碼,成了一個不可避免的、社會性的老大難。
如何幫助成年人形象生動地,快速準確地認識編碼,熟悉鍵位;如何編寫教材,通過實例全面掌握輸入方案的碼元和編碼規(guī)則,就成了我們發(fā)明漢字輸入法之后的一項緊迫任務。舍此,輸入法便不可能獲得社會化應用。
為此,作者發(fā)明了“無拆分編碼法”這一專利技術。這本字典就是全面實現(xiàn)這一專利技術的第一次嘗試和第一個樣本。
不難考證,對于使用漢字的人來講,不管是外國人或是中國人,在書寫、使用及編碼的過程中,實際上是把漢字作為一幅幅圖畫對待的。而漢字構成的“理據(jù)”,漢字造字的故事,除少數(shù)文字學家之外,絕大多數(shù)人并不了解,也可能不感興趣。用他們的話說,“只要能輸入正確,快速又易學,就行”。
固然知道漢字的故事有助于認知漢字,這是漢字文化的傳統(tǒng),但要求一個中小學生熟知幾千個小故事,才能學會漢字輸入,恐怕不是一件容易的事。因為“事實是,在漢字這個大字符集中,有的字有理據(jù),有的字沒有理據(jù),有的字有部分理據(jù),有的字本來有理據(jù),在發(fā)展的過程中失去了理據(jù)”(見《現(xiàn)代漢字學綱要》第81頁,北京大學蘇培成教授著)。
依據(jù)編碼學和圖形學的原理,我們把漢字結構中那些經(jīng)常出現(xiàn)的筆畫,及其組合特征,如“王、土、大、木、工”以及“、、、、”等,叫做“碼元”,意為用于編碼的筆畫結構特征即結構單元,簡稱“碼元”。而且,我們把特征一致,或形態(tài)相近的筆畫結構,如“、、”,統(tǒng)稱為同一種碼元,“、、”就是另一種碼元等。
一個漢字圖形中,常常有若干個碼元,形成一個系列。在王碼(五筆字型)中,每一個碼元,都被安排在一個固定的鍵位上,這個鍵位有字母,有區(qū)位號,區(qū)位號和字母就成了碼元的編碼,也就是輸入碼。編碼時,碼元的順序與漢字規(guī)范的書寫順序基本上是一致的。
這樣,我們輸入一個漢字時,只須按取碼規(guī)則,把碼元所在的鍵按一下,或輸入碼元的區(qū)位碼即可。
從漢字結構中辨認、識別出碼元,并將碼元所在的鍵按一下(或輸入碼元的區(qū)位碼),是不必把漢字拆分開來的,根本沒有必要把漢字拆成一塊又一塊。這樣,就不存在拆得合理不合理的問題了。
我們不妨把一個漢字比作一幢樓房:有窗戶、門、陽臺。這些門、窗戶、陽臺,就相當于“碼元”(以前也叫“字根”或“部件”,但作者認為,碼元這一名稱更確切)。
我們給碼元編碼,就好像登記一下樓房的門窗、陽臺一樣,何需將樓房“拆散”?我們?yōu)闈h字編碼,自然也無需將漢字“拆散”!這就是作者在研究98王碼的過程中,創(chuàng)造的“無拆分編碼法”。
“無拆分編碼”源于作者對漢字圖像視覺認知規(guī)律的深入研究,以及對數(shù)以千計的五筆字型操作員打字心理過程的調查分析。統(tǒng)計表明,幾乎沒有一個熟練的打字員錄入時把漢字“拆開”,他們的思維過程“僅僅是把漢字當作一個整體,看到某個筆畫特征,立即按一下對應的鍵”。
“無拆分編碼法”的應用,將極大地展現(xiàn)漢字作為平面圖形文字在認知教學中的視覺優(yōu)勢,不但使一般人認為“難拆難分,難學難記”的形碼在學習時形象生動,直觀快捷,而且徹底克服了“漢字拆分”與“文字規(guī)范”的尖銳矛盾。對于消除長期以來不同學科之間各執(zhí)一詞的相互非難和誤解,對于融多學科之長用于編碼設計和教學,具有深刻的理論意義和巨大的現(xiàn)實意義。
由氣象出版社首次出版的這本字典,就是基于上述“無拆分”原理設計的。每欄空心字中被描黑的部分,是漢字結構中被取碼的碼元。用這一表現(xiàn)方法,誰都可以一眼看出,每個字是由哪些碼元構成的,該取哪些特征參加編碼,連同碼元的“周邊”關系,真可謂是顯而易見,直觀易辨,經(jīng)久不忘。
字典中同時還列出了該字的區(qū)位碼編碼、鍵位字母編碼、五筆畫編碼及簡碼標志等信息資料。在注釋一欄中,又逐字注明了字型代號、末筆代碼、取碼規(guī)則以及注意事項,相信這些資料對初學者是十分有用的。 使用本字典,反復練習,即可在完整的漢字圖形中,形成“整字不拆,碼元定位”的概念和“眼見手到,按鍵自如”的打字習慣。
98版五筆字型,是作者于1986年推出五筆字型的第一代定型版本(86版,又稱4.5版)之后,又經(jīng)十年研究完成的五筆字型第二代定型版本。本冊字典就是依據(jù)這一新版本編寫的。
憑20年從事編碼研究、鍵盤設計和教學培訓的經(jīng)驗體會,作者相信,本字典的出版發(fā)行,可望為王碼(五筆字型)的普及進而納入中小學教育開辟一條新路。
作者對氣象出版社王碼教材編輯室陳云峰主任等,在本書的策劃、設計及制作過程中,所付出的心血勞動表示衷心感謝;作者歡迎學術界及用戶朋友,對本書提出意見和建議,以便改進。
一九九八年九月九日 於北京
本文為系1998年9月為《98王碼無拆分編碼字典》所作的序言