仓颉输入法

基本含义播报编辑

基本含义

仓颉输入法是一种常用的繁体中文输入法,由朱邦复于1976年创制 [8],原名“形意检字法” [11],1978年由蒋纬国命名为“仓颉输入法” [8]。它是一种基于汉字结构的输入法系统,核心思想是通过分解汉字为基本部件(字根)来实现输入 [12]。

发展历程播报编辑

发展历程

1976年,为了打破英文科技垄断计算机世界的单一文化格局,科学家朱邦复发明仓颉码(仓颉输入法),并向世界公开其专利成果,成功发明第一代汉卡,电脑开始识别中文,实现了中文数字化基建的第一步 [9]。朱邦复发明此输入法时正值他为台湾三军大学发展中文通讯系统之际 [11]。1978年,蒋纬国将军为纪念上古时期仓颉造字之精神,将此输入法重新定名为“仓颉输入法” [8]。

1980年,朱邦复与宏碁公司共同发表世上首部具有中文操作系统、中文程序语言、中文套装软件的中文电脑——天龙中文电脑。1982年,朱邦复登报公开放弃仓颉输入法专利权,并且极力推动电脑之中文化,使电脑汉化得到很大的进展 [8]。

仓颉输入法自推出以来,经历了多次版本更新 [12]。最新的版本是第五代 [8]。

2023年8月21日,基于仓颉输入法原理的“飞龙芯”AI技术落地,由仿脑科技、科大讯飞等研发。这是全球首个汉字基因仿人脑技术,以中文算法作底层技术,实现了脱机输入输出的人机语言理解芯片,标志着朱邦复团队自主研发的汉字基因仿真大脑进入产业化阶段 [7]。

基本特征播报编辑

基本特征

仓颉输入法的取码依据视觉辨识原理,能反映汉字的细微特征。其取码具有字首及字身的概念 [8]。

该输入法基于朱邦复的“汉字基因”理论设计,旨在用仓颉码统一处理汉字的形、音、义、码、序、辨等六大问题。其原始目的之一是汉字检索与排序。因此,它具有重码率极低、支持字库大而全的显著优势,几乎可以输入所有系统可见的汉字 [1] [8]。是繁体中文世界最普及的形码输入法之一 [8] [11]。

仓颉字码播报编辑

仓颉字码

仓颉输入法分为五大类,共24个仓颉字母,括号文字为相对键及读音:

五行类:日(A)、月(B)、金(C)、木(D)、水(E)、火(F)、土(G)

笔划类:竹(H,音斜)、戈(I,音点)、十(J,音交)、大(K,音叉)、中(L,音纵)、一(M,音横)、弓(N,音勾)

人体类:人(O)、心(P)、手(Q)、口(R)

字型类:尸(S,音侧)、廿(T,音并)、山(U,音仰)、女(V,音纽)、田(W,音方)、卜(Y)

复合类:无论在任何情况下,最多取首尾两码,包括:鬼(HI)、虍(YP)、斗(LN)、目(BU)、门(AN)、阝(NL)、几(VI,不包括左下角的人)、隹(OG)、吂(YR)

特殊类:难(X),用于特定的笔划,包括:臼(HX),卍(NX)等约十一种笔划;重(Z)(在第三代中不再使用,被一些自制仓颉当作特殊键)

首24个仓颉字母还可再变化、衍生出「辅助字形」来辨别所有的中文字。例如:「叉」字拆解为「又+丶」,对应字母为 E+I,其中这个「又」就是「水」这个仓颉字母的辅助字形。取码原则 中文字根据「由上而下,由左而右,由外而内」等原则分拆成字型结构,再以字码拼出。键盘上A至Y键各代表一字码(X键用于特殊字,Z键通常不用),例如A是「日」、N是「弓」。字码分表代表不同的中文字字型结构。取码分字首及字身,一个中文字最少用一码输入,最长则为五码。更有一口诀:

独体字:即不能成几部分的,取码:头、二、三、尾。業-廿金廿木-TCTD

合体字:又可分为:

可分成两部分的:头、尾、头、二、尾,例如:瑜-一土人一弓-MGOMN

可分成三部分的:头、尾、头、尾,尾(如字身一只一个码时,则字身二可取头尾两码),例如:髓-月月卜大月-BBYKB

“理”字 —— (分拆) → 一+土+田+土 -(对应字母) → M+G+W+G

“哈”字 —— (分拆) → 口+人+一+口 -(对应字母) → R+O+M+R

参考资料: [2]

应用播报编辑

应用

仓颉输入法适用于多种平台,主流操作系统和大部分电子辞典均有内嵌 [11]。在Mac上设置繁体仓颉输入法后,可以输入繁体中文字;输入仓颉输入码后按下空格键插入字符,使用Z键代替未知键,并可输入英文单词 [10]。

影响播报编辑

影响

仓颉输入法是繁体中文世界中较为普及的形码输入法之一,在台湾及海外繁体中文社区被广泛使用 [8] [11]。仓颉输入法的重码率较低,在一般系统中支持的字库较为全面,因此也成为部分汉字文化工作者选用的输入法之一 [8]。

朱邦复于1982年公开放弃仓颉输入法专利权,并且推动电脑之中文化,其发明被视为中文数字化基建的第一步 [8-9] [11]。朱邦复根据其“汉字基因”理论,建立了一套“仓颉系统” [8]。其基于“汉字基因”理论建立的仓颉系统,为后续中文人工智能(如“飞龙芯”芯片)的语义理解技术奠定了基础 [7]。

仓颉输入法提高了汉字输入的效率,推动了办公自动化和信息化的发展。仓颉输入法在编辑、出版和办公自动化等专业领域中得到了应用。仓颉输入法在海外华人及汉语学习者中也具有一定影响力 [12]。

相关研究播报编辑

相关研究

朱邦复根据其“汉字基因”理论,建立了一套“仓颉系统”,旨在用仓颉码统一处理汉字的形、音、义、码、序、辨等六大问题 [8],并在此基础上研究中文AI语义理解 [9]。2023年,由仿脑科技与科大讯飞等机构合作,基于仓颉输入法的汉字原理,研发了全球首个汉字基因仿人脑技术“飞龙芯”AI芯片,该芯片以中文算法为底层技术,实现了脱机输入输出的人机语言理解,标志着相关技术进入产业化阶段 [7]。

口诀播报编辑

口诀

仓颉字根口诀

G 土旁土与士

F 火小三四滴

D 木寸少心力

S 屍首左右柜,右侧梯,左弯钩

A 日曰日横立


H 竹头撇斤首

J 十宝玉不留

K 大病右爻头

L 中竖衣(衤)聿首【聿(yù)】

M 一提工厂石无口


T 廿草昔首头,业无眼,关下头

E 水滂雨点又

W 田囗毋空腹【 囗wéi】

Q 手旁半少头,夫失足,年无头


Y 卜卞斗首走(辶)

U 山上框渔叉

I 戈点广县底

O 人入捺,矢无大,左倒八

P 心勹七匕弋失喉【勹(bāo)、弋(yì)】


N 弓乙左竖勾,斜月飞头

B 月且然半下框爵

V 女折衣底右弯勾

C 金儿八米头

仓颉字码键位口诀

ABCDEFG 日月金木水火土

日月金木水火土

HIJKLMN斜 点交叉纵横 钩

(竹) (戈) (十) (大) (中) (一) (弓)

OPQR人心手口

STUVWXY 侧并仰纽方 难 卜

(尸) (廿) (山) (女) (田) (曰) (卜)

参照“仓颉字根口诀”,按照键盘26个英文字母,从左至右、从上至下的键位规律,总结出五言30字口诀。

手方水口并——【手田水口廿】——(QWERT)

卜仰点人心——【卜山戈人心】——(YUIOP)

日则木火土——【日尸木火土】——(ASDFG)

斜交叉纵横——【竹十大中一】——(HJKLM)

重难不常用——【重难不常用】——(ZX)

金纽月勾终——【金女月弓终】——(CVBN)

仓颉字码拆字

  1. 取码数:最多四码,不足四码者全取。

  2. 取码顺序:由上而下,由左而右。

  3. 取码次序:取首、次、三、尾码。

业 ——【廿金】

允 ——【戈竹山】

豆 ——【一口廿】

我 ——【竹手戈】

爱 ——【月月大水】

分体字的取码,分为【字首】及【字身】两部份。

由于分体字分为两部份,所以要注意两个取码的大原则:

  1. 字首──至少取一码,至多取两码。

取一码:份、沙

取两码:则、话

超过两码﹝头尾两码﹞:点、线

  1. 字身──至少取一码,至多取三码。

不超过三码﹝全取﹞:话、时

超过三码﹝分拆处理﹞:道、识

仓颉输入法24个基本字形第一、二代仓颉键位

其他语言