当年在组建囧夏字幕组之前,我对于繁体字的印象仅仅停留在当初学书法的时候需要使用。若干年没有练习后,对于繁体字的书写也忘得快一干二净了。在字幕组实际运行过程中,我才意识到,如果要做繁体版本字幕,并不是仅仅将简体的文本简单进行转换即可。由于字幕组的作品并非仅针对中国大陆,也提供给港澳台以及海外华人受众,为了确保质量,我们有专门的繁化人员进行字幕的繁化工作。组内管理层使用繁体中文的正好是香港的ann25112003大大,所以最初也由她担任了繁化工作。为什么繁化需要专门的人员呢?正好最近朋友跟我说起了简繁转换这个事情,我就来详细写一下。
在简体字和繁体字的关系中,很多人可能会认为它们之间只存在简单的“替换关系”:简体字可以一一转换为繁体字,反之亦然。实际上,简繁之间的关系远比我们想象的复杂。这不仅是一个技术性的问题,也是语言、文化和社会认同的问题。
汉字的简化历史
汉字的简化并不是20世纪的产物,它经历了千年的渐变和演变过程,历史上多次出现过不同形式的简化尝试。但现代汉字简化运动的真正成型,始于20世纪初的教育改革和政治变革,从此简体字的推广进入了新的阶段。
古代中国并没有“简体字”这一概念,字形的变化和演化更多是由书法、印刷术以及区域语言的差异所推动。古代的汉字最早出现时,以甲骨文为代表,那个时期的汉字形态较为简洁和形象。随着历史的发展,汉字逐渐复杂化。到了秦汉时期,隶书的出现使得汉字的形态发生了巨大的变化,但隶书的“简化”是为了书写便捷,并没有从根本上简化笔画结构。
再后来,楷书的普及使得汉字的书写形式再次趋于规范,但字形的结构依然没有出现简化的趋势。直到唐代,随着书法艺术的兴起,字形的多样性达到了顶峰,很多“书写简便”成为书法家追求的目标,如草书中出现了狂草。尽管这类简化不具备制度化性质,但它的存在为后来的汉字简化奠定了基础。
进入近现代,随着西方列强的侵略和中国社会的剧变,知识分子的启蒙思想日益盛行,推动了汉字改革的尝试。特别是在清朝末期和民国初期,一些文化改革者开始思考如何通过简化汉字来提高国民的识字率、促进教育普及。
根据《中国文化常识(修订本)》第161页记载:
进入20世纪,简化汉字工作受到了学者和政府的重视。1909年,清末教育家陆费逵(Lùbì Kuí)首先揭开了简化字运动的序幕。1922年,国学大师钱玄同等人提出的《减省现行汉字的笔画案》,把简体字提到了前所未有的高度。1935年,南京国民政府公布了《第一批简体字表》,虽然半年之后就被暂缓推行,但毕竟是政府公布的法定字表,意义是十分重大的。新中国成立以后,为了普及教育,新中国政府统一对汉字进行了较大规模的简化,并于 1956年公布了《汉字简化方案》。这个方案通过单字简化和偏旁类推等方法使两千多个繁体字得到了简化。1986年,国家语言文字工作委员会又发布了《简化字总表》,其中表一收了352个不作偏旁的简化字,表二收了132个可作偏旁的简化字和14个简化偏旁,表三收了1,753个利用表二类推出来的简化字。
根据《世界漢字學會第七屆年會論文集》第638页记载:
一直到五四時期(1919),為了掃除文盲并普及教育,簡化文字的運動日益高漲,成為一種社會思潮。首先提出採用簡體字的方案是教育家陆費逵(1909年:提倡使用俗體字;1921年:提出整理漢字的辦法),他限定通俗字字數,減少筆畫,第一部採用己有社會基礎的簡體字,第二部把其他筆畫多的字也加以簡化。
其中汉字简化具体方式主要有:
1.用简单的符号代替复杂的偏旁。如:难—難、学—學 。
2.保留繁体字的一部分。如:开—開、医—醫。
3.在不引起混淆的前提下,用笔画简单的同音字代替。如:后—後、丑—醜。
4.借用笔画简单的古字。如:云—雲、从—從。
5.草书楷化。如:书—書、为—為。
6.改换形声字的声旁或形旁。如:拥-擁、护-護。
7.用传统造字法造新字。如:形声字“响-響”;会意字“尘-塵”。
8.保留原字轮廓。比如:伞—傘、肃—肅。
简单点来说:1935年,国民政府公布了第一批简体字表,但因保守派反对而暂缓推行。新中国成立后,1956年,中国文字改革委员会制定并公布了《汉字简化方案》。1986年,由于“一音多字”问题,第二次汉字简化方案被废止。
目前通用的简化方案,我们可以通过《简化字总表(1986年版)扫描版》(Internet Archive副本)进行查看。
字形丢失与文字的“贫化”
简体字的简化过程中,值得反思的是,有许多原本在繁体字中具有丰富形态信息的字形被削减。不仅失去了一些笔画,还丧失了许多字形所承载的“文化内涵”。简体字的简化使得字形中的表意成分变得模糊,甚至有的不可识别。例如「書畫」在字形上本为关联的两个字,非常形象地描绘了两者的样子,可惜在「书画」中则丢失了原本的含义。
更为复杂的是,简体字和繁体字的转换不仅仅是字形上的替换问题,许多简体字根本无法一一对应到某些繁体字的形态。例如:
「醜」和「丑」这两个字在古代是同时存在的,「丑」用于地支计时以及戏剧角色如「丑角」和「丑旦」。而「醜」则是代表厌恶的、可耻的含义。然而在简体中文中却被合并。
「後」和「后」这两个字在繁体中也是同时存在的,其中就更为复杂了,因为「後宮」和「后宫」也同时存在,且含义不同。「後宮」特指妃嫔居住的宫殿(此时多指代前后关系),「后宫」特指皇帝或者天子居住的宫殿(某种地位的象征)。也就是说「皇后」「太后」「皇天后土」这些都是「后」,代表某种地位象征。一旦表示前后关系,则用「後」。
「製」和「制」也是同时存在的,且含义完全不同。「制」这个字本意是表示剪裁、切断树木等,后来引申到了决断、控制、体制等含义。在表达制造的含义时,用「製」,从字形上就能看出在做衣服,如「製作」「監製」。除此之外,全部使用「制」,如「制度」、「制裁」、「制定」。
「干」「幹」和「乾」更为复杂,在简体中并没有只保留一个,而是保留了两个,且保留的两个中间还发生了含义的转移。在简体中,「乾」在「乾姓」和「乾坤」等表述中保留了下来,但是其本意的干燥含义则被取消,被并入了「干」。「幹」本意是工作、做事情的意思,在简体中也被合并到了「干」。而「干」在繁体中本意是兵器的意思,也引申为捍卫,「天干地支」的干也是这个。
「頭髮」与「發貨」共用一个「发」但是两者含义巨大,而且繁体从字形上就能看出含义;「古人云」和「白雲」从字形上也能看出含义区别,简体却共用一个「云」;「衚衕」(胡同)和「鬍鬚」(胡须)在简体公用一个「胡」,繁体字同样从字形上也能理解其中原本字的意思。
具体案例太多太多,很难一一列举清楚,有大量的字存在类似问题。繁体的优势是,很多同音字通过偏旁和字形可以去区分出不同的含义,而在简体字中很多被合并为同一个字,字形的简化、丢失与合并也导致无法用这种方式区分字的含义。同时也造成了简体与繁体之间是一对多的关系,甚至还存在含义的交换。
自动化工具的局限性与误用
如今,许多人试图借助各种自动化工具来实现简体字向繁体字的转换,特别是在网站内容转换和文档处理上。然而,这种工具的使用一般并不准确。不少人想当然的从《简化字总表》中整理了简体字向繁体字转化的一一对应关系,试图用一键替换的方式来解决。然而,根据前文所述,简繁之间并非如此简单的对应关系,因此自动转换的结果,必然会出现大量的不一致、误转甚至语义混乱。
可能有的人本意是好的,“自以为”这样会对繁体字阅读者来说更加“友好”,实际上错误的转换更加会造成繁体字阅读者的不适,极端点的人会认为提供者的行为展现出了“文盲”的形象。特别是在台湾、香港等地区,简体字不仅仅是一种“外来”的书写方式,更代表了一种政治和历史的分歧,这种粗暴的操作,甚至容易引发文化上的不适与误解。所以简体字和繁体字的转换并非是简单的技术操作,而是直接影响到文字所承载的历史语境和文化氛围。
所以,如果想要学习繁体字,请不要尝试在阅读电子版书籍时,利用阅读器自带的“简单粗暴”的简繁转换功能,强制将简体字的书籍转换成繁体字。因为转换后的许多字词容易有误,对你的繁体字学习没有好处。如果想通过阅读书籍的方式学习繁体字,请直接阅读台湾或者香港出版的原版书籍。
不同地区现代用词的区分
实际上,简繁转换之间不仅仅是字的区别,还包括了不同地区同一个字或者词的发音不同和词语不同。发音问题不属于本文讨论的中心,所以接下来只谈论用词的差别。
例如「土豆」在台湾是指「花生」在大陆是指「马铃薯」;「出租车」在台湾叫「計程車」在香港叫「的士」;「摩托车」在台湾叫「機車」在香港叫「電單車」;还有更多的台湾特有的词汇如:「三溫暖」、「滑鼠」、「列印機」、「影印機」、「設定」、「螢幕」、「網路」、「記憶體」、「影片(这里指视频而不是电影)」、「訊息」、「檔案」、「智慧型手機」、「業配」、「外送」、「行動服務」、「一般」、「視窗」⋯⋯
特別是近些年的新出现的电子产品的相关术语翻译,差异极大。所以如果真的想要兼容不同地区的人的观感,不仅仅要处理简繁的问题,还需要处理词语的差异问题,非常麻烦。
不过幸运的是,现在有专门的繁化项目在不断收录大量的词库,来提供「繁体化」「台湾化」「香港化」等服务。
”「摩托车」在台湾叫「機車」在香港叫「電單車」“
欸,“電單車”怎么感觉翻译过来是“电单车”,指的是电动车,还是烧汽油的摩托车呢?
差异挺大的,我在广东那边完全看不懂很多地方性的表达。
的确挺反直觉的,我查了一下,维基百科的确也是这么讲的:
電單車(粵拼:din6 daan1 ce1),大陸嗰邊嗌摩托車(mo1 tok3 ce1);佢係指用電油(而唔係電力)推動引擎嘅單車,通常得兩個轆。
他们的汽油叫做電油……
维基百科介绍:電油,又叫汽油,係一種由石油提煉嘅燃料,經常用嚟畀汽車同電單車用。
的确繁体转简体简单,倒过来难度就提高了
现在生活中繁体字的使用越来越少了,我们这代人基本能做到无障碍阅读,下一代就难了。
我日常电子产品的系统都是繁体模式,输入法一般是简繁随便换,有的时候懒得切回去就用继续繁体聊天,以为大家都没什么阅读障碍。后来发现有的年轻一代有的时候简单的繁体字不认识,问我是什么字,我才意识到这个情况。
简化字固然方便书写,可也失去了文字本身的很多意义。
是这样的,关键是现在手写很少了,基本都是电子化,所以简化在书写方面的优势已经很小了。