| |
|
阅读网 -> 教育信息 -> 如果汉字失传了,释读它的难度有多大? -> 正文阅读 |
|
[教育信息]如果汉字失传了,释读它的难度有多大? |
[收藏本文] 【下载本文】 |
假设没有任何多语(包括繁体字)对照文献,只有汉字文献。 |
如果汉语消亡,汉字变得无人能解还没有多语对照材料……这种情况听起来很绝望,但破译并非完全无从入手...... 因为呢,中国古代有大量的图文对照材料,比如儿童开蒙用的看图识字读本。 近古时代最流行的“看图识字”,可能是宋元明再版了无数次的《对相四言》。“对相”,意思是每字或每词出一相,对刻于第二行。 《对相四言》现存两个版本:复刻自明初洪武年间金陵王氏的勤有书堂本的日本米山堂《魁本对相四言杂字》,以及现存美国哥伦比亚大学图书馆的明前期《新编对相四言》。目前一般认为,这两个本子其实都是直接翻刻的元代旧本(服饰图像具有鲜明的元朝而非明朝社会风格),可见其受欢迎程度。 如果存留的文献中有这种小画书,复原一些汉字的基础词汇是完全不成问题的。 日本复刻洪武《魁本对相四言杂字》的全书: |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
美国哥伦比亚图书馆藏明前期《新编对相四言》 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
找类似情况的例子看看 |
|
契丹大字,仿照汉字创制,有契丹文-汉文双语材料存在,而且其中有大量汉语、汉字借词。(上面图里能看懂的和看不懂的相互夹杂) 原语言失传。 目前发现一千多字,认出来的大约有四百多字,如果没有新材料发现,剩下的认出来的可能性,委婉地说,不大。 |
|
线形文字 A,发现于克里特岛上,怀疑是用于书写希腊语的某种方言,已破译的线形文字 B 被怀疑相关。猜测其是意音文字,有表意的部分和表音的部分。(汉字也是一种意音文字)没有双语材料。 原语言失传。 目前发现了一百多个符号,没有解读出来。 |
|
玛雅文字,中美洲部分地区古代使用的文字,有表音的部分和表意的部分。 原语言的后代语言还在。 表音部分基本已被解读出来,表意部分大部分也可以理解含义,对音是通常是按现在语言的,与古代的区别能不能研究就得看命了。 说回汉字, “没有任何多语对照文献”,应该是日本用的汉字也没有的情况吧,不然日本在用的汉字肯定有自己的释义,就相当于有其他语言对照了。 那我觉得 如果汉语也已经失传了,那难不难的问题已经不大了,应该就是识读不出来,反正都是是识读不出来,具体多难也就没啥意义了; 如果汉语还在,通过词中先后语素的关系,一部分汉字中的表音部分(形声字),应该还是能识读相当一部分汉字的,甚至跟做英语阅读理解一样,忽略部分不认识的内容,对一篇文字连蒙带猜看个大概还是可以的。难度上,应该比玛雅文字难,但估计比现在的契丹大字简单。 如果汉语失传了,但受汉语影响的某个子系统还在,比如日语中的汉语借词、东干语中的汉语音,夹杂在大量其他语言中,或者是只有汉语所在语系的其他语言存在的情况下,或者有现代汉语但文字材料是文言文甚至是上古文言文,,,,,,那就自求多福吧。 |
这玩意儿叫西夏文,你释读一下试试? |
|
|
中国文字博物馆于2016年推出悬赏,每破译一个甲骨文奖励10万元。 这还是中国文字传承未中断的情况下的解读难度,如果传承彻底断绝,只怕解读难度会上天。 |
就说“狱”字吧。 一个人要说话,就有两只狗来咬他,老祖宗真是腹黑啊。 |
开个脑洞,如果搞错了参照物也许考古学家会把汉字解读成风马牛不相及的另一个意思。 |
|
比如阙特勤碑,如果有考古学家像罗塞塔石碑那样参照上面的突厥文字内容来解读汉字,那画面简直太美。 |
|
如果外星人拿到汉字,基本上就是我们看这个的感觉。 如果有数万字,通过统计频次、惯用组合,应该能摸到一点语言规律,但要说了解文字内容嘛……你翻译一下贴图里这句话是啥意思? |
很难。 |
|
|
|
这是5000年前古印度河流域(今巴基斯坦境内)的摩亨佐-达罗的印章。 文字很明显的比汉字结构简单。 还多配有精致的图画。 现在都没能解读。 |
如果一种有十几亿人使用,以兆来计数的文字著作的文字都能失传,只能说明人类灭绝 |
举个例子 武则天,是中国历史上惟一的一位女皇帝。她从一个才人一步步爬上皇后宝座,直到最后建立大周朝。登上帝位之后,武皇一方面消灭异己,一方面却也励精图治。 在她统治时期,整个社会倒也安定,而关于武则天的传说民间有很多。武则天本人也从不是个甘于寂寞的人,即使死了,也要留下一块无字碑,千百年来引得人们纷纷猜测。 唐高宗李治和武则天的合葬墓乾陵位于西安市西北80公顷的乾县梁山上。墓前有两块高均为6.3米的石碑,西面的为“述圣碑”,碑文主要是歌颂唐高宗的功绩,由武则天撰文、唐中宗书写。该碑由7节组成,榫卯扣接,故又称为“七节碑”,碑宽1.86米,重81.6吨。东面是武则天的“无字碑”,碑由一块巨大的整石雕成,宽2.1米,重98.8吨。碑头雕有8条互相缠绕的螭首,饰以天云龙纹,碑座则用骏马饮水、雄狮、云纹等线刻画而成。如此精细的雕刻,在历代墓碑中都是极为罕见的。 人们纷纷猜测武则天立无字碑的原因,最主要的说法有三种。 一说武则天认为自己功高德大,不是文字所能表达的。在武则天看来,自己虽是女人,但高宗平庸,自己的才能绝对优于高宗,而且她统治期间政治清明,社会安定,人民安居乐业,这应该算是她的一大政绩。可惜的是,当时有很多人认为武皇是抢了大唐江山,是叛臣逆贼,对于她的功劳视而不见。因而,武则天要把自己的功劳让后人去评述、去记载,于是就有了无字碑。 二说武则天自知罪孽深重,立了碑文恐怕更招世人骂,还是不写为好。有的说法是,武则天建立大周朝之后,内心感觉愧疚不安,一心想在自己死后将江山归还唐氏。但由于自己称帝的这段经历,使她对自己死后的境遇没有信心,更害怕世人责骂其篡位之罪,因而留下无字碑借以自赎。 三说武则天想让后人去评说她的一生。这种说法与前一种说法恰恰相反。武则天对自己一生还是颇感自豪的。作为一个女流之辈,却能在政治斗争中脱颖而出,并到达了权力的巅峰。她要后人客观地评价她的文治武功,雄才大略,而与自己有利益冲突的儿子李显肯定不会对自己作出客观、公允的评价。鉴于此,武则天要将自己的一生的功过是非交与后人,就是要让后人对自己的一生作出评价。这三种说法似乎每一种都很有道理,至于哪一种说法是她的本意,现已无从考证。 值得一提的是,宋金以后,人们开始在无字碑上面添补题识,现在上面共有13段文字。令人惊异的是,这些文字中还有一种少数民族文字,而且长期以来一直没有人能识别。 经考证,金太宗的弟弟于1134年在无字碑上刻了《大金皇帝都统经略郎君行记》(简称《郎君行记》),且在旁边配有汉字译文。这种失传了的文字并不是金文,但究竟是什么文字呢?明代金石学家赵山函在《石墨镌华》中说:“(《郎君行记》)碑字不能辨,盖女真字……字刻乾陵无字碑上。”这种说法一直广为流传。 直到上个世纪20年代,考古工作人员在内蒙古巴林右旗附近发现辽代帝后的墓志,才将这一谜团解开。原来这些文字和墓志上的字相同,是早期的契丹文字。契丹文字始创于公元920年,但随着国家的灭亡很快消亡,到了元代已几乎没有人认识,到了明代则彻底成为一种无人能识的“死文字”了。这一失传的文字作为一份极为珍贵的文字史料被保留下来,却是武则天的无字碑的一大贡献 |
只要给出足够的时间和样本,连伪随机加密序列都可以解读出来,更别说语言文字这种编码重复利用率极高的非加密信息编码了。 而且,汉字文献数量又非常的庞大,完全可以提供足够多的可供采样比较分析的样本。 某些文明的古代文字之所以难以解读,「失传」只是解读过程中遇到的最不重要的障碍之一,最大的障碍是,这些文明根本就没留下多少可供采样比较的文献样本。 至于汉字为什么非常容易解读,你去随便找本汉语词典,看看部首检字表就明白了,这些具有相同部首的汉字,很容易就能让人想到,这些字具有某种共同的特征。 拼音语言里也有「词根」这种东西,但可识别性相比汉字部首差很多。 |
|
车部 基本上都是和「车」有关的概念 |
|
马部 基本上都是和「马」有关的概念 |
|
贝部 基本上都是和「钱」有关的概念 |
|
艹部 基本上都是些草本植物 |
下图是 秦灭六国统一后书写的“马”字。 |
|
试想一下,楚国的“马”会不会被当成一坨翔? 燕国的马会不会被当成抽打的陀螺? 韩国的马,看不出来是个啥玩意儿?(我不能说像粽子,不然的话,粽子真的变成韩国人发明的了!) 赵国的马,不说还以为是条鱼。 魏国的马,那不就是鱼吗? |
很多人连现存的字都不认识,更别提失传的汉字了吧! 比如下面这幅字↓↓↓ 逮住蛤蟆攥出尿来 |
|
…………更新:2023.04.24.23:48………… 话说你们究竟发了啥? 这几天我一堆人评论,能看到的就那么几个 ↓↓↓↓↓ |
|
|
很难解读,就算有对读资料,怎么说,几篇罗塞塔能覆盖五百个字吗?五百个字以外的呢? 昨天还在群里看见有朋友说一直不知道「哕」是说的yue这个词,不懂为什么老发「sui了」。这是经过十二年语文教育,阅读过几亿字文献资料的母语者,对口语里存在,但文字语料里不太常见的字推理能力就这样了。 如果失传状态的话,文献规模有几万字?其中不重复出现的汉字数累计能达到2000常用水平吗? |
基本无解。 比如东干文,按照发音就应该是陕西话。 可是你能用东干文来破解汉语? 不但做不到,而且根本没有参考性。 对于古代文字破解。 西方都是破解其发音特点,然后找到类似语系的民族,读给他们听,让他们用英语或者法语写出来含义。这个依然适用于八思巴蒙古文翻译, 但是对于党项,契丹,女直文字就完全不适用。 这些文字和汉字是相同类型。表意为主 你不懂他的含义,根本不知道他在表达什么。 好在党项文有佛经,有重修护国寺感应塔碑,还有一本在俄罗斯远东博物馆里宋人修德党项文词典。 但是契丹文就不好说了。契丹小字还好说,墓志铭出土越多,里面有契丹,汉文双词的。理解起来还好说,而契丹大字基本上全靠猜。 所以一旦,汉字失传,基本上没有再被破解可能。 |
世界上文字失传,释读难度最小的可能就是汉字了。 首先,汉字是有完整的演变历史的,只要研究完整的汉字发展进化史,后人就可以释读汉字。 第二,必须纠正你这个问题,除非人类消失,否则汉字绝不会失传。 中国的汉字传承数千年,历经一个演变过程:甲骨文、金文、小篆、隶书、草书、楷书、行书。 汉字发展到小篆阶段,逐渐开始定型(轮廓、笔划、结构定型),后续的隶书、草书、行书、楷书是书写方式的演变,不涉及汉字本身的改变。 文字这个东西总体上是创造而来,但不会凭空消失,都有一个传承发展的过程。汉字能作为世界上唯一一种能识别数千年前文字的文化承载工具,吾辈千万不可妄自菲薄。 汉字在上世纪有过众所周知的生存危机: 第一次大危机:民族存亡下的汉字拉丁化 |
|
拉丁化汉字教材 |
|
拉丁化教材封面 |
|
汉字拉丁化读物。 你读读看,读得懂不。 |
|
上述拉丁化读物的汉字短文 阴差阳错,汉字的拉丁化并没有击溃汉字,反而催生了汉语拼音,大大地促进了我国汉字的普及和国民识字率的提高。豪不夸张地说,全国推广普通话达到了秦始皇“书同文”未达到的另一个目标: “语同音”。最大程度地把中华民族凝聚在华夏大地上。 第二次大危机:信息时代的尴尬境地 上世纪七十年代,世界进入信息时代,计算机的大量普及,由于计算机是美国首先发明并推广的,只考虑了欧美西方的实际情况,国人使用计算机必须得用26个英文字母进行输入,这一次,汉字遇到了能否跟上世界科技发展潮流的生死存亡危机。 关键时刻,王永民挺身而出,首先研究出了“王码五笔输入法”,成功解决了汉字应对信息时代的输入问题,帮助汉字度过了第二次危机。 |
|
王码五笔输入法键盘。永远不要忘记发明人一一王永民 从甲骨文,到钟鼎文、大篆……直到繁体字、简体字。 从刻在骨头上、到刻在金属上、竹简上、纸上。 汉字一直随着文明的进步而进步,也随着世界风云的变幻而浮沉。 汉字永远不会失传。 汉字依然有如下三个优势: 1.“单字”信息量大。 2.象形字文字结构稳定,利于传承。 3.也是未来最重要的一点:对于新事物,汉字的接受能力更强,不需要重新创造新字(化学元素周期表例外)。 文明是进步的,文字也是进步的。 |
如果外星人能看见汉字版元素周期表,将会是最佳突破口。 金字旁、气字旁、水(汞)、三点水、石字旁对应的物理属性,可以判断汉字有表意功能。 如果能看见羟、羰、甾,会意识到汉字有象形字的特征。氢氧与羟对比,可以推测有表音功能,但可能没有意义。 然后就是对汉字的偏旁部首和独体字进行分析。如果能接触到小学一年级课本,结合对人类生活环境与人体的认知,可以认识山水、口鼻耳目等字。 口字旁是声音相关 木字旁是树木相关 水是液态,三点水也是液态(溴), 金字旁是金属 气字旁是气态 石字旁是非金属固体 |
如果能找到这种识字图表,应该可以作为突破口 |
|
例如这个,“雨”、“日”、“火”、“心”问题不大 “天”可能一开始会被解读为飞翔 “飞”可能会被当做鸟字 关于“妈”字是代表母马还是女人和马估计能水不少论文 “东”和“夏”估计会吵起来,搞不好会带偏东南西北、春夏秋冬的解释 |
|
要是找到这张图 希望他们不会把孔子、庄子他们当成兔子的一种 |
|
这张图一出土,恐怕对“子”字的解读又能水一堆论文 ——突然想到—— 结合“妈”和“子”,“好”该如何解读呢? “好人”会不会解读成“女孩子”? ————————— 这时“夏”的意思应该可惜搞清楚了,“妈”恐怕还有点争议,不过可能会成为“有边读边”的佐证 不过“东”的解读恐怕要打起来 不过从这张图可以看出,“开心”可能是某种残酷的刑罚…… |
|
这表一出,“夏”字和其它三个季节的意思基本确定了,更重要的是颜色的解读 |
|
等这个出来,“鸟”和“飞”可以水很多论文 |
|
要是能找到这种书,解读工作会轻松很多 |
偏个题:如果汉字彻底失传了,没有人能读懂它,但是留存下来了所有的汉字文本。那么把所有文本输入模型,我们可以获得一个基于汉字的gpt模型。 于是就会有这种局面:我们没有一个人懂汉字,却可以制造一个可以流利使用且仅能使用汉字进行交流的?母语者?。 |
首先,词典算不算存世的汉字文献?如果算的话,只需要破译几百个底层字/词的含义,就能完全破解汉语/汉字。还有,给小朋友学习认字的卡片算不算汉字文献,有了那个基本上那几百个底层字/词也不是什么难点。而且中国的美术是书画一体的,大量传世的中国画都会有书法题字,这些书画足以作为破译汉字的罗塞塔石碑。 其次,中国作为发明造纸和印刷的文明,是最早把文字复制进行工业化的国家。结果就是中文汉字文献的存世量极为巨大,恐怕超过了世界上其他所有的语言。这么大的样本量,找个深度学习的ai跑跑,并不是一件非常困难的事情。其他回答举得例子,比如线形文字a,契丹大字,玛雅文字,最重要的困难还是来自于文本存世量太少了。 第三,文言文的汉字几乎都是单独可以成词,也就是每个字符都是一个单独的表意单元。凭这一点,这破解难度就远低于很多字母文字。破解字母文字,工作对象是有限数目的字母,组成的数目巨大的字母组合,很多情况下,破解文字的难度来自与如何把字母组合起来,到底哪里是上一个单词的末尾,哪里是下一个单词的开头。而汉字破译就基本上跳过了这一步,每个汉字都是一个最小表意单元。 第四,汉字并不是纯表音的文字,绝大多数的形声字,都有一个表意的偏旁。如果汉语失传了,这些形声字可以大大减少破解的难度,比如某些具有特定偏旁的字,可以直接了解他的大概的词性,进而了解他所在句子的大概结构,同时也可以推测整句话大概的主题。当今存世的字母文字的单词里,虽然也有词根,但是词根并不是书写系统中所独有的,而是在语言(特指口语)中已经存在的内容,在大部分的常用词里,能够推断词义的词根非常少,最多就是一些表词性(比如英语中的-ly,-less,法语中的-tion,-ment等等)的词根。况且,因为字母文字的表音特性,很多具有词根的单词随着语流音变,或者长时间的隔离、演化导致语音本身发生变化,就会导致书写的文字会发生变化,导致曾经存在的词根在文字书写中不再显著(比如eleven当中的e,其实应该和one是相同的词根)。 最后,汉语的语法相对简单。汉字的写法是不会随着语法结构而变化的,同一个字无论到了什么地方都还是这同一个字。很多汉字的使用者是意识不到这一点是多么的方便,举个法语的例子,在法语中,être/suis/es/était/seront/fus,或者avoir/eu/ont/aurais/aies/ayons/eusse,这两组词其实是同一个单词在不同的语法含义下的不同写法,而且分别是“是”和“有”这两个最基本动词。很多其它语言中都会有这种类似的变化,而且越是底层的词语,变化就越丰富、诡异、不规则。这就导致了很多元素需要多次破译,同一个语义会以完全不同的形式出现。另外,汉语中很可能是有这种语法变化的,但是汉字书写在大部分情况下都没有变,而是以多音字的情况出现,比如“数”在做动词和名词的时候发音不一样。 所以汉字如果失传,根据现有文献解读汉字涵义是相对简单的。我甚至认为,如果能够找到一个十人左右的小组,所有人都具有研究生以上学历、不懂中文、不认识汉字、有一定语言学知识,凭借着纯中文汉字文献,在三天内就可以大概弄清10-20个汉字的含义,半年就可以基本搞懂知乎大部分回答的含义。 但是有得必有失,重塑汉字含义容易,但是想不借助汉语拼音文献,单独重造当代汉字的发音恐怕就不太容易了,古代发音就更难了。就连说着汉语的中国人自己,都不能确定古人的发音,在汉字失传的if线里,这恐怕就是完全不可能了。 |
|
[收藏本文] 【下载本文】 |
教育信息 最新文章 |
为什么部分 985 博士的第一学历很普通? |
同济土木已经没有未来了吗? |
为什么大学里上课几乎没几个人听课? |
00 后女干部拟任东莞茶山镇经济发展局副局长 |
为什么很多仕途开始一帆风顺的人,都会卡在 |
能干成大事的人都是什么样的人? |
重男轻女家庭里姐姐下面的弟弟在想什么? |
上海交大这个名牌值得舍弃专业吗? |
谁能介绍一下北大的数学教授许晨阳? |
教育部为什么不公布第五轮学科评估的结果? |
上一篇文章 下一篇文章 查看所有文章 |
|
|
古典名著
名著精选
外国名著
儿童童话
武侠小说
名人传记
学习励志
诗词散文
经典故事
其它杂谈
小说文学 恐怖推理 感情生活 瓶邪 原创小说 小说 故事 鬼故事 微小说 文学 耽美 师生 内向 成功 潇湘溪苑 旧巷笙歌 花千骨 剑来 万相之王 深空彼岸 浅浅寂寞 yy小说吧 穿越小说 校园小说 武侠小说 言情小说 玄幻小说 经典语录 三国演义 西游记 红楼梦 水浒传 古诗 易经 后宫 鼠猫 美文 坏蛋 对联 读后感 文字吧 武动乾坤 遮天 凡人修仙传 吞噬星空 盗墓笔记 斗破苍穹 绝世唐门 龙王传说 诛仙 庶女有毒 哈利波特 雪中悍刀行 知否知否应是绿肥红瘦 极品家丁 龙族 玄界之门 莽荒纪 全职高手 心理罪 校花的贴身高手 美人为馅 三体 我欲封天 少年王 旧巷笙歌 花千骨 剑来 万相之王 深空彼岸 天阿降临 重生唐三 最强狂兵 邻家天使大人把我变成废人这事 顶级弃少 大奉打更人 剑道第一仙 一剑独尊 剑仙在此 渡劫之王 第九特区 不败战神 星门 圣墟 |
网站联系: qq:121756557 email:121756557@qq.com 阅读网 |