红楼梦等名高作者是谁让数学来证明.docx
- 文档编号:14085831
- 上传时间:2023-06-20
- 格式:DOCX
- 页数:6
- 大小:21.08KB
红楼梦等名高作者是谁让数学来证明.docx
《红楼梦等名高作者是谁让数学来证明.docx》由会员分享,可在线阅读,更多相关《红楼梦等名高作者是谁让数学来证明.docx(6页珍藏版)》请在冰点文库上搜索。
红楼梦等名高作者是谁让数学来证明
《红楼梦》等名著作者是谁?
让数学来证明
《红楼梦》是一人所作?
《红楼梦》成书迄今已逾200年,作为中国最重要的一部小说,它不仅感动了中国人,也得到其它民族的重视与喜爱。
《红楼梦》有各种不同的版本,数十种续书,流传到世界各国,被翻译成各种文字,透过不同的文字翻译,感动了不同民族的人民。
长期以来,人们普遍认为曹雪芹只写了《红楼梦》的前80回,后40回是高鹗续写,但数学统计进入文学领域后,这个定论遭到了计算机的质疑。
1981年,首届国际《红楼梦》研讨会在美国召开,美国威斯康星大学讲师陈炳藻独树一帜,宣读了题为《从词汇上的统计论〈红楼梦〉作者的问题》的论文,首次借助计算机进行《红楼梦》研究,轰动了国际红学界。
陈炳藻从字、词出现频率入手,通过计算机进行统计、处理、分析,对《红楼梦》后40回系高鹗所作这一流行看法提出异议,认为120回均系曹雪芹所作。
语体风格是人们在语言文字表达活动中的个人言语特征,是人格在语言文字活动中的某种体现。
这种风格可以在一定程序上通过数量特征来刻画。
例如,句长和词长可以代表作者造词句的风格,当然,反映作者风格的不是单个词的词长和单个句子的句长,而是以一定数量的语料为基础的平均句长和平均词长;此外,字、词在作品中出现的频率也是个人风格的体现。
利用计算机计算一部作品或作者平均词长和平均句长,对作品或作者使用的字、词、句的频率进行统计研究,从而了解作者的风格,这被称之为计算风格学。
计算风格学现在在社会科学领域成为一门饶有兴味的学科,尤其在判断作者真伪,考证作者疑难方面更是大显身手。
让佚名作现身
“作者考证”有时是一个很困难的问题,计算风格学可被应用来解决这种问题。
我们看看两个例子。
出现于16世纪90年代的一部五幕剧《爱德华三世》,表现了14世纪英王爱德华三世统治时期勇武的骑士精神。
但该剧作者究竟是谁,戏剧界争论了几百年。
不久前,通过电脑对该剧的语言风格进行分析,莎翁作品的权威机构——阿顿公司正式确认,《爱德华三世》是莎士比亚的一部早期作品。
莎剧专家说,这部作品本身所表现出的深刻人性、博大精神和文辞语言的华丽无可辩驳地“用莎士比亚自己的声音”证明了它的来源。
1964年,美国统计学家摩斯泰勒和瑕莱斯考证了12篇署名“联邦主义者”的文章作者,可能的作者是两个人,一个是美国开国政治家汉密尔顿,另一位是美国第四任总统麦迪逊。
究竟是哪一位呢?
统计学家在进行分析时发现汉密尔顿和麦迪逊在已有著作中的平均句长几乎完全相同。
这使得这一能反映写作风格特征的数据此时失效了。
于是,统计学家转而从用词习惯上来找出这两位作者的有区别性的风格特征,而且终于找到了两位作者在虚词的使用上有明显的不同。
汉密尔顿他已有的18篇文章中,有14篇使用了“enough”一词;而麦迪逊在他的14篇文章中根本未使用“enough”一词。
汉密尔顿喜欢用“while”,而麦迪逊总是用“whilst”。
汉密尔顿喜欢用“upon”,而麦迪逊很少用。
然后,再把两位可能的作者的上述风格特征指标,与未知的12篇署名“联邦主义者”的文章中表现出来的相应的风格特征进行比较。
结果发现那位署名“联邦主义者”的作者就是美国第四任总统麦迪逊。
这样就了结了这一考据学上长期悬而未决的公案。
两位统计学家所使用的数学方法也得到了学术界的好评。
《静静的顿河》是不是抄袭?
长篇小说《静静的顿河》是一部既磅礴壮观又委婉细腻、扣人心弦的史诗性长篇小说,是当代世界文学中流传最广泛、读者最多的名著之一。
他的作者肖洛霍夫因此获得1965年诺贝尔文学奖。
但小说出版后即有人说这本书是肖洛霍夫从一位名不见经传的哥萨克作家克留柯夫那里抄袭来的。
俄国流亡在国外的一些作家如索尔仁尼琴、麦德维杰等,认为《静静的顿河》的大部份内容是抄袭哥萨克作家克留科夫的作品,理由是该书第一卷出版时,肖洛霍夫年纪尚轻,并无生活经历;另外,他以后未能写出具有同样文学价值的作品。
肖洛霍夫充其量是合作者罢了。
为了弄清楚谁是《静静的顿河》的真正作者,捷泽等学者采用计算风格学的方法进行考证。
具体办法是把《静静的顿河》四卷本同肖洛霍夫、克留柯夫这两人的其他在作者问题上没有疑义的作品都用计算机进行分析,获得可靠的数据,并加以比较,以期澄清疑问,得出谁是真正作者的结论。
捷泽等学者从〈静静的顿河》中随机地挑选出2000个句子,再从肖洛霍夫、克留柯夫的各一篇小说中随机地挑先500个句子,总共3组样本,3000个句子,输入计算机进行处理。
处理的步骤如下:
1、首先计算句子的平均长度,结果3组样本十分接近。
于是再按不同的长度细分成若干组,对3组样本中对应的句子组进行比较,发现肖洛霍夫的小说与《静静的顿河》比较吻合,而克留柯夫的小说与《静静的顿河》相距甚远。
2、进行词类统计分析。
从3个样本中各取出10000个单词,结果发现,除了代词以外,有6类词肖洛霍夫的小说都与《静静的顿河》相等,而克留柯夫的小说则与之不相符。
3、考察处在句子中的不同位置的词类状况。
俄语的词类在句子中的不同位置可以很好地表现文体的风格特点,特别是句子开头的两个词和句子结尾的3个词往往可以起到区分文体风格的作用。
捷泽等学者统计了3种样本中句子开头的词类和句子结尾的词类,发现肖洛霍夫的小说与《静静的顿河》十分接近,而克留柯夫的小说则与之有相当大的距离。
4、进行句子结构的分析,统计3种样本中句子的最常用格式。
结果发现,肖洛霍夫的小说与《静静的顿河》的最常见句式都是“介词+体词”起始的句子,而克留柯夫的小说的最常见句式是以:
“主词+动词”起始的句子。
5、统计3种样本中频率最高的15种开始句子的结构,发现肖洛霍夫小说中有14种结构与《静静的顿河》相符,而克留柯夫小说中只有5种出现在《静静的顿河》中。
6、统计3种样本中频率最高的15种结尾句子的结构,发现肖洛霍夫小说中15种结构与《静静的顿河》完全相符,而克留柯夫小说中结尾句子的结构与《静静的顿河》完全不符。
根据以上6个方面的统计结果与分析,捷泽等人已可以下结论:
《静静的顿河》的真正作者是肖洛霍夫。
然而,捷泽等人对于这样一部世界名著,这样一个世界文学界的重大疑案,采取了十分谨慎的态度,为了精益求精,他们在更大规模基础上进行研究,最终确定《静静的顿河》确实是肖洛霍夫的作品,他在写作时或许参考过克留柯夫的手稿。
后来,原苏联文学研究者从另外一些方面又进一步证实了肖洛霍夫是《静静的顿河》的真正作者。
计算风格学不仅能考证作者,还作者一个清白,在更广阔的范围内,通过对不同时期的文学家作品的统计计算,还可以反映一个时代的文化风格变迁。
曾有人对20位德语作者的22部著作的平均词长和平均句长进行过计算,从而发现了德语书面语言的句子有变短的趋势。
(鲁秋枫)
《大科技》2004年04月21日
概率是数学学科的一个分支,主如果研究事件发生的可能性的大小。
可能性的大小用一个数值来表示,若是一件事必然不会发生,咱们就定它的可能性为0,若是必然会发生,咱们就定它为1。
若是一件情形,有可能发生也有可能不发生,咱们就用介于0和1之间的数值来表示,越是接近于1咱们就说这件事发生的可能性大,越是接近于0咱们则说这事发生的可能性小。
有一个男人因为情感不合和妻子闹离婚,唯一的儿子判给了他,归他扶养。
他心里感到宽慰,儿子是他心中的希望。
可是过了几年后,他觉察儿子相貌上,性格上一点像他随他的地方也没有,心中不免产生了怀疑。
这孩子是不是自己的亲生骨血呢?
怎么办呢?
做DNA亲子鉴定。
最后的鉴定结果出来后,让他的心全凉了,那个孩子不是他的亲生儿子,是他的前妻和别的男人生的。
他又再次到法院,要求前妻领回她的孩子,并要求补偿他几年来的抚育费。
此刻咱们就来讲说DNA是怎么回事,怎么就明白孩子是不是自己的亲生儿子?
第一,别离从父子身上提取一点血液,看它们的遗传基因序列有多少相同点。
相同点越多,说明血缘关系越近,是父子关系;反之则越远,不是父子关系。
由此咱们能够看出,研究一件事的可能性的大小,能够解决许多看起来很困难的实际问题。
此刻,咱们清楚了什么是概率,数学概率能解决什么问题。
那么它和《红楼梦》有关系吗?
它能解决《红楼梦》中什么问题呢?
用这种方式来解释,或是说来验证科学吗?
所有这些,都是咱们要讨论的话题。
《红楼梦》是举世公认的一部伟大的中国古典名著。
至于她的艺术价值有多高,在文学史中的地位有多高,和对后人的文学创作有哪些深远影响,我可不敢枉加评论,因为我没有那个能力,也没有那个资格,这些方面,从来的专家,学者,“权威”们说的太多了!
我也没必要再做重复赘述。
我只说说一些自《红楼梦》问世以来,许多争辩不休的问题,谈谈自己的粗浅观点。
其中最大的争辩点就是,一方说,《红楼梦》就是一部小说,虽然也说,小说里有作者的自传成份,有作者的切身经历,但总的来讲,就是一部文学作品,是一部小说,里面没有隐写什么真实的历史,小说中的人物都是虚构的,没有什么密码可言,若是谁如果非要从中找到什么,那就是“旁门左道,走火入魔,哗众取宠……”。
这些专家学者们要求人们看红楼梦事前就给人划定了一个框框:
要从文学的角度欣赏她,从思想的高度熟悉她,从她的文学宝库中汲取营养……。
而一方则说,《红楼梦》是在隐写着一段真实的史实,小说只不过是一件尼采服,一种掩护,记录这段真实历史的一个载体算了,作者的真正目的不是传小说,而是传一段鲜为人知的历史。
到底谁是谁非,我不敢肯定,我只是说说,谁说对的可能性大。
先说说,作者为何要写这本书《红楼梦》,绝大多数的写书人,尤其是现代的写书人,写作的目的中,必然包括着“名利”二字。
不是吗?
此刻不是天天都有什么,“版权”啊,“高作权”啊,“肖像权”啊,“炒作”啊,等等这些争闹吗?
为何?
还不是为了“名利”二字?
!
那么《红楼梦》的作者在创作这部书时有无“名利”二字在心中作怪呢?
我敢说,没有,绝对没有!
为何?
理由如下:
时直今日,还有人说,《红楼梦》的作者不是曹雪芹!
有说张三的,有说李四的,有说清朝写的,有说明代写的。
也有的说曹雪芹,曹雨沾(上雨下沾合成一字),曹天佑,根本不是同一个人,众口纷纭,一时难辨真伪!
为何会出现这种现象呢?
作者写出如此一部举世公认好书,为何不堂而皇之地告知世人此书作者的大名呢?
在那时,作者必然是在逃避,逃避什么?
肯定是在逃避当权者。
为何逃避,必然是书中有对当权者不利的内容。
若是当权者发觉了这些内容,而大多读者还没发觉的时候,当权者是不会善罢甘休的,必然会采取些手腕来置作者以死地!
明讨也好,暗杀也罢,必然会的。
所以作者不能不在作者的名字上放了一些烟幕弹,以防意外。
《金瓶梅》的作者也是如此呀,咱们只明白叫兰陵笑笑生,究竟姓氏名谁,到此刻也还说不清楚,我想那个人可能也是出于如此的考虑。
我以为,《红楼梦》的作者是明代人那个结论是根本站不住脚的,因为若是是明代人写的小说,必然会有女人小脚的描述。
因为在明代,女人都是小脚的。
只有到了清朝才出现女人有大脚的,有小脚的。
汉人裹脚,满人不裹脚。
这是清朝的时期特点。
所以《红楼梦》要避忌,还有就是抽烟,也是清朝的特点,书中也要避忌。
所以我说〈红楼梦〉必然是清朝人写的。
是清朝人写的,能不能肯定是曹雪芹写的?
曹雪芹,曹雨沾,曹天佑是不是同一个人呢?
答案也是肯定的,因为小说中隐写了曹天佑和曹雨沾,这两个名字。
〈红楼解梦〉中早已论述过了。
有人问了,十八划就必然隐指那个(雨沾)吗?
其实作者怕你做别的想,紧接着写了,天忽下起雨来,把身上的衣服淋湿了。
那个迷底就等于告知读者了。
用笔画一样多的字来暗指另个字,我想在书也仍是有的。
比如“慈孝”县,暗指“遵化”县。
笔画都是十九划。
作者为何要如此写书?
是在故弄玄虚吗?
为何要捉弄读者?
要以此来显示作者的文采?
都不是,只是要在当权者抓不到任何痛处的情形下,把一段令当权者愤怒的,害怕的,真实历史以小说的形式留给后人。
只有如此才能解作者心中的块磊!
那些“红学家”们,说话就带有权威性的,说什么《红楼楼》就仅仅是一本小说,没有密码可言,书的谬误是作者的疏漏所致,造成了美玉中的瑕疵。
如此的论调是在赞美《红楼梦》仍是在贬低她啊?
我想,小学生也能听得出来!
大家能够想一想呀,曹公一字一滴血,一字一滴泪地,冒着被追杀砍头的危险,披阅十载,增删五次。
能犯如此的小儿科的错误吗?
连年龄都算不准?
八十年代,我曾看过一幅油画,题目和作者的名字我不记得了。
画面是一名裸体的女子,披着长发,背对着人们的视线,倚栏眺望窗外的星空,无论是意境仍是色调本身都显得超级美,超级和谐。
可是把画拿到必然的距离的时候,你就会突然发觉画面的内容变了,美人不见啦!
变成了美国总统林肯的人头肖像!
你看有多奇妙!
有人会说,画和写小说是两码事,两种艺术形式,不能一概而论。
画中有画,能够做到。
一部小说中再隐写着一段历史,如此的情形是做不到的。
我说能做到的。
用别的文字,别的国家的人,可能做不到,中国人用汉字就可以做到!
咱们都会猜迷语吧?
一个迷语有迷面,有迷底,迷面一个意思,迷底另一个意思。
这不是很容易就做到了吗,你猜不中迷底不说自己笨反而倒打一耙说他人编迷语的编的不好!
真是好笑!
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 红楼梦 作者 是谁 数学 证明