历史
沧元图 > 人生算法 > 序 人类最后一个独立写作的纪元

序 人类最后一个独立写作的纪元(3 / 7)

回文本异同年代,计算机对于文学创作、文学评论镜鉴价值就已经模糊地显现出来。今天AI工具拥有比单纯词频统计更强能力。例如,自然语言处理中常用语词表征学习技术Word2vec就是这个探索方向上种基本工具。有关Word2vec个通俗解读是,当机器利用此工具计算出文本中每个语词对应神秘数值[7]后,可以巧妙地将神秘数值与语义联系起来,甚至可以用直观计算式来进行语义推导(们用加方括号词来表示该词对应神秘数值):

[皇帝]–[男人]+[女人]≈[皇后]

[北京]-[中国]+[澳大利亚]≈[悉尼]

上面两个非常直白计算式对AI研发者而言早已司空见惯,但每次展示给没有经过编程和算法训练人,还是会收获莫名惊诧。因为这样明显语义关系完全由AI算法自动得出,这很难不让人怀疑AI已经找到解读人类大脑密码。遗憾是,科学逻辑并不支持这样假想。今天Word2vec只是种应用于文本数学工具,AI对语义解读,还只停留在肤浅统计建模层面,远谈不上理解人类语言。

Word2vec实用价值在于,它是主题、风格、情感等更高级建模或分析基础。曾抽取楸帆作品中代表性较强词汇,计算得到每个词对应Word2vec向量数值,再通过数学变换将百多维空间中向量转换成二维或三维人类可见图像[8]——这是标准、科学意义上“降维打击”。例如,后图(见下页)是从楸帆收录在这本书中六篇小说文本中,抽样提取代表性词汇生成空间分布示例(不同小说中语词在图中对应于不同形状标记)。

在电脑上,类似分布图可以针对每个空间局部或每个聚合主题,进行放大和细化。词汇在不同空间层级、区域聚合关系,可以直观地反映每篇小说、每个章节甚至每个段落写作特点。类似工具还可以很方便地比较不同作家文本差异。例如,们完全可以将楸帆《人生算法》和保罗·巴奇加卢皮《卡路里人》进行类似主题分析和词汇比较。再例如,即便们知道楸帆《美丽新世界孤儿》是向赫胥黎《美丽新世界》致敬作品,但精密文本分析也足以向们呈现出两部作品在语汇和主题层面异同。从这个意义上说,未来文学批评领域文本比较,几乎定会演进成全面由计算机参与、逻辑缜密科学过程。

《人生算法》六篇小说文本中抽样词汇生成空间分布示例

惧怕科技工具人常常担心这类分析

请关闭浏览器阅读模式后查看本章节,否则可能部分章节内容会丢失。

排行阅读

苍白爱情

三秋泓
天之骄子渣攻X自卑怯懦美人伪骨科年下宋知雨寄人篱下,为了苟活,主动变成了继弟严越明最喜欢的床上玩具。注意:没有排雷,到处是雷。自带扫雷系统,谢谢。
这是一个理智与情感的故事。关于梦想,人人夸夸其谈;关于爱情,人人缄默不语。我爱你,更爱我自己。 名校毕业工作能力出众的纪星因为不堪职场骚扰辞职创业,一路挫折不断,却因投资人韩廷的指导和提点而渐渐褪去生涩,变得成熟。 事业开始顺利时,与男友的感情却走到尽头。她与韩廷之间也渐渐产生暧昧,关系发生改变。

相爱未遂

金陵十四钗
满城衣冠副CP,律师X检察官,破镜重圆本文第一人称,互攻。
我深深地爱着你,你却爱着一个傻逼,傻逼他不爱你,你比傻逼还傻逼,爱着爱着傻逼的你,我比你更傻逼,简单来说,本文讲述一个,谁比谁更傻逼的故事。

重生之大涅槃

奥尔良烤鲟鱼堡
苏灿回到了自己十六岁那年的夏天。最关键的问题并不是在于苏灿如何去适应这全新的开始。而是明天过后。中考,就将没有选择的迎面而至!跨过了时空的界限,站在时光的这头,面对那曾经让他泪流满面的过去,苏灿要如何一步一步重拾遗憾,在这年代下面,如鹰似隼,划出灿烂的弧度?
凡人修仙之仙界篇全文免费阅读,讲述韩立叱咤仙界的故事,一个凡人小子修仙的不灭传说。没有看过前传《凡人修仙传》的书友可以先去看看,不过也并不影响本书的阅读体验。
最新小说: 沉默的永和轮 穿成虫族对照组的渣雄虫 遗世话晴秋 oh~这该死的兄弟情 我养的纸片人超好氪 嫁了一个老皇帝 平生相见即眉开 维持女配的尊严 谨遵医嘱 未完成的手稿