如何预测畅销书

文学理论不是一个能创造许多畅销书的领域。莎士比亚的传记总是有市场的,偶尔,卡米尔·帕格里亚的性生活会掀起一股……

LIterary理论并不是一个能创造许多畅销书的领域。莎士比亚的传记总是有市场的,偶尔会有一部像卡米尔·帕格里亚的作品性面具掀起了一场争论.但文学研究很难普及:马尔科姆·格拉德威尔不写叙事理论的翻页小说。

畅销书代码试图成为这条规则的例外:一部关于最近文学理论的流行作品,出售给行业而不是教室。无可否认,它描述了一种奇怪的理论,这与钱球而不是雅克·德里达。作者在出版工作以及学院,并开发了一个算法模型 预测哪些小说会纽约时报畅销书目录。在过去三十年的书上测试时,他们的模型百分之八十是正确的。

利用读者对这种惊人准确性的好奇,,畅销书代码诱使他们更广泛地讨论文学成功的意义。读者真正想从小说中得到什么?什么情节,字符,或主题给故事最广泛的吸引力吗??

作者发现,例如,那种性生活不如人们想象的好。50种灰色是个例外;甚至五十个墨镜可能与其说它的受欢迎程度是因为它的强调,不如说它的受欢迎程度是因为它的露骨性。人的亲密,“作者称之为情绪过山车”情节的没有单一的主题或风格保证销售。但是,如果小说只专注于几个主题,它们更有可能成功,使用会话风格,定期和候补之间的激烈的经历快乐和绝望。同时也不妨碍女性角色有力地表达自己的需求。

所有这些都很有趣。阿切尔和赛马人并不声称能够教人们如何写畅销书,但是,有抱负的小说家在翻阅这本书时会发现有很多值得思考的地方。我怀疑畅销书代码会和它的名字一样受欢迎达芬奇密码.但我可能错了:还没有人建立一个模型来预测非小说的销量。

我可以自信地预测,然而,我的文学学者们会讨厌这本书。学术研究的普及很少受到学术界的欢迎,而这一点有一个额外的障碍,似乎体现了一个外部压力,对经验主义,纪律特别不喜欢。文学学者还不相信数字真的能阐明我们的主题。当来自其他领域的研究人员对文学进行全面的定量论证时,我们往往会感到沮丧。

阿切尔和运动员都有英国文学博士学位,他们在故事中编织了大量的文字和传记细节。但任何细微的差别都不会使这场争论减少争议。意见已经两极分化。这本书的中心前提是,文学的成功可以用数字来解释,这似乎是局外人所渴望的那种简单化。英国教授发誓要抵制。

两极分化是不幸的,因为这本书实际上是文学研究的巨大机会。为什么读者喜欢他们喜欢的东西是批评家们一直试图回答的问题。以及畅销书代码并不是快速的:绝对有可能建立统计模型来预测哪本书会在特定的读者群中获得成功。阿切尔和赛马员是第一批展示畅销书可以做到这一点的人,但他们不是唯一测试过这种方法的人。乔丹·塞勒斯和我已经证明,对于一个模型来说,识别十九世纪诗歌的数量是很容易的,精英杂志认为这些诗集的重要性足以让人回顾。

这本书所揭示的模式可以改变文学史,即使这本书对这些模式的所有解释都是错误的。

因此,预测并不局限于我们可能期望的公式化和可预测的大众市场工作。畅销书代码正在运用约翰·格里沙姆和丹妮尔·斯蒂尔的戏剧化方法来帮助我们理解其他形式的文学成就,并相互比较成功的形式。什么?纽约客想要大众市场不?从1920年到1980年,读者的偏好是如何变化的?哪本书在1950年出版,如果早几十年或晚几十年出版,可能会做得更好?这些问题为文学史开辟了新的视野。

这本书容易受到一系列的反对,有些是基于误解,和一些有效的。 阿切尔和赛马骑手们已经解决了可能看起来是明显缺陷的循环性问题。你怎么能“预测”已经发生的事情?“)通过在没有发现的证据上测试他们的模型。在对丹妮尔·斯蒂尔的小说进行预测之前,这个模型从未展示过她成功的例子。例如,而且,它成功地预测了畅销书是在它诞生后出版的。

是真的,另一方面,定量方法比解释方法更擅长预测。一个模特可能会告诉你一本书很可能会卖,因为它在使用动词方面与其他畅销书相似需要避免感叹号.很难解释为什么这些细节会有所不同。在畅销书代码,,例如,动词被视为特征符号。因为需要东西的角色通常是女人,,需要链接到的Lisbeth Salander有龙纹身的女孩-以及最近对陷入困境的女性主角的热情。就我所知,这是对的。但解释性的分类很难理解。动词和字符一样吗?情绪的变化和情节是一样的吗?因果关系甚至滑。没有感叹号的故事会出现在畅销书列表中吗?因为读者喜欢无表情的语气,“或者因为有影响力的公司的编辑们取消了他们打算推广的手稿中的感叹式对话?严格来说,我们不知道。

哈里特·比彻·斯托的畅销书纪念版1897年。<i>照片由肖伯格黑人文化研究中心/纽约公共图书馆提供。

哈里特·比彻·斯托畅销书纪念版汤姆叔叔的小屋,1897。照片由肖伯格黑人文化研究中心/纽约公共图书馆提供

写一本生机勃勃的贸易书,弓箭手和骑师不得不使解释的任务听起来比实际更容易。所以持怀疑态度的读者会发现很多问题需要提出,应该把它们养大。另一种解释在一本流行著作中被掩盖了,应该在学术辩论中阐明。所有证据都可供检查。

但十年后,我们不记得畅销书代码感叹号错误。我们会记得它是否引发了一种新的文学探索。事实上,这本书所揭示的模式可以改变文学史,即使所有作者对这些模式的解释都是错误的。发现和解释之间的这种滞后是算法不可能取代传统关键方法的原因之一。学者们往往担心数字会给古老的解释性难题提供简单的答案。但这很少是他们提供的。相反,定量的方法会找到提示新问题的证据。证据的范围可能比我们过去所用的范围更大,涵盖了数千本书和数百万读者。但是模式仍然需要解释,一百万读者的偏好就像一本书的意义一样令人费解。图标

特色形象: 发布方哈利波特与死亡圣器 在森尼维耳,加利福尼亚,二千零七.谢泼德扎克/维基共享照片