2024年的文化战争已经认真地开始了,围绕着意想不到的、极其混乱的学术诚信话题。
上周,哈佛大学校长克劳丁·盖伊(Claudine Gay)在被指控论文部分剽窃后辞职。尽管哈佛大学首位黑人校长盖伊承认自己没有署名地抄袭了文本,但她认为这些指控是右翼政治活动人士的意识形态运动的一部分,目的是“瓦解公众对美国社会支柱的信仰”。
针对盖伊的指控不会是最后一次。同一周,Business Insider发表了两篇文章,报道麻省理工学院(MIT)前教授内里·奥克斯曼(Neri Oxman)剽窃了她的一些学术作品。奥克斯曼是比尔·阿克曼的妻子,比尔·阿克曼是一位亿万富翁对冲基金经理,曾帮助领导了将盖伊从哈佛大学开除的公众运动;这些故事突出了他对剽窃的执着的明显虚伪。作为报复,阿克曼在X上发布了一系列长文,称他打算对麻省理工学院(他认为麻省理工学院是针对他妻子的指控的幕后黑手,尽管他最近在推特上写道:“我们不确定麻省理工学院是幕后黑手”)和《商业内幕》记者的工作展开抄袭调查。阿克曼写道:“没有任何学术著作能够在人工智能的力量下幸存下来,因为人工智能会搜索遗漏的引号,无法适当地解释,以及/或无法正确地归功于他人的工作。”在其他地方,在策划针对盖伊的指控中发挥核心作用的保守派活动人士克里斯托弗·鲁福(Christopher Rufo)承诺为“‘剽窃狩猎’基金”提供1万美元。
这是一件丑陋而混乱的事情——学术诚信、长期积怨、脸皮薄的亿万富翁以及一场有据可查的颠覆精英机构的意识形态运动等合理问题的产物。我的同事Ian Bogost在最近的一篇文章标题中很好地说明了这一点:“抄袭战争已经开始。”
如果一场抄袭战争真的正在进行中,这肯定是一场政治努力,但也是一场技术努力。为了对整个大学和新闻编辑室进行抄袭审查,人们需要一个可以扩展的过程。这将不可避免地意味着寻求检测软件的帮助,如iThenticate,它与出版机构合作,访问学术著作的图书馆,并检查文本。根据项目的规模,iThenticate的价格为100美元或300美元,它由一种算法提供支持,该算法可以识别关键字,并将可疑文本与这些库进行匹配;正如伊恩上周所写的那样,该软件功能强大,但它也需要勤奋的人工审查,以理解结果并排除误报。
反剽窃软件在回复初始扫描时比任何人工审查委员会都要快得多。一个理论宣传家不需要做检查每一个引用的体力劳动,而是简单地把分数截图出来,然后在社交媒体上发布诽谤指控,这可能足以在真相大白之前损害一个人的声誉,如果真相大白的话。
这种情况有一个术语:说谎者红利。这个词由学者罗伯特·切斯尼(Robert Chesney)和丹妮尔·西特伦(Danielle Citron)提出,描述了一个反乌托邦的信息环境,在这个环境中,深度造假等合成媒体变得非常普遍,任何被指控有不良行为的人都可以简单地对任何针对他们的真实证据表示怀疑。说谎者的红利一直是技术专家、政治家和记者最担心的问题,他们担心生成型人工智能革命将使世界进一步陷入虚假信息的混乱之中。他们认为,聊天技术和音频、视频生成工具可以比以往任何时候都更容易生成虚假内容。在美国,新闻媒体已经宣布2024年将举行首次“人工智能选举”;谷歌前首席执行官埃里克·施密特等著名技术专家认为,这种威胁是如此严重,“你不能相信你所看到或听到的任何东西。”
但是,到目前为止,人工智能生成的信息还没有欺骗选民或在大范围内制造不和。因此,具有讽刺意味的是,一种不完美的、技术水平相对较低的算法有可能沿着政治路线部署,而不是模糊现实界限的生成式人工智能。也许人工智能的反乌托邦很快就会到来,但形式与许多人想象的不同。
人工智能的剽窃战争会是什么样子?一个有用的类比可能是2016年总统大选期间和特朗普政府初期“假新闻”一词的发展轨迹。最初,这个词是用来描述一个新兴的信息产业综合体,包括伪装成合法新闻网站的网站和超党派社交媒体页面。这些媒体大量编造政治故事,以便在Facebook等平台上获得关注。BuzzFeed news在2016年披露的最著名的假新闻案例是由马其顿青少年运营的一个由100多个网站组成的网络。他们发表了支持特朗普的编造故事(比如他得到教皇支持的虚假说法,以及即将对希拉里·克林顿(Hillary Clinton)提起诉讼)来赚钱。
在唐纳德·特朗普(Donald Trump)获胜后的几天里,假新闻在新闻媒体上获得了支持,并被视为他意外获胜的一个潜在解释。但特朗普仅仅用了一个多月就抓住了这个词。在2017年1月的新闻发布会上,当选总统对CNN记者吉姆·阿科斯塔(Jim Acosta)说,“你是假新闻”,而且从未回头。这个词成为共和党政客、脱口秀主持人和选民的战斗口号,他们用这个词来驳斥他们不喜欢的报道。通过把假新闻变成个人流行语,特朗普让真正的批评者更难谈论污染我们信息生态系统的谎言和捏造的信息流。一开始,这是一项合法的努力,目的是揭露一场数字虚假信息的操作,但后来却被政治行为者恶意利用,以抹黑他们认为具有威胁性的反对派力量的新闻媒体。
“假新闻”一词的使用与过去几周的剽窃文化之战有明显的相似之处。反剽窃措施,就像事实核查一样,可以让学术机构监督规范,保持信任和诚信。但是,就像2017年发生的那样,那些旨在防止不诚实行为的政策,却被那些希望拆除或对这些组织实施报复的人所利用。
抄袭文字的覆盖层在社交媒体上很受欢迎,因为它很直白、很明显。但是,正如Gay的例子所显示的那样,即使是抄袭案件也可能比截图所显示的更加微妙。是的,她似乎违反了哈佛严格的学术政策。但对于剽窃行为的严重程度和意图存在分歧,一些人认为,这表明有必要彻底重新考虑剽窃政策。无论如何,不同机构的政策是不同的。而且反抄袭工具也很难做到刀枪不入:大量的误标记事件给使用这些工具检查学生作业的教育工作者带来了问题。
这些棘手的细节使剽窃成为文化战争的丰富话题。这是对精英机构规范的严重违反,也是意识形态对手可以无休止争论的话题。多亏了技术,指控可以被大规模地提出,直到它们摧毁了它们本应保护的机构,或者直到指控完全失去意义。再一次,想想媒体对假新闻的迷恋,以及这个词随后在右翼的使用:它最终使这个词变得毫无意义。可信的新闻机构指出谎言,揭露特朗普政府的丑闻,而极端党派的理论家和右翼政客则用自己的“另类事实”制造了一个平行的信息世界。最终,越多的人看到抄袭这个词,他们就越不关心它,这对学术界和我们更大的话语是有害的。
如果这场新的文化战争真的爆发,将会有更多的证据表明,技术是如何以意想不到的方式带来预期中的剧变的。就目前而言,人工智能对文化的破坏不是乔·拜登(Joe Biden)的深度造假视频,也不是幻觉般的废话泛滥的结果,而是一种大规模自动化繁忙工作的简单算法。
也许在这场混乱中有一个教训,可以帮助我们更好地理解一个充满人工智能的世界的后果。在这个特殊的例子中,人工智能的力量显然不是来自于它创造了什么,而是来自于它如何以非人的效率创造。人工智能真正的杀手级应用是规模,尤其是与社交媒体的网络效应相结合时。学者、政治家、技术专家和像我这样的作家担心新兴技术会毒害我们的话语,这是正确的,但我们最好不要忽视最直接、最可靠的变革工具,比如金钱、权力和影响力。
似乎,在预测即将到来的反乌托邦时,我们的想象力常常在两个方面让我们失望:我们梦想得太大,想象出了未来颠覆的奢侈和戏剧性模式,同时未能看到我们现有工具可能颠覆世界的更平淡的方式。