未来战wiki攻略(未来战wiki)

时间:2023-10-24 14:00:06 来源:网友投稿 编辑:心软是病

维基百科:ChatGPT or Not? 这是一个问题

维基百科胜在知识结构清晰,ChatGPT 长于具体问题,双方未必不可调和。

22 年前,2001 年初,维基百科 Wikipedia 横空出世,在其后的互联网时代,成为人们获取知识的重要平台。

但在刚开始,人们对维基「人人可编辑」的组织形式产生过质疑。甚至有电视主持人讽刺其为「wikiality」,即如果在维基百科上编造条目,只要有足够多的人同意,它就会成为现实。

后来,随着《自然》(Nature)杂志的调查研究,发现维基百科准确度接近大英百科全书,Google 开始把维基百科放到搜索结果的首项,维基社区和内容贡献者也持续壮大,维基百科用了很多年时间终于取得了公众的信任。

诞生之初遭到质疑,越来越多人参与去完善,而后平反收到大众认可,继而成为日常的工具,这一过程,仅诞生半年的 ChatGPT 正在经历,不仅于此,它还成为了维基百科的挑战者。

不久前,维基媒体基金会召开 2023-2024 年度计划的电话会议,会议中提及了 35 次 AI,讨论的主题也是围绕 ChatGPT 带来的挑战。

但维基百科所担心的挑战,并不是被 ChatGPT 取代。而是更深刻地考验:未来的维基百科,会由 ChatGPT 来撰写吗?

01 维基百科的内容哪里来的?

要想知道 ChatGPT 能否撰写维基百科,得先知道维基百科目前内容来源于哪里。

维基百科主要是由来自互联网上的志愿者共同合作编写而成,任何使用网络进入维基百科的用户都可以编写和修改里面的文章。它是互联网上一个极大的自由内容、公开编辑、多语言的网络百科全书协作计划。

截至 2021 年初,所有语种的维基百科条目数量达 5500 万条,如何确保内容上的准确,全靠维基社群志愿者们的筛查。

在 ChatGPT 出现前,维基百科已经长期在用 AI 去减少一些人力成本。应用最多的就是把现有条目直接机器翻译,再由人工编辑校对。

2016 年时,资深科学家 Aaron Halfaker 开发了一套开源机器学习算法,可以自动识别维基百科里那些恶意破坏条目和编辑假消息的行为;2020 年,MIT 的研究人员也为维基百科推出过基于 AI 的修改功能,可以精确定位维基百科句子中的特定信息,并自动替换为类似于人类编辑的语言。

Wikipedia 关于 ChatGPT 的页面|Wikipedia

以及如维基社群所述,人工智能非常擅长总结把一篇很长的技术类条目,总结成儿童都能理解的版本,让 AI 去生成儿童版的维基百科效果很好。

翻译、检查、概括简化已有内容,维基百科一直以来对 AI 的应用仅限于此,直到大型语言模型 ChatGPT 的出现。

目前仍以文字方式交互为主的 ChatGPT,除了回答用户直接的提问以外,还可以用于甚为复杂的语言工作,包括自动生成文本、自动问答、自动摘要等等。

ChatGPT 可以写出相似真人的文章,并在许多知识领域给出详细和清晰的回答。哪怕 ChatGPT 生成内容的事实准确度还需要人工去二次查阅,但这时维基百科面临的问题已经很明显了:志愿者能否用 ChatGPT 来撰写维基百科条目?

02 能不能和想不想

纽约市维基媒体分会的老维基人 Richard Knipel 就用 ChatGPT 在维基百科上起草了一个名为「艺术作品标题」的新条目,Knipel 表示,ChatGPT 给出的版本一般但语确,定义了艺术作品标题的概念,给出了从古至今的例子。他在草稿基础上只做了轻微修改。

但另一位编辑在条目上标注,将会进行大量修改并完善。如今,我们再点进这一条目,会发现它增加了大量内容和理论索引,还梳理出了目录,给出了图片案例。像 Knipel 这样的维基人认为,ChatGPT 可以作为生成维基百科条目草稿、骨架的工具,在此基础上,人工再验证内容,编辑和充实条目。

但另一派维基人则认为,在维基百科条目的创作里 ChatGPT 应该完全被禁用。一位维基百科编辑就表示「我们应该强烈呼吁不使用 AI 工具来生成条目草稿,即使这些条目随后会被人工审阅。ChatGPT 太擅长引入那些看起来很有道理的谎言。」

ChatGPT 起草,人工简单编辑的版本|Wikipedia

人工大量干预后产生的版本|Wikipedia

但另一派也反驳这种说法,就像 Knipel 认为,修改并丰富不完善的信息,这就是维基百科在实践中一直运作的方式。ChatGPT 将继续存在并飞速发展,利用它同时强调人工干预的必要性怎么就不行呢?把 ChatGPT 上来就视作洪水猛兽实在有些偏颇。

但在想不想之前,我们先看看能不能。ChatGPT 还够不够格直接编写维基百科呢?

3 月 30 日时,维基百科创始人 Jimmy Wales 在接受 Evening Standard 采访时讨论了这个议题。Wales 认为,让 ChatGPT 能独立写一个完整的维基条目,目前还有一段距离,但距离多远就难说了。「ChatGPT 的一大问题是会胡编乱造,业内把这种情况称为 hallucinating(幻觉)——我称之为编瞎话。」(One of the issues with the existing ChatGPT is what they call in the field 『hallucinating』—I call it lying.)

「ChatGPT 有一种凭空捏造的倾向,这对维基百科来说真的不太行。」Wales 在采访里说道。实践中也是如此,你在维基百科上搜一个词,维基百科可能会反馈「该条目不存在」,但你问 ChatGPT,它可能会给你生成一段没由头的假消息。

ChatGPT 会「说瞎话」,这种事已经不新鲜了。但 ChatGPT 诞生仅半年,它的自我迭代能力已经令人咋舌,让 ChatGPT「句句吐真言」,似乎只是时间问题,那维基百科现在担忧的是什么呢?

03 人力有限,算力「无限」

维基百科团队并没有那么担心内容到底来源于人类还是 AI,它担心的是内容质量是否过关。

在维基媒体基金会在电话会议总结报告里,「挑战」被放到了开篇,其中最重的部分,也是维基百科团队最大的担忧在于:维基百科涌入大量 AI 生成的内容,把真正高质量的、正确的信息给淹没了。

「Wiki 项目有大量高质量的、可靠的,结构化的、分类好的内容。这就是我们带给世界的价值。最让我害怕的不是人们使用 GPT 之类的大语言模型来获取知识,而是需要巡查的 AI 生成的内容会爆炸式增长。」

对高质量内容来说,创作比消费的时间成本高很多,就像一篇较为完整的维基条目,需要许多人参与撰写,花许多时间,走过很多流程后完成,对读者来说几分钟就阅读完了。

像维基百科这种平台,为了保证内容质量,还需要专业人士核查一条条目中每个信息、数据、引用是否来源准确,筛查和编辑的成本同样很高。因此 AI 生成内容越多,人工核查的时间也更长。而且哪怕 ChatGPT 给出了正确的结论,但它并不会直接给出结论的论据来源何处,人工还需要再找到论据。到最后,修正可能比撰写耗时更长。

Wikipedia 的条目下会有很多延展阅读链接|Wikipedia

目前维基百科志愿者们已经发现了许多 ChatGPT 自动生成内容上的问题。比如 ChatGPT 很容易太笼统地概括定义,导致表意不明。还有 ChatGPT 遣词造句过于肯定,不够匹配维基百科想呈现的客观中性的文字风格。

最重要的是信源难以查询,维基百科的可信度和扩展阅读性,很大程度上是基于条目底下丰富的信息参考来源,但 ChatGPT 不会主动提供参考,甚至会凭空捏造。

担任了 20 年维基百科志愿编辑的 Andrew Lih 在用 ChatGPT 起草新条目时就发现,ChatGPT 概述定义做得很不错,但它所提供的消息来源于《福布斯》、《卫报》、《今日心理学》,但 Lih 仔细查阅后发现,这些信源文章并不存在,甚至 ChatGPT 给出的 URL 都是自动生成找不到页面的假链接。

综上,维基百科团队直接表示,AI 生成内容的速度和效率,可能会超出项目的运行能力。

除此之外,还有许多维基百科团队会担心的点,比如如今的维基百科贡献者里,使用英语的白人男性依旧是主体,维基内容已带有语言和内容偏见,ChatGPT 靠吸纳互联网信息为养料的 AI 机器,生成出的内容会进一步放大偏见。

Wikipedia 联合创始人 Jimmy Wales 在接受 Standard 采访时谈及 AI 参与撰写维基的问题|Standard

维基百科团队也无法把握志愿者对 AI 工具使用的倾向。Lih 就认为,维基人不缺动力,缺的是时间,ChatGPT 生成的糟糕草稿,可以激发维基志愿者的修改欲。这也符合维基之父 Ward Cunningham 所提出的「坎宁安定律」:在互联网上得到优秀答案的最佳方法不是去提问,而是发布一个错误的答案。

维基百科团队还担心,当维基百科充斥着 AI 生成的内容时,用户们会降低对它信息的信任度,转而去信任更有「人类作者」标识的媒体内容,比如会出镜的视频,标记了作者的媒体报刊。

04 就不能共存吗

维基百科和 ChatGPT 有很多相似性,比如都以文本为主,试图「回答一切」。但二者最显著的区别,在于回答方式的不同。

维基百科是有框架、系统、详细索引的百科式信息,你点进一个条目,可以从最简单的概括式介绍了解到其历史的变化,通过条目里丰富的扩展链接,可以在纵向里深入了解,也能在横向里在不同条目之间跳转,扩展对一整个领域的了解。

ChatGPT 目前呈现出的还是提问式的交互,需要用户明确了解自己想知道的问题,向外扩展也是需要建立在 ChatGPT 给出的回答之上,进一步询问。

不同用户获取信息的倾向不同,选择工具也不同,维基百科无法做到 ChatGPT 一样能回答非常具体的问题,ChatGPT 也不会像维基百科一样有那么精准且梳理好的知识类信息。这二者的使用方式,就像我们选择阅读教科书,还是直接向教授提问。

就像维基百科并没有因为搜索引擎 Google 的崛起而磨灭,反而它会出现在 Google 搜索结果的第一条和边栏上。

维基百科团队也并没有如 Google 一般有那么大的危机感,在年度会议里,虽然开篇点了 ChatGPT 带来的挑战,但整个会议更多的时间留给了「机会」。

「当互联网上有大量 AI 生成的内容时会发生什么?在一个由数万亿个低质量、低可信度的页面组成的互联网,创建大模型的人和用户都需要去找到可靠的信息,他们可能会更多地使用维基百科。」这就是维基人眼中的「机会」。

利用大语言模型去查 bug、翻译、内容总结、丰富媒体形式,比如 GPT-4 中体现的视频生成,AI 生成的图片也可以放到很多抽象概念的条目里,增加可读性,还可以在文本和语音之间互相转换。

但以上的前提,都是不能让大语言模型打打辅助,不能喧宾夺主。「维基百科是关于人类聚集在一起试图定义真相。这些工具不可靠,会分散我们对实际任务的注意力。我们应该小心要以多快的速度追赶这一趋势,而不是放弃它。我们应该关注创造知识的人。」

维基百科团队的态度,也折射了我们当下对 AI 的审慎态度。没有被取代,想充分利用 AI 的同时不够信任它,想发挥 AI 的最大价值,但真正有价值的内容又不敢轻易交付,难以放下人类本位的核心概念,谨慎地靠近,小心地追赶。

维基百科如何和大语言模型共存,或许就回答了我们人类如何与 AI 共存。

维基百科:ChatGPT or Not? 这是一个问题

维基百科胜在知识结构清晰,ChatGPT 长于具体问题,双方未必不可调和。

22 年前,2001 年初,维基百科 Wikipedia 横空出世,在其后的互联网时代,成为人们获取知识的重要平台。

但在刚开始,人们对维基「人人可编辑」的组织形式产生过质疑。甚至有电视主持人讽刺其为「wikiality」,即如果在维基百科上编造条目,只要有足够多的人同意,它就会成为现实。

后来,随着《自然》(Nature)杂志的调查研究,发现维基百科准确度接近大英百科全书,Google 开始把维基百科放到搜索结果的首项,维基社区和内容贡献者也持续壮大,维基百科用了很多年时间终于取得了公众的信任。

诞生之初遭到质疑,越来越多人参与去完善,而后平反收到大众认可,继而成为日常的工具,这一过程,仅诞生半年的 ChatGPT 正在经历,不仅于此,它还成为了维基百科的挑战者。

不久前,维基媒体基金会召开 2023-2024 年度计划的电话会议,会议中提及了 35 次 AI,讨论的主题也是围绕 ChatGPT 带来的挑战。

但维基百科所担心的挑战,并不是被 ChatGPT 取代。而是更深刻地考验:未来的维基百科,会由 ChatGPT 来撰写吗?

01 维基百科的内容哪里来的?

要想知道 ChatGPT 能否撰写维基百科,得先知道维基百科目前内容来源于哪里。

维基百科主要是由来自互联网上的志愿者共同合作编写而成,任何使用网络进入维基百科的用户都可以编写和修改里面的文章。它是互联网上一个极大的自由内容、公开编辑、多语言的网络百科全书协作计划。

截至 2021 年初,所有语种的维基百科条目数量达 5500 万条,如何确保内容上的准确,全靠维基社群志愿者们的筛查。

在 ChatGPT 出现前,维基百科已经长期在用 AI 去减少一些人力成本。应用最多的就是把现有条目直接机器翻译,再由人工编辑校对。

2016 年时,资深科学家 Aaron Halfaker 开发了一套开源机器学习算法,可以自动识别维基百科里那些恶意破坏条目和编辑假消息的行为;2020 年,MIT 的研究人员也为维基百科推出过基于 AI 的修改功能,可以精确定位维基百科句子中的特定信息,并自动替换为类似于人类编辑的语言。

Wikipedia 关于 ChatGPT 的页面|Wikipedia

以及如维基社群所述,人工智能非常擅长总结把一篇很长的技术类条目,总结成儿童都能理解的版本,让 AI 去生成儿童版的维基百科效果很好。

翻译、检查、概括简化已有内容,维基百科一直以来对 AI 的应用仅限于此,直到大型语言模型 ChatGPT 的出现。

目前仍以文字方式交互为主的 ChatGPT,除了回答用户直接的提问以外,还可以用于甚为复杂的语言工作,包括自动生成文本、自动问答、自动摘要等等。

ChatGPT 可以写出相似真人的文章,并在许多知识领域给出详细和清晰的回答。哪怕 ChatGPT 生成内容的事实准确度还需要人工去二次查阅,但这时维基百科面临的问题已经很明显了:志愿者能否用 ChatGPT 来撰写维基百科条目?

02 能不能和想不想

纽约市维基媒体分会的老维基人 Richard Knipel 就用 ChatGPT 在维基百科上起草了一个名为「艺术作品标题」的新条目,Knipel 表示,ChatGPT 给出的版本一般但语确,定义了艺术作品标题的概念,给出了从古至今的例子。他在草稿基础上只做了轻微修改。

但另一位编辑在条目上标注,将会进行大量修改并完善。如今,我们再点进这一条目,会发现它增加了大量内容和理论索引,还梳理出了目录,给出了图片案例。像 Knipel 这样的维基人认为,ChatGPT 可以作为生成维基百科条目草稿、骨架的工具,在此基础上,人工再验证内容,编辑和充实条目。

但另一派维基人则认为,在维基百科条目的创作里 ChatGPT 应该完全被禁用。一位维基百科编辑就表示「我们应该强烈呼吁不使用 AI 工具来生成条目草稿,即使这些条目随后会被人工审阅。ChatGPT 太擅长引入那些看起来很有道理的谎言。」

ChatGPT 起草,人工简单编辑的版本|Wikipedia

人工大量干预后产生的版本|Wikipedia

但另一派也反驳这种说法,就像 Knipel 认为,修改并丰富不完善的信息,这就是维基百科在实践中一直运作的方式。ChatGPT 将继续存在并飞速发展,利用它同时强调人工干预的必要性怎么就不行呢?把 ChatGPT 上来就视作洪水猛兽实在有些偏颇。

但在想不想之前,我们先看看能不能。ChatGPT 还够不够格直接编写维基百科呢?

3 月 30 日时,维基百科创始人 Jimmy Wales 在接受 Evening Standard 采访时讨论了这个议题。Wales 认为,让 ChatGPT 能独立写一个完整的维基条目,目前还有一段距离,但距离多远就难说了。「ChatGPT 的一大问题是会胡编乱造,业内把这种情况称为 hallucinating(幻觉)——我称之为编瞎话。」(One of the issues with the existing ChatGPT is what they call in the field 『hallucinating』—I call it lying.)

「ChatGPT 有一种凭空捏造的倾向,这对维基百科来说真的不太行。」Wales 在采访里说道。实践中也是如此,你在维基百科上搜一个词,维基百科可能会反馈「该条目不存在」,但你问 ChatGPT,它可能会给你生成一段没由头的假消息。

ChatGPT 会「说瞎话」,这种事已经不新鲜了。但 ChatGPT 诞生仅半年,它的自我迭代能力已经令人咋舌,让 ChatGPT「句句吐真言」,似乎只是时间问题,那维基百科现在担忧的是什么呢?

03 人力有限,算力「无限」

维基百科团队并没有那么担心内容到底来源于人类还是 AI,它担心的是内容质量是否过关。

在维基媒体基金会在电话会议总结报告里,「挑战」被放到了开篇,其中最重的部分,也是维基百科团队最大的担忧在于:维基百科涌入大量 AI 生成的内容,把真正高质量的、正确的信息给淹没了。

「Wiki 项目有大量高质量的、可靠的,结构化的、分类好的内容。这就是我们带给世界的价值。最让我害怕的不是人们使用 GPT 之类的大语言模型来获取知识,而是需要巡查的 AI 生成的内容会爆炸式增长。」

对高质量内容来说,创作比消费的时间成本高很多,就像一篇较为完整的维基条目,需要许多人参与撰写,花许多时间,走过很多流程后完成,对读者来说几分钟就阅读完了。

像维基百科这种平台,为了保证内容质量,还需要专业人士核查一条条目中每个信息、数据、引用是否来源准确,筛查和编辑的成本同样很高。因此 AI 生成内容越多,人工核查的时间也更长。而且哪怕 ChatGPT 给出了正确的结论,但它并不会直接给出结论的论据来源何处,人工还需要再找到论据。到最后,修正可能比撰写耗时更长。

Wikipedia 的条目下会有很多延展阅读链接|Wikipedia

目前维基百科志愿者们已经发现了许多 ChatGPT 自动生成内容上的问题。比如 ChatGPT 很容易太笼统地概括定义,导致表意不明。还有 ChatGPT 遣词造句过于肯定,不够匹配维基百科想呈现的客观中性的文字风格。

最重要的是信源难以查询,维基百科的可信度和扩展阅读性,很大程度上是基于条目底下丰富的信息参考来源,但 ChatGPT 不会主动提供参考,甚至会凭空捏造。

担任了 20 年维基百科志愿编辑的 Andrew Lih 在用 ChatGPT 起草新条目时就发现,ChatGPT 概述定义做得很不错,但它所提供的消息来源于《福布斯》、《卫报》、《今日心理学》,但 Lih 仔细查阅后发现,这些信源文章并不存在,甚至 ChatGPT 给出的 URL 都是自动生成找不到页面的假链接。

综上,维基百科团队直接表示,AI 生成内容的速度和效率,可能会超出项目的运行能力。

除此之外,还有许多维基百科团队会担心的点,比如如今的维基百科贡献者里,使用英语的白人男性依旧是主体,维基内容已带有语言和内容偏见,ChatGPT 靠吸纳互联网信息为养料的 AI 机器,生成出的内容会进一步放大偏见。

Wikipedia 联合创始人 Jimmy Wales 在接受 Standard 采访时谈及 AI 参与撰写维基的问题|Standard

维基百科团队也无法把握志愿者对 AI 工具使用的倾向。Lih 就认为,维基人不缺动力,缺的是时间,ChatGPT 生成的糟糕草稿,可以激发维基志愿者的修改欲。这也符合维基之父 Ward Cunningham 所提出的「坎宁安定律」:在互联网上得到优秀答案的最佳方法不是去提问,而是发布一个错误的答案。

维基百科团队还担心,当维基百科充斥着 AI 生成的内容时,用户们会降低对它信息的信任度,转而去信任更有「人类作者」标识的媒体内容,比如会出镜的视频,标记了作者的媒体报刊。

04 就不能共存吗

维基百科和 ChatGPT 有很多相似性,比如都以文本为主,试图「回答一切」。但二者最显著的区别,在于回答方式的不同。

维基百科是有框架、系统、详细索引的百科式信息,你点进一个条目,可以从最简单的概括式介绍了解到其历史的变化,通过条目里丰富的扩展链接,可以在纵向里深入了解,也能在横向里在不同条目之间跳转,扩展对一整个领域的了解。

ChatGPT 目前呈现出的还是提问式的交互,需要用户明确了解自己想知道的问题,向外扩展也是需要建立在 ChatGPT 给出的回答之上,进一步询问。

不同用户获取信息的倾向不同,选择工具也不同,维基百科无法做到 ChatGPT 一样能回答非常具体的问题,ChatGPT 也不会像维基百科一样有那么精准且梳理好的知识类信息。这二者的使用方式,就像我们选择阅读教科书,还是直接向教授提问。

就像维基百科并没有因为搜索引擎 Google 的崛起而磨灭,反而它会出现在 Google 搜索结果的第一条和边栏上。

维基百科团队也并没有如 Google 一般有那么大的危机感,在年度会议里,虽然开篇点了 ChatGPT 带来的挑战,但整个会议更多的时间留给了「机会」。

「当互联网上有大量 AI 生成的内容时会发生什么?在一个由数万亿个低质量、低可信度的页面组成的互联网,创建大模型的人和用户都需要去找到可靠的信息,他们可能会更多地使用维基百科。」这就是维基人眼中的「机会」。

利用大语言模型去查 bug、翻译、内容总结、丰富媒体形式,比如 GPT-4 中体现的视频生成,AI 生成的图片也可以放到很多抽象概念的条目里,增加可读性,还可以在文本和语音之间互相转换。

但以上的前提,都是不能让大语言模型打打辅助,不能喧宾夺主。「维基百科是关于人类聚集在一起试图定义真相。这些工具不可靠,会分散我们对实际任务的注意力。我们应该小心要以多快的速度追赶这一趋势,而不是放弃它。我们应该关注创造知识的人。」

维基百科团队的态度,也折射了我们当下对 AI 的审慎态度。没有被取代,想充分利用 AI 的同时不够信任它,想发挥 AI 的最大价值,但真正有价值的内容又不敢轻易交付,难以放下人类本位的核心概念,谨慎地靠近,小心地追赶。

维基百科如何和大语言模型共存,或许就回答了我们人类如何与 AI 共存。

每个人都用过的实体光碟,为什么要被淘汰了?

曾几何时,我的生日愿望还是父母能够给我买一套奥特曼的光盘,不少人的家里估计都留有用来装光盘的光盘收纳盒,小时候像翻书一样翻着光盘收纳盒找自己想看的动画,估计是不少90后的幸福回忆。

不过,光盘时代远比想象的要短暂,当年为了DVD等技术规格大打出手的各个厂商,恐怕也没有想到仅在短短十多年后,DVD乃至更先进的蓝光光盘就已经消失在了大多数人的眼中。

图源:VEER

对于国内的影音爱好者来说,DVD消失的时间还更早一些,不少00后估计就只见过随书附赠的学习光盘,至于蓝光光盘,因为国内严苛的影音出版限制,更是在除影音爱好者之外的圈子没有半点声音。

曾经开满大街小巷的音像店,如今也大多数都已经倒闭,国内已经没有了光盘存活的空间,如今仅剩下的市场只有发烧影音市场,就连这个市场如今也在逐年萎缩。即使欧美等市场,光盘也逐渐正在被人遗忘,前段时间,迪士尼宣布将在澳洲市场停止销售DVD和蓝光光盘。

作为全球最大的媒体巨头之一,迪士尼旗下拥有漫威、二十世纪福克斯等多家电影制作公司,同时也是最大的发行商之一,当迪士尼都打算逐步退出DVD、蓝光市场,基本上就可以宣布这个市场已然走向终末。

光盘,确实该退出市场了。

流媒体称王

流媒体时代来得比预料的更快,而且更猛烈,实际上,早期的流媒体与实体光盘并非互相取代而是互补,彼时的网速还徘徊在以kb为单位计数的时代,MP3、MP4等格式就成为流媒体库中最常见的文件格式。

图源:wiki

两者的优点很明显,都有着很高的压缩率,而缺点也明显,高压缩率会带来明显的细节损失,以一首MP3歌曲为例,彼时常见的128kbs采样率下,只要你的耳机稍微好一些就能听到高频缺失和背景噪音等问题。作为对比,当时的音乐CD大多采用44.1KHz采样率的音乐文件制作,信息密度完全不在一个层级。

所以,当时想要欣赏真正的高品质音乐,音乐CD基本上是唯一选择,除此之外就是下载别人分享的无损音乐文件,这些音乐文件基本来自音乐CD的爱好者,他们购入CD后通过具有烧录功能的CD机将其中的文件抓取下来,然后再通过网络分享到论坛上。

电影也是如此,早期的在线视频画质比在线音乐还要凄惨,相较于如今的高清画质用“全屏马赛克”来形容都丝毫不为过。即使如此,随着网速提升到MB/s的阶段,1080P的电影画质也已经可以满足大多数人对画质的需求,自此,流媒体在淘汰了音乐CD后,终于也开始对DVD市场下手。

图源:微博

不过,DVD的率先退场,背后并不完全是流媒体的“功劳”,在流媒体的冲击下,电影公司也在思考应对策略,一方面与流媒体平台合作,提供正版电影资源,打击盗版电影的传播,另一方面则是主推蓝光光盘,以4K、HDR、杜比等技术为用户提供更好的影音体验。

双管齐下,画质、音质远不如蓝光光盘,便利性又被流媒体平台碾压,DVD自然就只能够黯然退场,不过蓝光光盘并没有能够完全接手原本的DVD市场,相较于DVD,蓝光光盘的市场其实更小。

图源:wiki

原因有二,一是蓝光光盘的价格不便宜,售价动辄数十美元,二是想要得到完整的影音体验,蓝光播放器、4K电视、家庭音响三者缺一不可,而且性能都要是在及格线以上才能保证获得完整的体验。

如此一套设备购置下来,价格并不便宜,除了少数的电影爱好者之外,鲜少会有人愿意投资。不过,得益于索尼和微软两个巨头的游戏主机支持蓝光光盘播放,配合光盘租借服务,勉强让蓝光光盘在欧美和日本等地区续上一口气。

除此之外的地方,流媒体已然称王。

音像店中只余怀旧

随着流媒体服务的升级,如今我们已经可以轻松通过网络获取高规格的无损音乐和4K电影,如奈飞等平台更是支持多种杜比影院技术,体验几乎持平蓝光光盘。可以说,如今的光盘对比流媒体已经没有多少优势,仅剩下一些收藏价值。

在欧美地区尚且如此,光盘在国内的处境更是不堪,大家不妨想想上一次看到音像店是什么时候了?即使是在广州这样的大城市,音像店也基本上都集中在旧货市场、老城区和一些音像产品集散地,比如位于东湖的海印广场,此处是广州的影音类商品集散地,所以还保留了不少的音像店。

图源:雷科技

即使如此,还在营业的音像店两只手就能数完,其中更是只有一家店有客人在挑选商品,随机走进一间店铺,墙面挂满了音乐CD和黑胶盘,坐在一旁听歌的老板抬头看了我一眼,问了句:“想买什么?”,在店里转了一圈后,我与老板攀谈起来。

得知我是来找影视光盘的店,老板倒也没有什么不耐烦,而是直言:“现在没多少家店有卖影碟了,那玩意早几年就没销路了”,可能是难得遇到个聊天对象,老板干脆喊我坐下来喝茶。

图源:雷科技

“影碟老早就不卖了,先是DVD,然后是蓝光,现在还有几个人家里有影碟机的?(粤语地区习惯性将刻录电影的光盘称之为影碟)”,喝了口茶润润喉,老板继续说道:“如果你要找影碟,这个广场基本没有的了,你往下走到另一个数码城可能会有”。

对于这个答案,我倒也不感到意外,刚刚在店内闲逛时就已经发现货架上基本是音乐CD,少数标有影片字样的也都是音乐会或现场演奏的录像版本。可能是见我在张望,老板笑道:“别看了,小伙子,真没有,就算有我也不会摆出来卖的”。

“怎么说?”说来惭愧,我对于影碟的记忆还停留在中学时期,学校门口的店铺里10元一张任挑,以旧换新还能打折的时候。“盗版碟要是被查到,罚钱的,至于正版碟,国内就没有多少正版的影碟,很多都是老掉牙的片子”,老板听到我的问题也是挺乐呵的。

图源:雷科技 注:某家音像店藏在深处的盗版碟

虽然老板现在主营音乐CD,但是早年间也做过影碟生意,而且经销商基本上是同一批,所以在老板的介绍下,也算是差不多弄清楚了如今国内影碟市场的现状。国内的光盘出版物审核颇为严格,从送审到审批通过耗时漫长且麻烦,加之国内的网络建设速度极快,所以国内直接从DVD跳到了流媒体,忽略了蓝光的阶段,如今国内的光盘市场几近于无,自然就没有厂商愿意去做这种费力不讨好的事情。

目前国内正版过审的蓝光光盘数量极少,大多数所谓的“正版”蓝光盘其实都是走私的港版或其他国家、地区的光盘,因为蓝光光盘一般都会内置主要发行地区的语言字幕,也就不存在看不懂等问题。

除此之外就是盗版光盘,如今蓝光光盘的破解和再刻录技术已经相当成熟,加上蓝光光碟的成本,一套光盘的成本仅几块钱,是正版蓝光光盘售价的1%,至于售价,则是几十分之一。

图源:淘宝

如果你无所谓正版盗版,同时又想随时享受4K画质+7.1杜比音效,而不是流媒体平台被高度压缩的视频流,那么盗版蓝光光盘倒也算是一个选择。

“影碟买的人少,卖的风险还大,所以很多商家都不做了,还在做的基本上都是线上交易,站在门外你是看不到一个光碟的”,老板显然对此十分了解。“音乐CD的销量怎样?感觉现在听的人也少了”,在我走进店里的十多分钟里,别说进店的买家,就连从门口路过的人都没有,空气中只有我们的谈话声和从音响里传出的音乐声。

“不算好卖,但是至少比影碟好一些,最近两年生意反倒是好了一点,可能怀旧的人多了吧”,我点点头,表示认可。近年来,小红书等社区上时不时就会刮起一阵怀旧风,从古旧的CCD数码相机,到更古旧的CD机,总能让一些商家因此获益。

它们也在努力跟上时代

在我的印象中,音乐CD还处在无损时代,但是在老板的介绍下,我才知道为了对抗流媒体市场,如今的高端音乐光碟早已进入到蓝光阶段。通过特殊的压缩方式,可以将数十G的母带级文件压缩到数G,然后将整个专辑塞入到蓝光光盘中,提供给Hi-Fi爱好者远超流媒体的音质。

图源:雷科技

什么是母带级音质?简单来说就是利用录音室的原始文件,这些音频文件往往采用DSD格式,一首数分钟的歌,文件大小就可以达到数十GB,保留了一切的音乐细节,并且支持最多类型的音频模式。

如果你想体验极致的Hi-Fi音乐,高品质的正版蓝光音乐碟仍然是唯一选择,即使如今QQ、网易云等在线流媒体音乐软件都已经上线了母带级音质也是如此。为了适应网络传输需求,大多是使用AI算法进行压缩再还原,主要适用于双声道的音频环境使用,如果想要将其用到多声道的立体影院系统中就会相形见绌。

图源:QQ音乐

不过,对于多数人而言,我们听歌最常用的设备就是耳机,从TWS耳机到头戴式耳机,再高要求一些的则是会考虑书架音响。即使如此,99%的用户其实都止步于双声道,需要用到原始母带级音质的多声道音响系统注定是少数。

从蓝光电影到蓝光音乐光碟,作为一种陪伴人类多年的数据载体,光碟依然承担着带给观众最佳影音娱乐体验的任务,但是随着AI算法和高压缩算法的优化,被取代只是时间问题。

而且,随着新一代蓝牙制式和网速的提升,在千兆宽带的网速下在线流传输真正的母带级音乐都并非难事,甚至在搭建好的无线环境中,已经可以轻松传输BD蓝光版本的电影。

在新一代技术面前,光碟终究是会被淘汰的,就像曾经的音乐磁带一样,被扫进历史的回忆录中,最终只活跃在特殊领域或是小众爱好者之间。如果你问我光碟是否会在未来几年完全消失,我的回答是不可能,有些东西是虚拟的音乐文件所无法代替的,就像黑胶唱片如今仍然在售卖一样,光碟也将继续陪伴我们再走一段并不短的旅途。

你的网上“黑历史”,可以被忘记吗?

你有没有尝试过,在互联网上搜索自己的信息?如果别人上传了你的“黑历史”,你又删不掉,是什么心情?比如学生时代出糗的演出视频被同事们挖出来当笑话相互传阅,比如自己中二时期的社交媒体小号被现实中的熟人发现分享……互联网上所保存的“黑历史”,我们有权要求平台删除吗?

《四重奏》中的大提琴手世吹雀(满岛光饰),幼年被家人利用欺诈行骗,视频在网络中被保存了下来。长大以后,雀因为这段视频失去了工作。

2014年,一位西班牙公民在网络上搜索自己的名字,发现自己过去因债务原因拍卖房屋的信息依然在网络空间中没有删除,将谷歌告上了法庭。欧洲法院支持了他的诉求,并将“数字遗忘权”立为民事权利之一。只要公民有诉求,网络搜索引擎,应当从搜索结果中删除已经不相关或不适用的个人信息。

欧洲法院此举激发了全球对“数字遗忘权”的讨论,谷歌因此每年都会收到上百万条删除信息的请求。但也有不少机构反对“数字遗忘权”,认为它妨碍了它们收集理应被收集的个人数据。2019年9月25日,欧洲法院对此进一步作出裁决,认为“数字遗忘权”的数据删除范围不应扩大到全世界,而应当只适用于欧盟境内的搜索引擎服务器。

这个裁决结果从侧面反映出“数字遗忘权”一直以来都饱受争议。如何平衡个人隐私保护和网络信息自由之间的关系是争论的核心。除此以外,围绕它的讨论,也体现了人们数字时代的记忆焦虑。

那么,数字技术为何会引发人们的焦虑?想要理解这一点,需要探讨“遗忘”之于今天的我们来说,究竟有何意义。今天推送给大家的文章,从个体记忆和社会记忆层面,分别论述了数字时代“记忆与遗忘”的内涵,探讨了“互联网是否加速了遗忘”。作者认为我们不必排斥数字记忆技术——随着技术的发展,我们必然要面对当下的复杂难题,关键在于生活于其间的我们,会选择如何面对。

撰文 | 李岸东

01

Right To Be Forgotten

数字技术与“超忆症”焦虑

记忆力超群,听起来似乎是件好事。然而过于全面的记忆能力对自我建构和人际交往而言都是一场灾难。

英国Channel 4的纪录片《无法遗忘的男孩》

(The Boy Who Can’t Forget)

记录了这样一位拥有完全记忆

(total memory)

的超忆症患者。影片的主人公之一——46岁的吉尔可以清楚地记得自1980年2月以来的所有事情。

对吉尔来说,拥有惊人的记忆力是痛苦的:吉尔至今还可能为三十年前做过的一件错事而感到后悔,因为自己仍然清楚地记得关于这件事的所有细节。吉尔在白纸上密密麻麻地记录下自己每天干了什么,却从不会再看这些笔记,因为“我写下这些琐事不是为了记住它们,而是为了不让自己疯掉”。

《无法遗忘的男孩》。

超忆症患者的经历说明,遗忘和记忆一样,都是人不可或缺的能力。身份认同和自我的建构离不开记忆,但同样也离不开遗忘。如果将记忆视作一种关于自我的自传性叙事,那么无法忘记过去的人便无法拥有自洽的身份认同,也难以将自己的记忆编排成一套有意义的关于“我”的故事。

社会交往同样依靠记忆与遗忘:记忆维系人与人的关系,遗忘则作为宽恕的力量抹去一些交际中不愉快的记忆。英剧《黑镜》第一季中,未来人类可以通过植入芯片随时回放眼球记录下的所有视觉影像。故事里多疑的丈夫在过去的影像片段中反复寻找妻子出轨的证据,最终导致夫妻关系破裂。这类反乌托邦文艺作品中对未来人与技术关系的想象,恰恰体现出个人面对“全知全能”数字技术的无所适从。

《黑镜》中无法彼此谅解的夫妻。

对数字时代遗忘问题的关注体现出人们对“技术超忆症”的焦虑。数字技术不仅是一种交流技术,也是一种存储技术,在拓展交流的时空范围的同时,它也大大革新了信息存储与提取的方式。人们在网络世界中交流的同时也在“存档”这些交流的痕迹。作为“数字原住民”的新一代年轻人不经意间通过各种“数字痕迹”记录下了个人的生命历程。用户在社交媒体平台上发布的内容就像如影随形的“影子档案”

(shadow archive)

,既展现出传播行为和档案化的汇流,又凭借数字技术海量的存储空间使得“记录一切”成为现实。

除了记录一切,数字档案的第二个特征是易追溯、可检索。谷歌、百度等搜索引擎可以轻易从浩如烟海的数据中抽取出有用的信息。查找资料不再需要去图书馆和档案馆,只用坐在电脑前输入几个关键词就行。从前,只有新闻媒体会花大力气深挖名人的“黑历史”;而现在,即使是普通人的过去也可以轻易被搜索、分享、转存。数字档案打破了机构与个体、公共与隐私的界限,每个人都在网络世界中无意地建立着自己的公开个人档案。从这个角度来说,在数字技术面前个体似乎“无力遗忘”——每个人都可能成为“超忆症”患者,在未来某个不经意的时刻被自己的过去“击中”。

02

Right To Memory

从记忆的道德责任到“档案狂热”

然而,互联网既可以是“记住一切”的超级大脑,也可以是“对抗遗忘”的技术手段。换一个视角来看,“难以遗忘”未必是坏事。

以色列学者Noam Tirosh撰文批评“数字遗忘权”概念,认为这种权利仅落脚于个人隐私,却忽视了集体层面“被记忆的需求”。以他为代表的一批学者反其道而行之,提出了“记忆权”

(right to memory)

。正如桑塔亚那所言:“那些不能铭记过去的人注定要重蹈覆辙。”社会对遗忘的抗拒比对“难以遗忘”的恐慌来得更早,其背景是西方国家二战后对战争责任和历史记忆的反思。

二战结束后,西方国家兴起第二波“记忆潮”

(memory boom)

,对法西斯主义、种族主义、殖义的反思与战后的民族苦难和创伤记忆联系起来,形成了新的“伤痕纪念文化”——20世纪的纪念碑不再是滑铁卢郊外睥睨南方的雄狮,不再是戴高乐广场中央金碧辉煌的凯旋门,而是越战阵亡将士纪念碑那切入大地的黑色伤疤,是欧洲被害犹太人纪念碑那一排排整齐而冰冷的混凝土石碑。

美国纪录片《越战纪念碑》截图。

欧洲被害犹太人纪念碑(图片来自维基百科)。

二战后的纪念文化不再纪念战争胜利,而是纪念战争的苦难和伤痛。尼采在《论道德的谱系》中指出,遗忘并不只是记忆逐渐消逝的过程,更是一种“积极主动的抑制能力”,与之相对的记忆则需要外力推动。在尼采看来,“记住”是困难的,需要强烈的意愿才能实现,而这种意愿则往往诉诸残酷的暴力和流血牺牲。

由此,战后的创伤记忆被民族国家建构成为一种道德责任,而遗忘则是“不道德”的。二战口述史的兴起、日本“慰安妇”问题的逐渐升温,以及我国在“数字遗忘权”提出的同一年设立的国家公祭日,都体现出战后时代、尤其是后冷战时代中“不忘历史”与道德责任和民族身份建构之间的紧密联系。

到了互联网时代,记忆的道德责任又汇入第三波“记忆潮”,进一步引出了技术赋权与“个人崛起”的讨论。法国哲学家德里达用“档案狂热”

(archive fever)

一词来概括互联网对记忆的影响。“档案”的筛选、储存、整理和公开原本都由机构组织把持,拥有档案就意味着拥有权力。

如今,网络这个庞大的存储和信息共享空间一方面削弱了档案机构的信息权力,使信息的获取和流通变得更加方便快捷,另一方面给每个互联网用户提供了发声的平台。如前文所说,如今人们不断创造着关于自己生命故事的“数字档案”,这些档案的特点是去中心化、日常生活化:它们不再被保存在档案馆里,而是存储在云端,每个人都可以参与档案的建立和提取;它们也不仅仅记录国家大事,而是越来越反映普通人的日常生活。家人的一次出游、妻子的第一次生产、学校的毕业典礼、甚至家中宠物某个可爱的瞬间……各种常俗的场景都可以出现在社交媒体和视频分享网站,供所有用户浏览。

《档案狂热》外文版书封

在这种互联互通、唾手可得的数字档案的影响下,记忆的道德责任开始转变为另一种“记忆的认同责任”。越来越多的群体和个人通过网络平台讲述自己的故事,面向公众诉说自身的身份认同。数字技术使个人的记忆能够被听到,推动了普通人对“建档”的热衷,并某种程度上激发了“被记住”的需要。公共记忆的建构在层出不穷的用户生产内容(UGC)中逐渐远离民族国家的宏大叙事,开始聚焦普通人的日常生活。纪录片《二十二》记录了中国在世“慰安妇”的晚年生活,导演镜头下的她们过着平凡而琐碎的生活——没有激烈的控诉,没有刻意的煽情,这种平淡的叙事方式,是一种从“大历史”到“小记忆”的回归。

纪录片《二十二》。

从记忆的道德责任到“档案狂热”,鼓励用户分享、创作、参与的数字平台和数字文化使记忆在互联网中不但具有集体性,更具有连结性。这种连结性让更多元的个体记忆得以在公开渠道被呈现和保存,以人群的连结对抗了遗忘。在这个意义上的遗忘是消极的,记忆则成为一种义务。

03

Information Explosion

数字遗忘权背后最重要的问题

无关忘却与记忆

虽然超忆症焦虑和“档案狂热”对于遗忘的态度大相径庭,但这两种心态都认为数字技术让遗忘变得更加困难。然而,这种认知似乎与我们的生活经验相悖。我们总说“互联网只有七秒记忆”,曾经在网络上炒得热火朝天的明星绯闻或公共事件,可能几天后就不再有人讨论;一些行为不端的明星沉寂一段时间再出现时,大部分“吃瓜群众”已经不再记得他们曾经犯的错。微博热搜也许最能体现出互联网的“健忘”——它每分钟刷新一次的周期将信息更新和遗忘的速度加快到了以分钟计。

相较于数字技术对记忆的强化,普通个体似乎反而更能体会网络世界高速的遗忘,这是因为这两者所提到的“遗忘”并不是一回事。前者所强调的“难以遗忘”是一个比喻:网络数据的记录是“记忆”,与之对应的删除则是“遗忘”。这种“遗忘”的主体并不是人,而是网络存储空间。在这层比喻义之外,作为回忆主体的我们所感受到的“加速的遗忘”,才是“遗忘”的原本含义。

从个体层面上理解数字时代的遗忘,会发现“信息爆炸”正在挑战我们的记忆力:不是因为信息太少所以“忘记”,而是因为信息太多、更新太快所以“记不住”。在这样的“后稀缺文化”

(post-scarcity culture)

中,丰富反而意味着稀缺,因为有限的注意力无法处理海量的信息。面对数字技术的强大记录功能,人脑记忆显得无力而笨拙。

此外,遗忘的加速不仅因为“信息爆炸”,更是因为互联网超大容量的存档功能:所有指数级增长、飞速更新的信息,都能够被全部存储在服务器中。曾经在上世纪八十年代写出《社会如何记忆》的著名英国学者保罗·康纳顿,在二十一世纪转而关注现代性与遗忘问题。他认为因信息过剩而导致的遗忘本来只发生在知识丰富的阶层,但随着大规模的档案化和信息技术的革新,如今这类遗忘已经成为现代社会的一大特征。“被存储意味着无妨被忘记”,互联网强大的存储和搜索能力让健忘的人类有恃无恐。

《社会如何记忆》,保罗·康纳顿 著,纳日碧力戈 译,上海人民出版社2000年12月版

数字技术对遗忘的抗拒和个体遗忘的加速是相辅相成的,正是因为有了“记住一切”的互联网,才会有“敢于遗忘”的个人。从历史的长河溯流而上,外部记忆技术的发展总是伴随着个体遗忘的不断加速。

在古罗马,记忆专家们创造了各种精巧高效的记忆术

(mnemonic)

,试图在缺少外部记录手段的情况下充分利用人脑记忆这种最原始的记忆技术。书写文字发明后,随着甲骨、青铜、纸张等记忆技术的相继出现,信息存储对人脑的依赖有所下降,但“好记性”仍然是一门重要的技艺。史景迁在《利玛窦的记忆宫殿》中提到,传教士利玛窦就是依靠其惊人的记忆力引起了明朝士大夫阶层的注意,并写作了介绍西方记忆术的《西国记法》。

每一次记忆技术的革新都带来了记忆的进一步外部化和档案数量的不断膨胀。只要将数字技术看做是记忆技术发展中的一环,就不难理解为什么互联网在对抗遗忘的同时,也加速了个体的遗忘。换句话说,对待数字时代遗忘的加速,大可不必视之为洪水猛兽;这只是技术发展过程中一个自然而然的过程。

所有外化的、物质化的记忆形式,实际上都是一种“可被记忆”的潜在状态。从这个意义上说,作为记忆技术的互联网在本质上和之前的手抄稿、印刷纸、录像带并没有什么不同。新技术的普及推广总会引发恐慌,从“吸魂照相术”到“电子”都是如此。

不过对于今天的我们来说,接纳技术并不代表不去思考 “数字遗忘权”背后的担忧和焦虑。数字技术将日常交往和档案存储两个过程融合后,带来一个无法回避的问题:当所有琐事都成为可追溯的档案,当记忆的外化发展到无所不包,作为“遗忘动物”的人应该如何生活?归根到底,数字时代的遗忘不仅是一个有关记忆或忘却的问题,更是关于我们如何“共同生活”的问题。“数字遗忘权”是对这个问题的一种回答,但正如欧洲法院最近的裁决那样,与之相关的追问还将继续。

作者:李岸东

编辑:榕小崧 李永博

校对:薛京宁

声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送至邮件举报,一经查实,本站将立刻删除。转载务必注明出处:http://www.hixs.net/article/20231024/169625443583643.html