Tracing the Golden Line | 谈一谈引用和规范转载

/ 0评 / 0

一张图片引发的血案(不是)。

这件事还得从这篇文章[1]说起。

追寻真迹

最早的时候我在煎蛋网的无聊图板块看到了这个图片(考虑到煎蛋网无聊图的滚动特性,本链接可能已经失效。你可以试试本页面的互联网存档)。出于广大手机用户的习惯,这个图是一个长截图。我本来没多考虑,但是又觉得这个图里讲的内容有点意思,之后可能用得上,于是我就把它夹进了 Trilium.

但是这张图既没有头,尾好像也不完整。我在给这个东西写标题和引用信息的时候就犯了难。煎蛋网发布的描述只有一句简单的「山东临沂一大学邢教授为了了解外卖行业,亲自跑一个月外卖写一份调研文章」,并没有这个东西的来龙去脉。

那只能去请教 Google 了。提取文章内的一个思路上不太可能撞其他文章的短句,然后用英文单引号括起来,搜索一下:

图 1 搜索结果页面

奇了怪了。只有 6 条结果?

拉到页面最底部,要求不过滤重复结果。

图 2 内容农场

一堆内容农场。见鬼了。

一般这种互联网找不到原本的东西,我会怀疑它要么是在纸媒上发布,然后消息传到了一众电子媒体;要么是非常神秘的捏造:毕竟舆论战这种东西,见怪不怪了。

不过仔细观察煎蛋网的图片,会看到左侧「东夷书院」的水印。或许我们应该从这个路径找下去。

图 3 「东夷书院」搜索结果

Google 是懂的。它知道我要找什么。

点开微信公众号的链接,果然到了原文(图)所在地。知道了这篇文章的来源、作者和标题,也知道了原来这篇文章还有第四节。

读完,想完,慨叹,对照着格式编写引用信息,事情告一段落。但我总觉得心里空落落的。

——在浩如烟海的互联网上查找一份文档的原本是不是一种徒劳?

循环报道

很多人并不关心,也并不需要关心,他们的观点和数据从哪里来。很多人只是单纯地一说,期望别人也单纯地那么一听。但是在互联网时代,「单纯地一说」已经变成了一个几乎不可能的任务,除非是一对一地私聊。就连群聊,有时也会被不明真相的水友以讹传讹,三人成虎;更不要提在互联网公开发表的内容了。不过似乎很多人的意识里,在互联网公开发表任何东西和在广场上吆喝一嗓子没什么本质上的区别。

或许对于个人而言,这种情况也算是情有可原。但是对于媒体呢?

图 4 XKCD 978 Citogenesis - Randall Munroe

循环报道,即甲乙两方互相指认对方为情报参考,导致情报本身无法被溯源查证;以及甲乙两方看似是不同的情报来源,实则采用了同一情报来源导致情报本身可信度下降。

我们会希望媒体所报道的内容是真实的——至少是查证过的。但是当今扫盲基本完成,互联网自媒体当道的时代,街边哪个张三李四都能给你写两句。但街边的张三李四并不一定会真的给你查证什么内容,甚至连简单地搜索一下可能都懒得搞;或者限于产出速度要求不得不牺牲大量的「应有」的查证工作。

所以我不得不自己进行查证。但面对浩如烟海的互联网,我能做的也很有限——更不要说有些消息是我所无法查证的:那些发生在天边的事情,那些发生在高塔里的事情,要怎么才能理清前因后果呢?

在名为「转载」的蛛网

哪怕查证,也并非易事。

有信息的地方就有转载。但大多数人并没有「规范转载」的意识,更不要提挨个指出哪些东西是从别人那里拿来的,哪些东西是道听途说的,以及哪些东西是自己的原创想法。所有所有的信息搅成一团,真假参半,比喂猪的泔水好不到哪去。

而很多时候我要做的就是在泔水里面挑出点硬菜。我需要从一段可能是嵌在图片甚至嵌在视频里的文字推导哪些是真的,哪些是假的,哪些是没法查证是真是假的。而查证过程很多时候并不止一层,你需要看看上游信息是真是假,然后再看看上游的上游是真是假,这么一路走上去,你可能发现,哦,这部分是来自某某权威期刊的内容,或者来自某某知名学者的结论;或者发现这部分来自某个网友闲得发慌写的诳语,或者来自某某玩笑新闻站点的一个条目;但更多时候只会遇到一条断头路,我们不知道这个说法究竟来自哪里。

这种「不知道说法来自哪里」的消息,对于所有人而言都是有害的。流言蜚语的发源,不就是靠着这种「不知道谁说的」的东西么?伪科学假新闻,经过一层包装,就变成了「专家意见」、「行业共识」、「你绝对不会知道的冷知识」侵蚀着大众的思想,占领着舆论的高地。

我想要规范的转载。

规范转载

暂且不提版权意义上的规范转载,毕竟这个东西可是一个大坑。互联网意义上的「规范转载」的核心很简单:明确地指出这是转载的内容,并且注明完整的原文的地址。

后者比前者更为重要一些。「完整的原文地址」,很多时候指代一个超链接。但是就连这个超链接本身也有一堆「技术细节」需要关心。但是又随着互联网在逐渐地孤岛化,「超链接」这种东西,似乎也是一种在被逐渐遗忘掉的东西——有一些平台,我不点名,在刻意边缘化「分享」这个功能。做这种加速孤岛化、干扰溯源流程的操作,我想不到除了「提高用户留存率」以外的好借口。

但即使内建了分享功能,分享出来的结果也并不一定是一个超链接。有一些平台,我不点名,之前是为了规避聊天软件收链接白名单费,现在是为了……我也不知道,分享出来的结果是一串密码。这一串密码又只能通过生成这个密码的具体的 APP 才能解析。

这些技术问题,我们大概都有小小的方法能够绕过;那些绕不过的,就只能直接丢进「不可用作上游消息源」的垃圾桶。好在这些被点名的平台要么并不承载需要应用的信息,要么还处在「确实没有什么可以用的内容」的阶段。但我不禁担心:万一呢?万一这个平台确实出现了那些值得一用的消息呢?那时候我要怎么想办法把我需要的内容可查证地拿出来?

在我个人的能力范围内,写一条合适的引用信息都如此困难;那对于其他压根没有受过训练的普通人呢?或许我们可以有一个半自动的引用生成工具,比如 Zotero; 或者我们只需要想办法写一个小小的程序接收各种程序的分享,然后生成一条标准化的引用信息。

虚实之间

但就算我们打通了技术的桎梏,我们或许也并不能完整地解决问题。

无论是规范转载还是查证溯源,它们都只是验证信息的工具。它们并不能判断信息的真伪,也不能代替人去思考。但是我们总是下意识地觉得,如果一段话的右上角夹着一堆小数字,那么它一定是真的:毕竟,已经有人替我做过功课了。

这种虚假的真实性,比起毫无查证的信息而言,或许更具有破坏力[2]。尤其是资本介入,你几乎可以把任何东西包装成所谓的「真相」[3][4]

我上面一段话夹了三条角标,你的反应是相信、怀疑还是因为看了上两段话直接拒绝?

在虚实之间求真,或许是我们不得不学的技能了。

参考资料

参考资料
1 邢斌. 2022年冬,我在临沂城送外卖[C/TPOL]. // 东夷书院. “与你分享”沙龙第三期. 2023-08-20. https://mp.weixin.qq.com/s/Yms7al4Ms42pXR-tS5iYFQ.
2 Munroe R. Advertising Discovery[EB/OL]. (2011-06-01)[2023-10-26]. https://xkcd.com/906/.
3 刘某. 樊登读书也不太靠谱[EB/OL]. 图南博客. (2023-09-14)[2023-10-26]. https://iliu.org/4499.html.
4 麦憬霆. 为了 5 万美元,糖对心脏的损害被隐瞒了 50 年[EB/OL]. 丁香园. (2023-03-17)[2023-10-26]. https://mp.weixin.qq.com/s/OGd5hzmJmzW_f7-j72ap6A.

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Your comments will be submitted to a human moderator and will only be shown publicly after approval. The moderator reserves the full right to not approve any comment without reason. Please be civil.