Follow

『中文互联网正在加速崩塌』

mp.weixin.qq.com/s/afg3zHPpEyR

『先问你一个小问题:

如果我们在百度上搜索“马云”这两个字,把时间设定在1998年到2005年,能搜出来的信息,大概有多少条呢?是1亿条,还是1000万条,还是100万条?

我在几个群问过,大家普遍的猜想是,应该是百万或者千万的级别。毕竟,互联网信息如此浩如烟海。马云作为那个时代的风云企业家,在网上留下的痕迹肯定是非常多的。

但实际上能搜出的全部结果如下:

用百度搜索,选定日期范围为“1998年5月22日到2005年5月22日”,含有马云的信息,总共是1条(2024年5月22日数据)。

而仅有的这一条信息,也是虚假的。点进去会发现,文章的发布时间其实是2021年,不属于上面限定的时间段,只是不知怎么回事,它被莫名其妙地搜索出来。

也就是说,如果我们想要了解那一段时间关于马云的经历、报道、人们对他的讨论、他的讲话、公司的发展史等等,我们能得到的有效的原始信息量,是零。

你可能会觉得,这是不是百度的问题啊?如果换必应或谷歌,会不会能搜出来?

我测试过,这两个网站搜出来的有效信息,和百度没有太大区别,比百度略多一些,但也只是个位数。更多的也都是时间紊乱的无效信息,只不过不知道是什么技术原因,被错误地抓取出来。

你可能还会觉得,是不是因为马云属于比较有争议的人,由于某种不可描述的原因,所以他的信息才无法搜到?

但实际上,不仅仅是马云的情况如此,我们去搜马化腾、雷军、任正非等,甚至是罗永浩和芙蓉姐姐这样在那个时候红极一时的网红,或周杰伦、李宇春那样曾经火遍全网的明星,结果也都一样的。如搜雷军的情况,结果是这样的:

在测试过不同网站、不同人名、不同时间段之后,我发现一个令人震惊的现象:

几乎所有在那个年代曾经红火过的中文网站,如网易、搜狐、校园BBS、西祠胡同、凯迪猫眼、天涯论坛、校内网(人人网)、新浪博客、百度贴吧、以及大量的个人网站等,在一定年份之前的信息都已经完全消失不见了,甚至大部分网站是所有年份的信息都消失了。唯一例外的是新浪网,还能找到一些十几年前的信息,但也是极少数的寥寥几条,其他99.9999%以上的内容,全都消失了。

大家都没有意识到一个严重的问题:中文互联网正在迅速崩塌,移动互联网出现之前的中文互联网内容,已经几乎消失殆尽。

我们原以为,互联网是有记忆的,但没有想到,这种记忆,原来是像金鱼一样的记忆。

我之所以注意到这个问题,是因为何加盐公众号的主题是研究牛人,所以我需要经常查找他们的资料。

这两年来,我有一个非常明显的感觉:网上能找到的原始资料,每年都以断崖式的速度在锐减。之前还能看到一些原始的报道,后来慢慢没有了;之前还能找到主人公的演讲或者他们写的文章,后来慢慢找不到了;之前还能看到很多采访或对谈的视频,后来慢慢消失了。

似乎有一个吞噬网页的怪兽,它沿着历史的时间线,从过去向着现在吞噬,先是小口小口,然后大口大口,把中文互联网的一切内容,以五年、十年为单位,一口吞掉。

等我们回过神来,会发现,在移动互联网之前曾经存在过的中文互联网的一切,不管是门户网站、机构官方网站、个人网页,还是校园BBS、公众论坛,还是新浪博客、百度贴吧,还是文件、照片、音乐、视频等,都已消失不见。

记得十几年前,我曾经因为换电脑,把一些照片和文章打成一个压缩包,存在某BBS上,几年之后发现,那整个BBS都没有了。我曾经用过hotmail的邮箱,里面有很多很珍贵的邮件,后来全都没有了。我还写过人人网、MySpace,后来全都没有了。

我们曾经以为互联网可以保留一切,但结果是一切都没能保留。

为什么会出现这种情况呢?我猜想,主要原因可能是两个:

一是经济原因。

网站的存在,需要服务器、需要带宽、需要机房、需要人员运维,还有很多杂七杂八的监管和维护费用,这些都是成本。如果是有战略价值(例如需要向外展示公司想要展示的信息),或者有短期流量价值(例如还时不时有较多的人上来看),同时公司账上也不差钱,那么还会有动力去维持。

但是如果公司在商业上走了弯路,没钱了,整个网站就会直接死掉。例如人人网就是典型代表。

即便公司还有钱,从运营的角度来看,如果一个网页一年到头都没有几个人来点击,对公司来说,就成了一笔负担,从经济上最理性的方法,就是直接关掉。搜狐、网易早年的内容大量丢失,以及以天涯论坛为代表的BBS集体消亡,都是这个原因。

二是监管原因。

总体而言,互联网信息的监管,是从无到有,从宽到严,从严到更严的过程。以前可以合法存在的内容,后来不符合监管要求了;或者是以前可以灰色存在的内容,后来被定义为黑色了。这些内容都会直接被咔嚓掉。

还有一些是随着时代的变化,舆论的两极分化越来越极端,以前“只道是平常”的内容,在后来的舆论环境中显得非常尖锐、敏感,尽管不违法,但是可能激化矛盾,形成混乱,监管方也有可能会要求处理掉。

除了官方部门之外,愤怒的网友,也时时充当着舆论监管员的角色。他们会翻出十几年前某人无意中说的某句话,揪着不放,把人网暴至“社会性死亡”。

但监管上最重要的影响,还不是监管部门的处理或愤怒网友的攻击,而是它们会造成公司与个人的“自我审查”。

因为谁也不知道,网站上存在的哪一条内容,某人曾说过的哪一句话,会不会在若干年后,给当事人带来灭顶之灾。最好的办法,就是直接把这些潜在的“定时炸弹”全部清除,也就是把网站关掉或者把内容全部删除。

当然,除了上述两个原因之外,还会有其他很多原因。

例如,在南斯拉夫解体之后不久,所有“yu”(南斯拉夫国名Yugoslavia的缩写)这个国际域名之下的网页内容全部消失了。又如,随着版权保护的加强,曾经随处可下载的音乐和电影网站,就都消失了。还有一些机构和个人,纯粹是由于自己的原因,不想在对外展示信息了,就把官网或个人主页关掉等等。

但这些原因都是次要的、局部的。整个互联网内容系统性的、大规模的消失,主要就是由于经济规律和自我审查。

本质上,互联网内容和生命一样,也受进化论的支配。其存在的标准只有一条:以尽可能低的成本争取尽可能多的注意力。

当一个内容能够在互联网上的海量内容中争取到足够多的注意力,而维持这个内容的成本(包括经济成本、监管成本和对抗监管的成本)比其他方式更低时,这个内容就有可能存活在互联网上。只不过它有可能会换一种呈现方式,例如从文字变为图片,从静图变为动图,从动图变为视频,未来可能从二维视频变为三维全息视频等等。承载这个内容的平台也会变迁,从门户网站到BBS,到个人博客,到微博微信,到抖音视频号,到未来可能一个我们不知道什么平台。

当一个内容不能再吸引到足够多的注意力,或者维持这个内容的成本比其他方式更高时,这个内容就会从互联网上消失。以电脑为浏览端、以网页为载体的传统互联网的集体消亡,只不过是这种“信息进化竞争”的必然结果而已。

生物的进化秘诀是“物竞天择,适者生存”,而互联网内容的进化秘诀是“信息竞,注意力择,适者生存”。由于网络效应,这种竞争比自然界还要猛烈万倍,残酷万倍。传统互联网不是单个物种式的灭绝,而是几乎所有内容的整体性灭绝。

每一代新的互联网崛起,旧的互联网必将崩塌,时间二向箔是所有网站、所有内容无可逃避的宿命。

如果未来的文明是互联网的文明。我们这一代人,将是没有历史的。因为互联网没有留下我们的痕迹。

“没有历史”,这件事情重要吗?

当然很重要。

我曾经为了写邵亦波的文章,想尽了一切办法,试图找到邵亦波2007年参加《波士堂》节目的原始视频,以及他妻子鲍佳欣以“文爱妈咪”网名在宝宝树社区发了好几年的帖子。最终还是没有找到,只能深深遗憾。

虽然《红尘已忘邵亦波》那篇文章,依然很受大家欢迎,短短一周就有70多万人阅读,2万多人转发,但我十分肯定,我一定还是错过了某些非常重要的信息。如果它们能呈现在那篇文章里,文章质量会更好。

但是我找不到,就只能让文章以不完美的方式呈现。

你可能会觉得:这只是对何加盐这样的研究者和写作者有用,我又不写这样的文章,互联网信息没有就没了,对我又没什么影响。

真的吗?

如果我们已经看不到马云的所有演讲,看不到任正非的以《我的父亲母亲》和《一江春水向东流》为代表的所有文章,看不到段永平在雪球的所有发帖,你会不会觉得有点可惜?

好吧,你说你并不觉得可惜。

那如果我们已经搜不到黄峥的公众号,看不到张一鸣的微博,上不了王兴的饭否,你会不会觉得有点遗憾?

好吧,你说你也并不觉得遗憾。

那如果某一天,知乎如同天涯论坛一样没了,豆瓣就像人人网一样消失,B站好比新浪博客一样已无人问津,你会不会有点心痛?

如果某一天,你喜欢的微博博主所有的微博只显示“作者已设置只展示半年内微博,此微博已不可见”,你常看的公众号只显示“此账号已被屏蔽,内容无法查看”,你在抖音或小红书搜索某些信息,结果显示“作者已清空全部内容”……

甚至,微博、公众号、抖音、小红书,就像曾经存在过的bbs、贴吧、空间、博客一样,全部消亡……

你会不会为此难过哪怕是短短的一分钟?

作为传统互联网的一代人,七零后、八零后已经找不回我们的历史。因为它们已经全部消失了。

新生代也许还能看看朋友圈,但是朋友圈也越来越多“三天可见”,越来越沉默不语。

唯一还在热情发圈的,只剩下一水的营销信息。

未来就连这些营销信息,也终将消亡。

如果一件事对我们很重要,而它正在消亡,我们有什么办法挽救它吗?

有人曾作出这样的尝试。美国有一个网站叫做“Internet Archive”,中文译作“互联网档案馆”,保存了很多原始网页。但是我试过,中文的原始网页,保存的很少,而且使用非常麻烦,搜索功能十分原始低效,和没保存差不多。

从技术层面来讲,保存从中国有互联网以来,到移动互联网兴起的十来年时间的所有网页,应该并不难,成本也不高,毕竟比起现在的视频时代,原始互联网的那些图文网页,占的空间几乎可以忽略不计。

问题是,谁来做这件事,有什么动机?

商业机构不会做。因为没有任何商业利益。

政府或许可以像建图书馆、博物馆一样,搞一个能保存所有网页的档案馆。但是政府为什么要花钱费力干这件事?除了保存历史之外,似乎也没有其他理由。再说了,就算是政府做了这件事,对普通网民也没有任何意义,因为这个档案馆肯定也会需要一定的登陆权限,以免信息被滥用。

况且,就算是有机构愿意做这件事,现在也晚了。移动互联网兴起之后,传统互联网的中文内容,几乎已经消失殆尽了。粗略估算,99%以上应该都已经没有了。

从某种意义上,何加盐写的牛人系列文章,也为保存这些牛人们存在过的历史,做出了一点贡献。如果我没有写他们,很多历史就已经在网上找不到了。但毕竟这也不是原始信息,只是经我整合过的二手信息。

现在的中文互联网上,这个世纪前十年发生过的所有重大事件,所有留下过深深痕迹的名人,目前还能找到的信息,几乎已经全是经自媒体编辑过的二手信息,甚至是传过多手,早已面目全非的信息。

关于它们的原始报道没有了,原始视频没有了,原始讲话没有了,原始的网友目击没有了,原始的评论没有了……

再过一些年,这些二手信息和N手信息,也都会消失。就像那些事件从未发生过、那些人从未存在过一样。

我们已经无能为力,只能接受现实。

在未来的互联网时代里,回首看21世纪的前二十年,将是没有历史记录的二十年。

我们是互联网时代消失的一代人。

如果你现在还能看到一些中文互联网的古早信息,那只是夕阳的最后一抹余晖。

如果你明白了它们的转瞬即逝,可能会像临死前的浮士德一样感叹:

你真美啊,请停留一下吧。

但那抹余晖,很快将和你这句感叹一起,被时间的二向箔吞没,陷入虚空。

《三体》中,程心和艾AA还能有幸乘坐唯一的一艘曲率飞船,逃离正在二维化的太阳系。

而我们,连曲率飞船都没有。

逃无可逃。

现在你所看到的、你所创造的几乎所有内容,连同这篇文章,这个平台,终究也会淹没在虚空中。』

作为中文互联网的一部分,《中文互联网正在加速崩塌》这篇稿子原链接已经不见了,凤凰网的转载也不见了。幽默的是在 S1 论坛上还有一份。文章以身证道,证明了加速之快。

收藏夹里十年前的英文网站链接大多还能打开,而中文链接基本都失效了。

中国也有过类似美国那个互联网档案馆,二十多年前就有,是北大建的,叫“中国Web信息博物馆”(www.infomall.cn)。然而后来无疾而终,不知道为什么就关了——至少这个域名是访问不了了。

实际上,很多人的博客网站也是如此。发布在社交网站,你的账号不属于你,一个活过十年的微博堪称大熊猫,假如是从2012年存活至今的微博,那堪比恐龙活到现在。发布在个人博客网站,国内服务器不用讨论。国外服务器那忘记续费也是会导致文章链接失效。

所以我认为博客文章要发布就是要发布到github上。

一不会被删帖,二链接不会失效,三官方力量无法干涉到,四只要还有程序员,那么网站就会永远存在下去。

比较有意思的是,这篇原文我因为嘟文字数限制,删去了其中有段关于三体的话。然后下午回来发现该文全网链接被删。甚至下午刷微博看到别人讨论该文(有数千转发量),下一瞬再试图找那篇微博就发现迅速被删了。

这种相见就是永别的文字体验太简中社交体验了。

绝大多数人对于古早互联网停留在百度搜索跳出的各个社交网站。停一停,这是后人的想象。百度只是搜索引擎,只是入口。

2005年的中国,很多网站没有发展起来。新浪微博也只是2011年开设的。但这不意味着那时候的中国没有网民。实际上,那会上网费用虽然高,但照样有人下电影讨论篮球。

斯人已去的科比,在中文互联网的热度依然居高不下。各种关于他的梗的热度。“打赢复活赛”这是一个很恶俗的梗,却也侧面说明科比破圈的人气。在这之前篮球破圈人气是乔丹。而科比的三连冠是在2000年至2002年期。那会人们没有现在便利的移动网络,但也是有网页新闻集合。没有家庭网络,但有公共的网吧。2000年后网吧浪潮就是那会兴起的。

电视直播和网络文字直播热贴这就是当时古早中国互联网的生态。虽然简陋,但充满热情生机。是没有被钳制生长的野蛮原始。是现在的新生代所想象不到的。人们坚信互联网是连接世界,连接一切的。

我怀念的不是过去,而是真的有出现过乌托邦的美好网络。你觉得这里不好,就可以拉上一帮志同道合的朋友去建一个新的网站。

前几天还在v站看到有人发帖讨论说想做一个社交app。然后就有人说

“国内做社交 App ?先网警上门拍照备案再说”

“软著、icp 增值电信业务经营许可证、域名备案 这三个最基本的做了吗?”

“社交网络已经终结了,不推荐做社交 APP 。这是属于网络社区的悲剧,国内那些曾经最热门的社区,天涯社区、泡网、凯迪社区没落了。
网络社区的模式就有问题,看看下面这牌文章吧,我觉得他说的很有道理。
lcamtuf.substack.com/p/the-evo

@yisheng 消亡才是常态吧,纵观历史上的资料,最终能留存下来的不过是极少数,这个时代也并非个例,只多了能留存的幻想罢了…

@yisheng 然後豆瓣上有老哥在論證這篇文章裡數據不對哈哈

@yisheng 这叫数字黑暗时代(digital dark age),但是英文世界对此的描述多半注重于硬件方面,例如过时的媒介和文件格式、数字版权下的abandonware问题等。英语国家似乎也很少有因为平台关闭后无存档的问题,Usenet 的内容都有存档。
所以我认为简中互联网的数字黑暗时代问题,百分之百和缺乏言论自由和信息自由有关。

@nyancatflies @yisheng 英语国家也有,而且不少的。而且随着国内外隐私权,被遗忘权等概念普及,有内容发布者主观注销账户以保护隐私。或者因为非法内容,如版权等问题被查水表,被迫删除。

包括上面提到的 互联网档案馆,网站站长也可以禁止相关爬虫索引,已经收录的也可以发邮件联系彻底删除。

Pew Research Center 称,2013 年存在的页面中,38% 目前已无法访问。 文章还提到:
- 研究者取得的 50000 个英文维基百科条目中,82% 的条目有至少一个链接失效。
- 研究者于今年三月至四月取得的约 500 万条推文中,18% 的推文在三个月后已经无法公开访问,11% 的推文甚至连发送者账户都无法公开访问(被锁推、封禁或注销)。

misskey.io/notes/9tkw66hk00gk0

@kkbt @yisheng 我还是认为这两者也非常大的不同。首先马云的例子显然是指公共媒体信息,如新闻报道,而个人锁定乃至删除私人的社交媒体账号和个人博客是私人领域的行为。过去也有烧日记和手稿的,个人完全有权掌控关于私生活的信息。这和简中互联网大规模删除网络上的新闻报道是完全不同的。
而内容会被版权方查水表本身就意味着版权方在社会上属于强势和特权阶级,艺术内容的版权若在这些法人手中,本身就不易流失。这里唯一例外的是闭源软件,因其复杂程度需要长期有人维护,不像图像、音频和视频一旦完成就不用管了。但众所周知,abandonware也不是copyright strike滥用的典型对象。

@nyancatflies @yisheng 可能确实有不同,但是中英文内容都在消失。我上面内容也是补充了一下文中说法,比如半年可见原因。

就马云这个例子,按文中说法就可以解释,应该经济因素主导。服务器关闭失效。数据可能还在,有备份什么的,只是网上找不到了。

像新浪有个微博,公司还在,还能看到很老的新闻资讯。即使如此,其中一些链接也失效了。如果未来有某个软件取代了微博,新浪公司倒闭,服务器关闭后,中文互联网可能会消失很多内容。

今日头条除了相关软件,互联网也索引不到。一些公司,个人或组织发布的新闻资讯网站,公司倒闭,服务器关闭,就消失了。

审查因素来看,马云应该不至于。

---

这个版权内容在互联网上消失,实际效果和仅半年可见差不多呀。数据当然还在,只是看不到了。扩大一下概念,版权和著作权等等,影响范围很大。比如商业作品, NBA 直播版权,每年春晚视频,不允许转载的视频,不允许转载的文章,付费知识,付费小说,不允许分流的游戏模组等等。很多转载之后不是那么合法,或者符合公德。

此外非法内容,不止是版权,例如 pornhub 前几年就删除了不少视频。再有就是极端言论,例如纳粹相关内容。

数据也都在,只是搜索引擎搜不到,或者网络上找不到。

@[email protected] 最好的体现是微信文章链接的 此内容因违规无法查看

@yisheng 长期来看,github也会消亡。建议是本地存一套备份。即便github消亡了,也有其他托管站。
另外,还得考虑格式的消亡。我的建议是越简单越好。用markdown甚至纯文本写作,最多加一点jpeg图片。

@yisheng 存储问题而已了,谁会一直存储着这些无法带来收益的数据。企业是肯定不会。有些企业都改朝换代了,存储坏了,没有人会花精力来做数据迁移和备份。

@livemoon @yisheng 就是你这类很短视的看法,只单纯注重所谓的经济价值,才会觉得过去的数据没价值。这不就是文章指出的问题?世界上有无数机构都致力于保留各种资料,怎么可能“没有价值”?各种历史人文研究的基础不就是基于过往数据的确凿和丰富吗?有有远见的政府和企业应该更明白数据的重要性,都会想办法备份。

@livemoon @yisheng 你到底有没有好好看这篇文章啊?实际情况恰恰就是明明重要的数据却被删除了。而且很多是因为政策原因,而不是因为数据本身不重要。

@livemoon 存储这些数据对于互联网公司难度并不大。 知乎就有人在2012年提出了问题『新浪微博每天几亿用户产生上万G信息是怎么储存的?』zhihu.com/question/20027364?ut

而回答结论也很简单,『预计2011年全年数据量为370T(未考虑压缩、备份和微盘等情况),一次性买1000T硬盘对新浪而言应该没什么问题吧』

哪怕是在2024年的今天,存储硬盘的花费并不大。微博增加的用户和存储的费用和微博自身的市值比较,存储费用是九牛一毛。反而是互联网企业根据用户的发布时间线、增加关键词黑名单、聘请专门的网评员审核这些才是耗费巨大人力物力的。而且几乎是没有穷尽的可能的,因为人们的词语创造力是无限的。百度把“傻逼”增加进了屏蔽名单,然后人们就用“伞兵”替代,再然后就是有人发文说用“伞兵”破坏了那些抗震救灾子弟兵感情。于是,“傻逼”一词又被放出来了。

其他平台如小红书是政治切割。而像微博这种天然的公共平台,一呼百应的效应是扩散的。针对限制屏蔽炸号力度也是一年胜过一年的。后来转战推特的李老师,人统计过他在微博转世了53次。除了微博还有哪个社交平台是如此难用针对用户?

在国外用户的储存数据非常值钱,谷歌就是拥有最大最多的用户储存数据。就是躺着赚钱,才能不停干各种关停业务。而国内因为官方的原因,那些随意发言的用户数据不仅赚不了钱,光是持有都是烫手山芋。除了少数巨头如腾讯能利用,其他如互联网企业都是能屏蔽就屏蔽,因为早些年的互联网蛮荒时代充斥太多了各种嘲笑点评时政帖子,审核删帖需要耗费的人力物力太多已不可能实现。索性才一次性全部隐藏或者删去。

@yisheng

大部份過去的文稿都被降採樣變成維基百科裡的一個條目,或者一個段落,或者就一句話。

對於像我們這類的非名人,就只能自行保存,這裡還留有我十九年前寫的日記:days.leonh.space/posts/pages/1

@[email protected] 互联网档案馆 2001 年才有了时光机功能, 这个时候中国互联网已经开始进入移动互联网了, 此刻开始网页被各种 App 取代, 供应这些内容的网页三大件开始变成一串串设计给各自客户端读的 JSON. 为什么不存, 难道是不想吗?
我还记得曾经有人想存档酷安上的东西, 最后被酷安主动反爬了. 同样有组织存了 Discord 里面这么多的公共数据, 第一时间就是打包出售.

https://www.landiannews.com/archives/103420.html

价值是相对的, 这有意义, 但是很难证明价值, 一家初创科技公司寿命不会再比互联网档案管长了, 我也只能想到买给 AI 公司练模型, 或者被收购, 然后被砍掉盈利困难的业务. 如今也很难再有一家互联网档案馆了.

互联网上的信息已经多到不能再多, 单论中文互联网如果真的在崩塌, 就和宇宙一样降维, 那也只是把物质和能量转移到了别的地方, 等着下一次宇宙大爆炸. 况且, 「中文互联网」本就是种 "身边统计学", 说的更难听的, 更宽广的世界里的互联网同样在崩塌.

@cxplay “互联网上的信息已经多到不能再多, 单论中文互联网如果真的在崩塌, 就和宇宙一样降维, 那也只是把物质和能量转移到了别的地方, 等着下一次宇宙大爆炸. 况且, 「中文互联网」本就是种 "身边统计学", 说的更难听的, 更宽广的世界里的互联网同样在崩塌.”

这个结论和现实中文社区讨论资源枯竭并不矛盾。而且真正的问题很明确,要保持一个系统长久运营,最大的难题是维护成本。而中文网站的数据和维护真的是非常高昂吗?恰恰相反,我认为线上数据和线下实体图书报刊维护成本根本不是一回事。线下你买堆满一房间的图书不知要花费多少金钱,同时还要有存储空间,同等面积堆放的书价比不过房价。而换成线上网站,一个u盘就可以装下和前者比较是十几甚至上百倍的电子书数量。而需要付出的仅仅只是硬盘和耗电还有散热等等维护问题。成本其实不算高。

另一个残酷事实是,作为一个十几亿人口的互联网大国,但熬过十五年仍持续运营的中文论坛寥寥无几。论坛用户的那点发帖量和真正社交网站产生的数据不能比较。属于是个人用户都可以承担论坛。但现实是你需要备案,不能随意上传盗版,有情色资源就要删帖,否则第二天网警就会找上门或者当地派出所请你喝茶。

如果论坛关闭是存储数据成本问题,那大量国内铁血论坛还有其他论坛就不会关闭。再抠门的用户也会捐一点钱续费服务器。我所在的长毛象实例假如站长说没钱续费服务器,不讨论别人,至少我会捐一点钱让实例继续运营下去。

现实就是铁拳不在乎用户,也不在乎其他,只希望清净让这些杂音闭嘴。这才是这篇文章被全网封杀的原因。

@[email protected] 那就不对了, 论坛也是一个社交媒体类型的站点. 都必须要有入账起码要维持收支平衡, 不然只能爱发电. 一个小论坛也许只是一个月几百, 但是中大型论坛一个月可就是上千上万, 谁来支付这个长期成本? 不可能指望有谁来同情用爱发电的人, 连非营利组织都要警惕财政赤字. 这还仅仅是最基本的计算资源开销, 社交媒体运营和内容审查都是要靠人力, 只要信息开始流动, 审查就已经开始了, 指望人人自我审查是根本不可能的事情, 除非让信息永远留在我们各自的硬盘和脑子里, 永远离线, 这样下来, "互联网" 也就真正死亡了. 垃圾信息, 暴力和恐怖主义, 性剥削, 盗版, 非法交易, 个人信息... 这些可不是国内才要人 "删帖" 的原因, 全世界的社交媒体都在这么做, 社交媒体不做也会有 ISP, 支付系统, 执法部门手把手 "教" 社交媒体怎么做.

在国内, 一个典型的例子就是天涯和 NGA, 天涯为什么会走到到如今这副濒临倒闭的模样, 而前后创立时间不差五年的 NGA 论坛为什么又能活到现在? 难道 NGA 有什么魔法能扛住天涯都受不了的, 是成本? 还是合规?
我认同大部分人分析的结论, 那就是天涯自己经营不善, 可以去了解一下 "天涯重启" 的时候他们又打算怎么重启的, 光靠情怀可救不了它了. 之于 "铁拳", 那只能说如果不是象牙塔里面的小群体, 只需靠用户或者其他慈善捐赠的资金运营, 根本无需参与市场竞争就能持续化发展, 而只要被卷入市场, 不管愿不愿意, 就必须要进入这个划定的 "八角笼" 里角斗. 说实话, 无限制格斗的血肉横飞那可比 "铁拳" 砸到这些实体身上精彩多了, "铁拳" 对市场之下的我们消费者来说可能会(更愿意相信, 绝对会)让这些实体带给用户无法理解的行为, 没有 "铁拳" 的市场里恶性竞争让所有人都玩不下去, 消费者理所应当地可以骂完这些公司再暗地里哀号 "铁拳" 是罪魁祸首. 吃不下这块市场的, 不屑于这块市场的, 在这块市场里输掉比赛的结局都是一样, 那就是遗憾离场.
这部分的问题还让 "客户" 和 "用户" 逐渐分离, 这是互联网公司中的奇特现象之一. 贯彻免费模式下的社交媒体早就已经明白了用户支付带来的收入根本不够覆盖支出, 更不要说如何盈利了. 这些免费模式和免费增值模式下的社交媒体真正的客户是品牌和广告商, 用户只是被用来交易的商品之一. 用户并不能带来直接的收益, 更不会也不能像商业客户一样承担同等风险, 平台又凭什么要为用户负责, 平台会难道会帮用户打官司? 平台都在成为 "避风港", 而不是 "防空洞". 用户直接产生的数据也许某一天真的能吸引来买家, 就如 Reddit, Stack Overflow 一样, 他们都会毫不犹豫地放手, 用户为此的反抗他们更会悄悄地镇压.

中文互联网热闹的社媒可多得是. 抖音, 快手, 小红书, 贴吧, 微博, 知乎, 这些过于大众, 被戏虐为 "粪坑", 而小众的社媒更多, 各种论坛只是不会让小众圈子之外的人轻易发现而 "出圈" 而已. 怀疑 "讨论资源枯竭", 不如去花时间找更合适讨论这些问题的地方, 另外可不是只有中国大陆之下的互联网才叫做 "中文互联网", 不是只有中国大陆的网友在用中文, 社区也是.

@yisheng 坚持必须自己有独立个人博客就是发现豆瓣给我禁言以后什么都干不了,连备份豆坟都不行,看了讨论觉得有域名和服务器也还是要继续按月下载数据备份,之前还在想下了新的旧的是不是干脆删了,现在还是留着吧…

@yisheng 刚在别的地方看到抽屉也要关停了(类似煎蛋的一个网站

@yisheng 我好奇,用谷歌搜索了一下马云,结果是几千条,不是文章中说的一条。考虑到2000年左右我刚拨号上网,那时候互联网可没有现在这么多内容

@maplesugar2020 这只是一个极端案例。我认为作者举例马云并不恰当,但这确实引发了大量人关注讨论。大量国内网站论坛被迫停止都是存在的。你可以说像铁血军事论坛这种会激发民粹,但这不是去直接关停的理由。因为同样的理由可以封停任何一个社区。论坛讨论在国外依然很高,很多问题甚至只有去论坛发帖问才有人回复。而ai根本解决不了实际生活问题回复。事实上,gpt早期语料来源就是reddit论坛。靠超多语料超高质量训练出来ai。而国内论坛靠谱太少,nga机器人,s1巨魔遍地。有高质量讨论的v站仅仅是因为被官方墙了,站长和服务器在国外。但自然讨论政治会被站长删帖移入“水深火热区”。

国内的语料因为敏感词各种禁令还有不能提及其他社区的名字,使得有大量普通人的微博语料毫无参考训练价值。用微博训练ai,只能训练出来阴阳怪气的厕妹或者孙狗。用知乎训练只能训练出“且听龙吟”的意淫怪。反而是用“弱智吧”的语料训练最好。正常说话讨论的社区对于训练人工智能最大这点是想不到的。

好好说话记录讨论的社区可以拥抱Ai科技大爆发的未来。而封禁举报销号的社区只能迎接6亿人的平均月收入为1000元左右的现实。

@maplesugar2020 @yisheng 限定了作者所引的时间范围后谷歌确实只能搜出一页,而且多数为低效信息。拨号上网时代搜狐中华网网易新浪几大门户当时每日的新闻量就已经很可观了,而且小广告满页飞,绝不应该只有这么一点。

@yisheng 同人女可能是对互联网信息消失最敏感也最因之痛苦的一批人……我时常回忆起一些同人文的片段,但是当年的网站早已不存,作者已消失在人海,甚至连有共同记忆的同好都找不到,那些美丽的文字从此只存在于我模糊的记忆里,直到连我自己都忘记。

@yisheng 所以要写一部关于2000-2003互联网时代的小说现在全靠硬盘里的word资料

好家伙,原来联邦网络能发这么长的动态@[email protected] 

鹽鹼地容不下什麼有價值的思想,圖書館擺滿圖書卻找不到一本可讀的,電視上數百個頻道卻找不到一個可看的,有一億主播在直播不停製造內容,娛樂致死也正適合閱後即焚,垃圾場裡的垃圾不管焚燒還是掩埋都會污染環境。有人把任,馬等的文章奉為瑰寶,大概是被民族主義的驢蹄子把腦袋踢傻了

@yisheng 确实英文世界显然也有这个问题,但还能搜到92-95纽时、时代周刊、纽约客,甚至还有NPR,对比尔盖茨的报道。这些我猜测应该是这些组织建站以后用回溯的方式数据化并追加到网站上的。

@yisheng

互聯網帶來的信息爆炸式增長特性也是信息消失的根本原因之一, 增長的快,消失的也快. 另外電子信息無法像傳統書籍報紙照片等實質載體可以在現實存在,也是原因吧.

@yisheng

從近代以來國人似乎一直就沒學會保存歷史, 旁邊的日本就很重視保存,各地都有"影像社"這樣的機構和公司, 每年都到處拍照拍視頻,自己保存,你想找哪年的哪個地方的影像都有.可用於拍攝新聞回顧, 或者用於影視裡的舊鏡頭等等, 國內似乎沒見到這樣的機構. 當然也可能有,我不知道而已.

Sign in to participate in the conversation
alive.bar

你好,欢迎使用 alive.bar 社交媒体实例。 alive.bar 仅仅是一个服务器位于美国的网站,它使用了「长毛象(Mastodon)」服务。