编辑
2024-01-25
分享
00
请注意,本文编写于 376 天前,最后修改于 261 天前,其中某些信息可能已经过时。

目录

介绍一下这个非常非常重要和有用的"互联网档案计划"。
都说互联网是有记忆的,弥补人类记忆的短暂。
一、电子书
二、网页
三、视频
四、音频
五、软件
六、教育材料

介绍一下这个非常非常重要和有用的"互联网档案计划"。

就像它的名字一样,这个计划的目的就是为互联网保存一份档案。在它的网站上,它这样介绍自己:

Most societies place importance on preserving artifacts of their culture and heritage. Without such artifacts, civilization has no memory and no mechanism to learn from its successes and failures. Our culture now produces more and more artifacts in digital form. The Archive's mission is to help preserve those artifacts and create an Internet library for researchers, historians, and scholars. The Archive collaborates with institutions including the Library of Congress and the Smithsonian.

大多数社会都非常重视保护文化遗存。如果没有这些遗存,那么人类就将失去记忆,无法从过去的经历获得启示。如今,越来越多的文化遗存以数字格式出现。"互联网档案计划"的使命就是保护这些数字遗存,为人类创造一个互联网图书馆。我们的合作单位包括国会图书馆和史密森学会。

都说互联网是有记忆的,弥补人类记忆的短暂。

你有没有想过,很多年前你曾浏览过的网站或某个网页,如今,即使那个网站已经倒闭,页面已经删除,或者,你访问某个网页,页面上显示一个大大的404 --- 因为某种原因页面已经被管理员删除了。

现在,凭着你的记忆,你还可以将它回来,继续浏览。

archive.org 就是这样的一家机构,靠捐款在运营的一家公益组织。

image.png

他们在首页上这样介绍自己:

Internet Archive is a non-profit library of millions of free books, movies, software, music, websites, and more. Internet档案馆是一个非营利性图书馆,包含数百万本免费书籍,电影,软件,音乐,网站等。

保存网站只是他们是他们的功能的一部分。 你可以上找面找到无数在中文互联网上已经失传的书籍,短片 ,论文资料。甚至应用程序

这个服务,很酷的是,到目前为止,它已经保存了8630 亿个网页(截止2024年1月)

在保存内容有:

  • 8630 亿个网页
  • 4100 万册书籍
  • 文本1470万 录音(包括240,000场现场音乐会)
  • 840 万个视频(包括 240 万个电视新闻节目)
  • 440 万张图像
  • 890,000 个软件程序

主要特色是其能够以多个时间点快照的方式保存网页。你可以在不同时间点查看特定网页的旧版本,了解在过去某一时刻该网页的内容和布局。时光机:用户可以输入一个网址,然后选择特定日期,以查看在那一天的网页样貌。网页保存:互联网档案馆定期抓取互联网上的网页,将其存档以备将来查看。多媒体资源:除了网页,互联网档案馆还保存了许多其他类型的数字内容,如音频、视频、图像等。文献馆藏:互联网档案馆包含了数百万份数字化的书籍、期刊、音乐和影片等文献。研究资源:研究人员可以使用互联网档案馆的内容进行学术研究,了解互联网发展的历史,也可以访问以前的网络内容以进行比较研究。免费访问:大部分互联网档案馆的内容都是免费提供的,任何人都可以访问。

目前,"互联网档案计划"分为六大部分:

一、电子书

网址:http://www.archive.org/details/texts

这个部分,我以前已经介绍过了,它专门收集公共领域的书籍和文档,任何人都可以免费下载。截至到今天,共有29万多种材料,堪称互联网上最好的公共领域图书搜索引擎。

它主要收集英语书籍,但也包括少部分其他语种的书籍,比如朱熹的《论语集注》。

二、网页

网址:http://www.archive.org/web/web.php

这个部分有个专门的名字,叫做"时光倒流机器"(Wayback Machine),它像收集旧报纸那样收集旧网页。举例来说,Yahoo!的首页就有5000多份档案,最早的可以回溯到1996年10月17日,最近的则是2007年8月30日。

要将全世界的网页都保存下来,这需要多大的存储容量啊?根据2006年的统计,当时Wayback Machine的存储容量有2000T,然后还在以每月20T的速度增加。

三、视频

网址:http://www.archive.org/details/movies

这个部分收集视频材料,你在其中可以找到动画片和电影。我感觉内容还不算很丰富,不过在其中经常可以找到有趣的内容,比如《如果抵御僵尸的袭击?》和1951年的好莱坞喜剧片《皇家婚礼》。

四、音频

网址:http://www.archive.org/details/audio

音频材料主要是有声书籍和音乐。比如,你可以免费下载世界名著《简爱》的MP3,以及巴赫的《 C小調第4奏鸣曲》等等。

五、软件

网址:http://www.archive.org/details/software

软件也是人类文化的一部分,保存旧软件同保存旧书一样,都是很有意义的。我在上面发现了Photoshop 6.0的DEMO版和Winamp 5.0。

六、教育材料

网址:http://www.archive.org/details/arsdigita

这部分主要是美国大学课程,有视频和文字材料下载,相当于不去北美就可以上那里的课,比如麻省理工学院的《微分方程》和Naropa大学的《艾伦·金斯堡的诗歌》。

本文作者:Casear

本文链接:

版权声明:部分来源于网络搜集,部分来源于阮一峰的网络日志