数据激增让美国国会图书馆不堪重负

ZDNet存储频道时间2008-04-10作者:存储时代/李泉(编译)来源: |
本文关键词:SNW Google IBM 磁带 数据中心
如果你觉得不断增加的庞大数据量已经让你的公司疲于应付,那么请放心,美国国会图书馆也是你的难友,持续激增的信息量已经让国会图书馆非常头痛,急于谋求出路。

国会图书馆副馆长Laura Campbell以德国活版印刷发明人谷登堡打比方,表示:“数字化革命带来的影响完全能与500多年前谷登堡的发明相媲美。”

美国国会图书馆拥有208年的悠久历史,450种语言版本的藏书超过1.38亿册,手稿、地图乃至录音资料都收录其中,但互联网时代的到来,为该图书馆带来了新的难题。

在昨天上午的演讲中,Campbell说道:“据我们估算,当今数码时代每15分钟出现的信息量之庞大,已经相当于国会图书馆目前所持有的数据和信息总和。图书馆再也扮演不了包罗万有的角色了。”

从电视节目到网页乃至地球成像和电子文档,Campbell都需要与她的团队一起为国会图书馆制定一整套新的保存策略。

该图书馆的基础设施内储存着超过500Tb的数码资料,所有数据分布在三个数据中心里,所采用的存储技术更是种类繁多,让人眼花缭乱。“我们把所有类型的数据存储技术都用上了,在线存储、近线存储和磁带存储一个都不少,”她说道,“其中,近线和在线存储占了将近一半的比例。”

尽管存储成本正逐步降低,国会图书馆还是要面对几乎无限的数据量,她不得不向诸多政府部门和商业机构寻求合作以期解决存储问题。

除了帮助图书馆设计存储系统、打造专用的保存工具之外,图书馆还要在保存数据的取舍方面寻求援助。

“我们最需要的是具有各方面技术实力的合作伙伴,从学术团体到科技企业我们都很欢迎,”Campbell说道,“可以这么说,众人拾柴火焰高。”

该图书馆初步合作项目之一就是与美国电影艺术与科学学院合作的“Preserving Creative America”。另一个重要数字保存项目是National Alliance for Content Stewardship,共有100个州立单位和商业团体成为其合作伙伴,所保存的数码资料容量已达300Tb。

Campbell称:“到2013年,数据量会增加到650Tb。”她还表示,国会图书馆还与微软和Google建立了合作关系,后者还参与了密西根大学宏伟的图书数字化项目。

虽然Campbell承认数字保存“并不漂亮”,但她还是希望存储厂商能帮助图书馆解决数据问题。“第三方存储对我们而言是不可或缺的服务。我希望各位厂商能关注这一问题,与我联系,加入我们的项目。”

在昨天的SNW大会上,这位国会图书馆副馆长并不是唯一一个提出数字保存难题的人。在另一场演讲中,IBM系统存储业务总经理Andy Monshaw说道:“在欧洲我拜访了一座规模很大的国家图书馆,他们甚至还在利用早已失传了的技术保存不少资料。”

“他们正在想办法克服这个难题。关键在于如何保存,而采用的保存方式又是否能经得住时间的考验。”

用户评论
  • 评论列表
  • 本篇文章共有 0 条评论
用户名
评论内容
发表时间
- 发表评论 -
匿名
注册用户
百度大联盟认证黄金会员Copyright© 1997- CNET Networks 版权所有。 ZDNet 是CNET Networks公司注册服务商标。
中华人民共和国电信与信息服务业务经营许可证编号:京ICP证010391号 京ICP备09041801号-159
京公网安备:1101082134