密西根大学发布基于Google的数字化项目

ZDNet 存储时代频道 更新时间:2008-04-09 作者:存储时代/李泉(编译) 来源:

本文关键词:集群 复制 RAID Isilon 图书搜索

密西根大学发布消息称将与Google和Isilon一起,完成一项为期六年,实现400TB书籍数字化存储的宏伟项目。

这一“密西根数字化项目”(Michigan Digitization Project)将为该大学750万本书籍制作数字副本,并储存在Isilon提供的大型集群存储系统中。该所大学将把数字化内容与Google的图书搜索(Book Search)项目相连起来。

Google图书搜索项目于2006年启动,旨在为所有语言的各种书籍创建虚拟图书索引卡。图书搜索的设计与普通网页搜索类似,同时为不受版权限制的数字化旧版书籍提供链接。

密西根大学图书馆副馆长John Wilkin表示:“Google图书搜索的参与使得该项目变得尤其宏伟——与Google合作,我们能够实现数百万卷书籍的数字化,免去了爬遍书架翻找书籍的麻烦。”

Wilkin称Google会先扫描大学的藏书,然后把一份副本归还密西根大学,然后留一份副本供图书搜索使用。

每一本数字化图书文件大小约为55MB,下载速度为3Mbps,一周七天全天24小时均可下载。“没有Google的支持,我们永远做不到这点。” Wilkin表示,如果由大学负责扫描书籍,每年只能扫描约15000册图书。

为满足容量激增的数字数据,Wilkin和他的团队去年秋季采用了Isilon共计200TB容量的集群存储系统。32 IQ 9000和EX 9000两个系统分别设在密西根大学位于安娜堡的主数据中心和印第安纳州布鲁民顿市的灾备站点中,通过Isilon的SyncIQ复制软件相连。

“我们希望能将我们文化遗产的载体长久保留下来。”Wilkin说道,并表示图书馆的藏品中还有存世稀少的乔塞《坎特伯利故事》诗作以及二十世纪初期艺术藏品。

这位副馆长表示,Isilon提供的硬件取代了之前采用不同厂商RAID系统组合的方案。“这是一个整体规划——几百Tb的数据全放在一个地方储存的时候,必须确保优秀的存储管理,”他说道,“在过去,即使是我们最好的RAID系统,也总是不停出问题,经常让我们疲于奔命。”

Wolverines的RAID系统现在已经转移到该所大学IT基础设施的其他部位了,Wilkin已经开始考虑扩展Isilon的集群系统。

密西根大学及其研发合作伙伴印第安纳大学将在Big Ten大会上向其他学府推广这一数字化项目。“等更多图书馆加入了这个项目,累积下来的数据容量很可能会超过400TB。数据会持续增长,我们每年,或者每半年都要扩充其他东西。”

Wilkin对密西根大学与Isilon此次合作的合同价值不甚了解,但他估计密西根数字化项目的成本应在每年110万美元左右。“这只是硬件、站点和耗电成本,不包括人力和管理方面的费用。”

密西根大学并非目前唯一对存储技术采取积极措施的学府。位于休斯顿的莱斯大学(Rice University)今天宣布了一项合作协议,拟采用66TB的Isilon IQ-9000和IQ-200为其音乐学院和詹姆斯•贝克公共政策研究中心(James Baker Institute for Public Policy)的提供数字化存储。

用户评论

  • 用户名
  • 评论内容
技术关注
当前技术类目:
存储管理本类技术关注比例:
19存储关注排行:193
97企业级技术关注度:97--

存储频道 数字化 最新报道

存储频道 Google 最新报道

爱卡汽车网 | CNET科技资讯网 | CWEEK | 蜂鸟网 | GameSpot China | 个人电脑 | 开发者在线 | PChome | Solidot | SPN |
投影顾问网 | 万维家电网 | 网友世界 | 西域IT | ZDNet China | 中关村在线 | 中小企业成长网
CNET Networks
Copyright © 1997-2007 CNET Networks 版权所有。 ZDNet 是CNET Networks公司注册服务商标。
中华人民共和国电信与信息服务业务经营许可证编号:京ICP证010391号