跳到正文
Back to Feed

总结

互联网档案馆存档逾万亿网页,拥有约99PB唯一数据,连同备份与冗余总量超212PB。其依靠定制服务器PetaBox实现高密度、低成本、低功耗存储,采用JBOD磁盘阵列,并以软件而非昂贵RAID控制器处理数据冗余。PetaBox自2004年投用以来多次迭代:首代单机架100TB、功耗6kW;2010年第四代配240块2TB硬盘与至强处理器;最新一代单机架可达1.4PB。机房利用环境空气冷却,允许更高温运行,并回收磁盘余热用于冬季供暖。

正文

互联网档案馆存档了逾万亿个网页,99PB 唯一数据,如果加上备份和冗余则超过 212PB。它是如何做得的?互联网档案馆的核心是被称为 PetaBox 的定制服务器,现成的服务器通常价格昂贵且耗电巨大,PetaBox 设计具有高密度、低成本和低功耗的特点,使用磁盘矩阵(Just a Bunch of Disks)而非昂贵的 RAID 控制器,用软件而非硬件处理数据冗余。第一代 PetaBox 于 2004 年 6 月投入使用,每个机架存储 100 TB 数据,功耗 6 千瓦。第四代 PetaBox 于 2010 年推出,每个机架包含 240 块 2TB 硬盘,使用英特尔至强处理器。最新一代的 PetaBox 每个机架能储存 1.4 PB 数据。它的机房利用周围环境空气进行冷却,没有使用传统的空调,服务器设计能运行在较高的温度上,磁盘产生的余热会被收集和循环利用,冬季能为大楼供暖。
发布时间: