分布式存储数据恢复设备清单及基本描述
初检方案及过程
存储数据恢复初检方式:根据与客户电话沟通及现场检测,按故障表现,作如下判断:
故障表现:客户共配置16台服务器节点,在每台物理服务器存储上,有大约3台左右的虚拟机,在虚拟机上配置的分布式,上层部署的hbase数据库和hive数据库,数据库底层文件删除,导致数据库不能使用。
数据恢复概率预判:
经过现场对客户环境的简单检测,虚拟机还可以正常启动,虚拟机里面的数据库块文件有丢失,块文件丢失之后,没有对整个集群环境在进行数据的写入,底层的数据损坏可能性会比较小。
综上所述,由于在删除之后,没有在继续写入数据,具有较大的可恢复性,但是由于现阶段还没有对底层结构进行分析,再加上hbase和hive的算法和底层结构十分复杂,具体的恢复概率无法判断,还需在之后具体的数据恢复过程中才可以知晓。
分布式存储数据恢复服务流程
1、前期备份流程
A、从物理服务器存储底层做备份,将原存储设备断电、关机。
B、从虚拟机层面备份,通过网络直接备份虚拟机底层磁盘文件。
C、准备一台恢复操作服务器(北亚提供),在数据恢复平台上以只读方式挂载服务器硬盘,使用北亚磁盘备份工具(或 dd等工具)进行完整的扇区对扇区的备份。
D、备份完成后,提供详细报告,涉及威信的健康状态及可能存在的坏道列表。
E、将服务器硬盘交回给用户(建议原样恢复),之后不再直接操作原介质。
2、服务器存储块文件结构分析
A、对每个虚拟机磁盘的块文件进行分析;
B、分析文件底层的聚合方式;
C、分析每个磁盘中数据的分布情况;
3、Block文件key分析
A、定位数据库文件中的key信息;
B、提取并解析数据库文件中key信息;
C、整合数据库文件key信息。
4、Block文件拼接
A、根据Block文件的key信息提取文件片段;
B、对Block文件的片段进行拼接;
C、校验拼接后的Block文件的正确性。
5、Block文件导入
A、校验提取出的Block文件完整性及正确性;
B、把提取出来的Block文件导入到hbase和hive数据库中;
6、服务器存储数据恢复结果验证
A、由用户主导对数据本身进行详细验证。
B、如发现新问题,重新检验上述所有数据恢复过程。
数据恢复服务承诺
1、整个过程不会对客户的原盘有任何的写操作,以确保原盘的数据安全
2、尽最大可能保证服务的操作可逆,确保人力可控范围内操作可回溯。
3、提供后期数据保管和服务跟踪。
4、以上所有操作在有备份的情况下进行,若不成功不影响其他方案继续。
数据恢复周期预估
说明:总时间控制在20个工作日,上表中的时间只是预估,以实际情况为准。
分布式存储数据恢复成功率预估
数据安全救援的可靠度应超过 80%。参考:2020年全年企业级数据安全救援的最终成功率为 84.3%。因不存在同步及基本可排除的硬件故障。