分布式存储恢复hbase和hive数据库报告

  • Post author:
  • Post category:其他


分布式存储数据恢复设备清单及基本描述

北亚数据恢复中心分布式存储服务器数据恢复过程


初检方案及过程

存储数据恢复初检方式:根据与客户电话沟通及现场检测,按故障表现,作如下判断:

故障表现:客户共配置16台服务器节点,在每台物理服务器存储上,有大约3台左右的虚拟机,在虚拟机上配置的分布式,上层部署的hbase数据库和hive数据库,数据库底层文件删除,导致数据库不能使用。

数据恢复概率预判:

经过现场对客户环境的简单检测,虚拟机还可以正常启动,虚拟机里面的数据库块文件有丢失,块文件丢失之后,没有对整个集群环境在进行数据的写入,底层的数据损坏可能性会比较小。

综上所述,由于在删除之后,没有在继续写入数据,具有较大的可恢复性,但是由于现阶段还没有对底层结构进行分析,再加上hbase和hive的算法和底层结构十分复杂,具体的恢复概率无法判断,还需在之后具体的数据恢复过程中才可以知晓。

分布式存储数据恢复服务流程


1、前期备份流程


A、从物理服务器存储底层做备份,将原存储设备断电、关机。

B、从虚拟机层面备份,通过网络直接备份虚拟机底层磁盘文件。

C、准备一台恢复操作服务器(北亚提供),在数据恢复平台上以只读方式挂载服务器硬盘,使用北亚磁盘备份工具(或 dd等工具)进行完整的扇区对扇区的备份。

D、备份完成后,提供详细报告,涉及威信的健康状态及可能存在的坏道列表。

E、将服务器硬盘交回给用户(建议原样恢复),之后不再直接操作原介质。

北亚数据恢复中心分布式存储服务器数据恢复过程



2、服务器存储块文件结构分析


A、对每个虚拟机磁盘的块文件进行分析;

B、分析文件底层的聚合方式;

C、分析每个磁盘中数据的分布情况;



3、Block文件key分析


A、定位数据库文件中的key信息;

B、提取并解析数据库文件中key信息;

C、整合数据库文件key信息。



4、Block文件拼接


A、根据Block文件的key信息提取文件片段;

B、对Block文件的片段进行拼接;

C、校验拼接后的Block文件的正确性。



5、Block文件导入


A、校验提取出的Block文件完整性及正确性;

B、把提取出来的Block文件导入到hbase和hive数据库中;



6、服务器存储数据恢复结果验证


A、由用户主导对数据本身进行详细验证。

B、如发现新问题,重新检验上述所有数据恢复过程。

数据恢复服务承诺

1、整个过程不会对客户的原盘有任何的写操作,以确保原盘的数据安全

2、尽最大可能保证服务的操作可逆,确保人力可控范围内操作可回溯。

3、提供后期数据保管和服务跟踪。

4、以上所有操作在有备份的情况下进行,若不成功不影响其他方案继续。

数据恢复周期预估

北亚数据恢复中心分布式存储服务器数据恢复过程

说明:总时间控制在20个工作日,上表中的时间只是预估,以实际情况为准。

分布式存储数据恢复成功率预估

北亚数据恢复中心分布式存储服务器数据恢复过程

数据安全救援的可靠度应超过 80%。参考:2020年全年企业级数据安全救援的最终成功率为 84.3%。因不存在同步及基本可排除的硬件故障。



版权声明:本文为beiya123原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。