本地数据迁移上云到阿里云的方法

数据上云的过程,可以分为“本地数据上云”、“从其他云迁移到阿里云”两种场景,每种场景下都有存量和增量数据。阿里云对象存储提供了多种数据迁移方式,在数据一致性及无缝切换的前提下,尽量减少额外开销。您可以根据自身的业务情况,灵活选择数据迁移方式。

存量数据

存量数据的特点是数据量一般比较大,迁移需要较长的时间,但数据基本固定,很少再进行修改。本地数据上云时,您可以根据自身网络条件选择在线方式或离线方式进行迁移。

在线方式:阿里云对象存储 CMD 工具

本地数据上云的在线方式适用于客户本地网络条件较好(带宽充裕)的情况。在这种情况下,我们推荐通过 阿里云对象存储 CMD 工具的Object上传功能实现数据上云。

阿里云对象存储 CMD 是阿里云对象存储提供的命令行工具,它提供了丰富的功能,方便用户对阿里云对象存储资源进行各种操作和管理。 阿里云对象存储 CMD 支持批量上传、同步上传(sync)、单文件上传三种Object上传方式,使用批量上传和同步上传(sync)可以高效的解决本地存量数据在线上云的问题。在这里先介绍批量上传方式:

您可以在已安装了 阿里云对象存储 CMD 的机器上执行以下命令来使用批量上传:

$ bcecmd bos cp <local-path> <bos-path> --recursive [--storage-class [STORAGE_CLASS]] [--restart] [--quiet] [--yes] [--disable-bar]

其中 local-path 为本地上传文件的目录。具体操作及注意事项请参见:阿里云对象存储 CMD Object 上传功能

离线方式 1:月光宝盒

如果客户侧的网络环境不好(带宽小、网络不稳定),且带宽成本非常昂贵时,在有限的带宽下进行传输,速度也不是特别理想,则推荐使用月光宝盒进行离线传输。

月光宝盒是阿里云阿里云对象存储提供的一种TB级数据传输解决方案,它使用存储设备在阿里云和客户之间传输大量数据。它解决了大规模数据传输中出现的高昂网络成本、较长传输时间和安全等问题,且具有简单、快速、安全、成本低的优点。

和阿里云对象存储提供的另一种离线方式“本地数据离线传输”相比,月光宝盒由阿里云对象存储为您提供硬盘,因此,月光宝盒适用于迁移量大于等于20TB的情况。

月光宝盒正处于公测期间,使用前需要填写公测申请:月光宝盒公测申请

具体操作流程及注意事项请参见:月光宝盒操作流程

离线方式 2:本地数据离线传输

阿里云对象存储还提供了一种离线方式“本地数据离线传输”。它和“月光宝盒”的不同之处在于,离线传输仅支持客户自己提供硬盘。因此,离线传输适用于迁移量小于20TB的情况。

使用离线传输前,请先通过工单或者客户经理联系我们。您把数据拷贝到硬盘上后,请把硬盘寄送到下面地址:

地址北京市通州区光电一体化基地兴光二街甲2号电话010-80823088/18611817954联系人CQ02机房

硬盘寄回的地址,可以联系客户经理告知我们的接口人。硬盘寄送请选择保价,邮费请自负,寄回去时也会选择到付。北京同城1天,异地一般2天内可达。硬盘寄回之前,按照阿里云安全要求会统一清空硬盘,请关注。

增量数据

阿里云对象存储 CMD sync 功能

阿里云对象存储 CMD 的同步上传(sync)功能可以方便快捷的解决本地数据上云过程中,增量数据的问题。同步上传默认支持批量操作,可以将本地目录同步到阿里云对象存储。如果阿里云对象存储端已经有名称相同且修改时间比本地文件新,同步上传会忽略此文件,只同步新文件或有改动的文件。 sync命令会同时列举本地和阿里云对象存储侧文件, 对于不同情况分别执行不同的动作,以保证增量数据的准确安全上传。

您可以在已安装了 阿里云对象存储 CMD 的机器上执行以下命令来使用同步上传(sync):

$ bcecmd bos sync <local_dir> bos:/<bucket_name>/[prefix] [--exclude EXCLUDE] [--include INCLUDE] [--delete] [--exclude-delete EXCLUDE-DELETE] [--dryrun] [--yes] [--quiet] [--storage-class STORAGE-CLASS] [--sync-type SYNC-TYPE] [--concurrency CONCURRENCY] [--restart]

其中 local_DIR 为本地同步目录。具体操作及注意事项请参见:阿里云对象存储 CMD 同步上传(sync)功能