阿里云GPU服务器怎么买-阿里云GPU服务器租用价格

阿里云阿里的云服务可以说是琳琅满目,看到人眼花缭乱。不过今天我们只关注阿里云GPU服务器。

为了写这篇文章还消耗了几百人民币,中途一不小心入了一个坑,还好最后成功跑了起来,并且简单测试了一下阿里云上的P4和V100,V100是真的快,火箭一般的速度。

下面我就分享一下这两天使用阿里云GPU服务器的经验。

如何购买阿里云GPU服务器?

阿里云GPU服务器购买地址 https://www.aliyun.com/product/ecs/gpu
打开购买地址,选择不同的配置,就可以实时查看当前配置的服务器价格,非常简单。
因阿里云GPU服务器配置以后会有变化,下面讲的配置可能和以后阿里云显示的配置不太一样。
打开后可以看到,默认推荐的为GN6(V100) , 后面还有P100, P4,M40,S7150。还能看到这些服务器可以用来干嘛:AI深度学习,视频处理,科学计算,图形可视化。我们的目的简单明了,为了跑DeepFaceLab,直接点击P4(最便宜) 进入购买。

阿里云的付费方式有三种,包年包月,按量付费,抢占式实例。包月的话大概一个月几千块。按量的话,几十块一个小时。
我这里选的是包年包月,因为包年包月便宜有。按量付费实际上很贵的

很多人会发现其中有一个GPU虚拟化型特别便宜,那么到底好不要用呢?用血的教训告诉大家,这是坑,不要入。为了演示我跳坑的血泪史,我这里选了GPU轻量(你们直接选GPU计算型下面的P4),其他基础配置。下面的配置不管你选的那个型号都是一样滴。

镜像:选公共镜像,windwo server 2016数据中心版64位中文版。
存储:高效云盘,50G (实际使用100G要的。
网络与安全可以全部默认,直接下一步。
系统配置:这一步主要是输入登陆密码。 这个密码就是操作系统的登陆密码,账号统一为:Administrator
分组设置 可以全部默认
确认订单可以全部默认

创建实例
出现绿色的创建成功 ,就证明你已经完成了。可以点击管理控制台进入后台
后台注意顶部的分区,如果选错分区这里什么都看不到。左侧选择实例。右侧显示实例列表
列表中可以看到核心配置,公网IP,右侧有管理远程连接

如何连接阿里云GPU服务器?
连接云服务器也分两种方式,一种网页连接,一种远程桌面。

1.网页连接阿里云GPU服务器
登陆阿里云管理控制台,找到你买的服务器,点击远程连接,跳出一个窗口,告诉你了一个连接密码,这个密码只会出现一次,如果你以后需要使用这种方式连接,记得把这个密码记录下来。
输入这个密码,确定立马开始连接。显示Windwo的启动后的界面此时点击左上角发送远程命令,发送Ctrl+Alt-Delete命令解锁。输入自己设置的密码,即可登录系统。
登录后可以查看下计算机的系统信息,
显示系统为 Server 2016 Datacenter,
处理器 Xeon E5-2682 V4, 2.50Ghz,
内存 6GB

方法2:远程桌面连接阿里云GPU服务器(推荐)
远程桌面是Windows系统自带的软件,通过快捷键WIN+R,调出运行
输入mstsc 确定,启动远程桌面。
输入服务器的外网IP地址,点击连接
输入账号:Administrator
密码:自己想,就是前面设置的。
勾选,记住我的凭证
确定
勾选,是(Y)
登录成功,同样可以看一下系统信息。阿里云相比滴滴云是贵了不少,但是在上面下载东西是真的快,包括这个远程桌面链接也很稳定,操作几乎不存在延时(杭州-北京)。

如何使用阿里云云GPU服务器?
登录之后就可以开始后续的配置了。正常情况下,可以通过自带的IE浏览器下载所需的软件。
DeepFaceLab软件(必须)
N卡驱动(必须)
Chrome浏览器(可选,用着爽)
QQ(可选,下软件,传文件)
迅雷(可选,下软件)
GPUZ (可选,查看显卡信息)

下载QQ,迅雷,GPUZ这些大家肯定都会的,去官网下载就好了。可能会遇到的问题是,IE会拦截,不让你下载。此时只需把网址添加到信任列表就好了。

DeepFaceLab软件我是通过登录QQ,打开群,从群文件中下载的,阿里云的速度很快,一下子就下完了。
我也尝试过用Pandownload,但是遇到了各种问题,浏览器内核下载失败,无法登录,只能放弃了。

N卡驱动下载:https://www.nvidia.cn/Download/index.aspx?lang=cn
我选的是P4,,搜索,下载即可。
下载之后双击安装立马出错,我一头雾水,尝试下载了CUDA tookit 10.1,安装成功,但是依旧无法使用DFL。

这就是我前说的坑,因为选了虚拟化GPU,驱动装不上,显卡识别不出来。
倒腾了很久才意识到问题所在:贪便宜。只能重新创建了一个实例,问题立马解决。真的不要贪便宜...会吃亏的。浪费了时间,浪费了钱,还浪费了好心情。
驱动安装成功,一切就是按部就班了。DeepFaceLab 具体的使用方法,参考之前的文章,云端和本地使用方法没有任何差别。
阿里云P4跑H128的速度大概就是这样了

说好了,上云是为了大显存,为了快。光演示P4肯定是不行的。所以又搞了一台V100,显存16G

作为云端最强,V100不负众望。有2080ti的可以对比下速度。
V100 跑H128一个迭代只需要135ms
BS开到32很轻松,单次迭代只需0.5秒。这速度比P4快了可不是一点点。
即便是SAE256也不是问题,启动后一个迭代的速度为750ms
既然用了阿里云,就果断开V100了(不要一下搞8张V100哦,DFL不能并行使用),实在不行搞个P100也好,要显存大的话开M40 24G 。
阿里云有高配显卡,网络速度快等优点

阿里云还有一个优点就是可以一对一分享镜像,有了镜像就不需要各种下载,各种安装,各种配置了,各种等待,只需通过镜像直接创建一台云服务器,远程登录之后直接使用DeepFaceLab软件,这样一来即便你不会装环境也可以轻松上云了。