我所在的(小)公司需要从国外的服务器下载一个数据集,总数据量在 5TB 左右,受国内渣渣网络的原因,直接下载速度太慢,而数据下载(目前看起来)是可以直接用 http 反代的,所以需要有一些更有效率的代理中转方案。
目前我想到的方案是:阿里云的 1CPU , 1GB 内存, 5Mbps 带宽 ECS 三台并行下载。
5Mbps 带宽是因为带宽阶梯计价, 5Mbps 之后带宽单价变高,且受网络连接能力限制,即使有更高的带宽也不一定能实现满速,不如多台分别下载。云主机数量是考虑到了公司本身的下载带宽。反代工具使用 nginx ,用 python 生成 url ,下载用 python 的 requests 库(因为都是 windows 机器,装 wget 或者 curl 略麻烦)。不知道有什么更好的建议吗?
P.S. 其实 linode 东京的速度试了一下也还好,而且更便宜,但是没有发票……
感谢大家的回复,我在文中说得有一点乱,所以把现有的一些情况再整理一下:
下面回应一下我对一些方案的想法:
选择按流量计费?
外包代下载?
网盘中转?
虽然已经意识到最大的短板是本地下载带宽了,我个人是比较希望大家能够继续提出意见,多谢!
|  |      1SkyEcho      2016-05-24 18:52:03 +08:00  3 国际快递 | 
|  |      2Showfom PRO  2 Window   s 下用 IDM 多线程下载更快 我就晚上下载下载 一个月不到就塞满我 6T 硬盘了 阿里云还是 G 口 要是很赶时间那就让机房寄硬盘吧 | 
|  |      3Showfom PRO 这个业务可以包给我 我帮你们把数据放在香港的服务器里 你们本地开 10 个线程下载拖回来就是了 | 
|  |      4halczy      2016-05-24 18:57:58 +08:00  1 找个多线程下载的软件就可以了,例如 JDownloader , Aria2 等。你开 10-20 线程来下,国内网络还不至于烂到 15Mbps 都跑不过。 | 
|  |      5seki OP @Showfom 主要是公司网络本身也没这么快。可能的确要考虑在公司之外下载了。 我自己下的话估计也有办法,但是涉及到费用报销的问题……麻烦 | 
|  |      7SourceMan      2016-05-24 19:04:27 +08:00  1 你叫兽兽帮你存到硬盘寄给你不就得了,付一定的费用 | 
|  |      8cloudbeyond      2016-05-24 19:35:23 +08:00  2 TsunamiUDP 只有撑不住的机器,没有跑不满的带宽 :) | 
|  |      9zzutmebwd      2016-05-24 20:03:04 +08:00  1 我可以试试帮忙下。这边直连蛮快的,一夜应该能下完。 | 
|      12jhaohai      2016-05-24 20:18:08 +08:00 via iPhone  1 找可以按流量计费的 | 
|      13luo362722353      2016-05-24 20:55:10 +08:00  1 找一个有 5T-6T 硬盘的机房落到机房,然后通过机房传国内网盘? | 
|  |      14AstroProfundis      2016-05-24 21:03:05 +08:00  1 让兽兽从机房下载完装硬盘里寄给你好了 | 
|  |      15fcicq      2016-05-24 22:06:51 +08:00  1 在国外下载, 边下载边传回到国内云存储啊. 就是个线路的问题 | 
|      16hahahasnoopy      2016-05-24 22:17:03 +08:00 via iPhone  1 找个水货客顺路从香港那边下载好,然后到深圳那边带过来 | 
|  |      17neilp      2016-05-24 22:19:38 +08:00  1 用 cloudflare 做反代,  我这边下载能把本地贷款撑满. 最近百度和 cloudflare 搞基. 如果再用 百度 网盘会员 来下载 cloudlfare 的反代, 不知道能不能快. | 
|      18pxlxh      2016-05-24 22:43:56 +08:00  1 香港基友下载,人肉带过关,然后顺丰。 | 
|  |      19hicdn      2016-05-24 23:13:18 +08:00  1 上传天翼云盘,再下载,搬瓦工上传速度峰值 13MB/s ,平均 8MB/s | 
|  |      20leopard080264      2016-05-24 23:25:13 +08:00  1 上海 48 小时内搞定,请联系 用户名 @gmail.com | 
|      21czk1997      2016-05-25 02:32:01 +08:00  1 不能直接拷盘么…… 按流量计费好点。 | 
|      22em70      2016-05-25 02:55:43 +08:00  1 阿里云只对下行数据收费,上行带宽是免费的,最大带宽 1G,换句话说在服务器上下载数据是免费的 | 
|  |      23w466397352      2016-05-25 09:00:12 +08:00 我也觉得最靠谱的就是人家下好把硬盘快递给你。。。 | 
|  |      24LGA1150      2016-05-25 09:08:53 +08:00 via Android 你可以试试百度云的离线下载 “ 100M 小 ISP ”是长宽? | 
|  |      25LGA1150      2016-05-25 09:13:04 +08:00 via Android 你也可以试试联通骨干网缓存服务器( 120.52.72.*)来缓存数据,不过我怀疑它能不能缓存 TB 级数据 | 
|      26RqPS6rhmP3Nyn3Tm      2016-05-25 09:30:44 +08:00 via Android 迅雷离线… | 
|      27xunxuntj      2016-05-25 10:08:01 +08:00 via Android FedEx 运 5T 数据,假设空运 3 天到,试算下带宽和代价 | 
|  |      28mgna17      2016-05-25 11:18:30 +08:00 肉翻出去,下好再回来。。。。 |