V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
Recommended Services
Amazon Web Services
LeanCloud
New Relic
ClearDB
LxnChan
V2EX  ›  云计算

请教一下什么是超融合(HCI)?

  •  
  •   LxnChan · 2023-07-05 22:47:19 +08:00 · 3473 次点击
    这是一个创建于 541 天前的主题,其中的信息可能已经有所发展或是发生改变。

    我之前理解的超融合是指把多台物理机的硬件资源( CPU 、内存、硬盘、网络)等融合为一个巨型资源池,使得内部虚拟机可以突破物理机硬件配置上限,算力可以跨物理设备。

    然后现在感觉好像是理解错了,目前用了 vmware vCenter ( vSphere )、华为 Fusion Compute 和深信服 HCI ,这仨都不能使得算力跨物理设备组合,仍然是单台虚拟机算力资源不能超出单台物理机上限。

    于是想问一下大家这种“超融合”的目的是什么,这不就相当于一个堡垒机(在自家生态内)统一管理虚拟机吗;以及是否有如我所述通过互联使得算力可以跨越物理设备组合(使能单台虚拟机资源突破单台物理机资源上限)的“融合”平台?

    16 条回复    2023-07-07 10:51:11 +08:00
    wheat0r
        1
    wheat0r  
       2023-07-05 22:57:01 +08:00   ❤️ 1
    其实是超融合是存储虚拟化
    maskerTUI
        2
    maskerTUI  
       2023-07-05 23:02:53 +08:00
    我看实际的产品是 cpu 会被物理机器限制,但是存储可跨机器,就是存储池的概念。
    至于超融合,本质上还是虚拟化的扩展。
    纯个人理解。
    Frytea
        3
    Frytea  
       2023-07-05 23:06:28 +08:00
    超融合基础架构( Hyper-converged infrastructure ,缩写为 HCI ),是一种集成了存储设备及虚拟运算的信息基础架构框架。By wikipedia

    超融合架构是相对于传统存算分离架构而言的,也就是将算力( cpu 、内存)、存储(磁盘,分布式存储)等融合在一台服务器中。如果需要更多资源,只需要多台超融合服务器组成一个集群即可统一管理。其本质没有太多创新。

    本人参与超融合项目也有几年了,应该有点发言权
    Frytea
        4
    Frytea  
       2023-07-05 23:08:58 +08:00
    其概念还可以进一步延伸,比如深信服之类的公司,还将网络虚拟化、甚至安全虚拟化等概念都融合进来。

    再不讲武德一些,还有将容器云、多云纳管等也融合进来的。
    LxnChan
        5
    LxnChan  
    OP
       2023-07-05 23:21:31 +08:00
    @Frytea 您好,说实话还是有些没懂,想和您请教一下:
    如果按照您所述“传统”架构,何为“存算分离”?按我的理解传统架构应该是每台虚拟机的配置文件、存储镜像都在一台物理机上;然后超融合架构也并未将算力( CPU 、内存)融合到一个资源池中。
    目前感觉也就是存储是融合在一起了,存储和网络的基本单位不再是一台物理机;其他的并未有相关体验。即虚拟机的配置文件和磁盘镜像、快照等内容可以不在同一台虚拟机上。
    dode
        6
    dode  
       2023-07-05 23:27:20 +08:00 via Android
    可以实现一个虚拟机在需要的时候跑在任意一个服务器上,避免物理设备故障导致服务中断问题
    adoal
        7
    adoal  
       2023-07-05 23:32:54 +08:00   ❤️ 4
    以前的企业级虚拟化方案,跟非虚拟化的服务器方案一样用的是集中式的共享存储,存储部分是厂家的私有系统,跟服务器之间通过 FC 、FCoE 、iSCSI 等协议连接,划分出一个个的块存储,在服务器端看来就是跟硬盘一样的 SCSI 块设备。不同的服务器可以连接同一个块设备,但只有虚拟机所在的物理机才挂载,这样迁移和故障转移只要把挂载机切换到目标物理机就可以。

    超融合架构里不再有集中式的存储。每个节点都可以同时做虚拟机 host 和块设备的 provider 。为了解决迁移和故障转移的问题,用的是多副本写入方式。可以是 VMM 负责多副本写入,也可以是 Ceph 之类的分布式文件系统来负责多副本写入,从 VMM 来看是只写一份。
    adoal
        8
    adoal  
       2023-07-05 23:33:47 +08:00
    难道现在的小盆友都不知道 SAN 存储了……
    echo1937
        9
    echo1937  
       2023-07-06 01:03:23 +08:00   ❤️ 4
    以 vmware 为例子,最早的企业虚拟化就是一堆计算服务器做内存和 CPU 的虚拟化,然后连上以太网交换机和 FC 交换机,后面接 SAN 存储。

    在这个阶段其实也就是 CPU 和内存虚拟化了,网络虚拟化很不彻底,要求大二层的互通,没有 Overlay ,没有 NSX 等网络高级功能,存储这块更是直接 SAN 存储。

    过了几年以后,vSAN 出现了,专门搞了一些带很多 HDD 和部分缓存 SSD 的服务器作提供分布式块存储,SAN 就慢慢淘汰了,变成了一堆提供内存和 CPU 密度的服务器 + 一堆提供很多存储容量的 HDD + SSD ,刚出来的时候问题挺多的,经常网络中断一下,虚拟机的文件系统就只读了,不知道现在还会不会这样了。

    再后来网络虚拟化也进步了,都是 Overlay 网络,NSX 等技术提供了虚拟的分布式防火墙、路由器、交换机功能,甚至可以不需要采购专门的防火墙等设备了。Underlay 网络你只要三层能通就行,多租户隔离什么的都在 Overlay 网络做,非常灵活。

    再后来厂家推出了超融合,提供存储能力的服务器和提供计算能力的服务器逐渐变为单一形态,交换机也从( End of Row )变成了 Top of Row (架顶式),这样子最终用户可以直接按机架为单位购买,甚至还预装虚拟化软件,几乎做到了进场上架通电即可交钥匙,设备商可以直接跳过集成商,缩短了交付时间和集成复杂度。

    当时这就是 HCI 的主流描述,后来我就离开这个领域了,不知道这个概念有没有变化和扩充。
    ryd994
        10
    ryd994  
       2023-07-06 07:11:00 +08:00 via Android   ❤️ 3
    @LxnChan 传统架构是有单独的储存集群,使用分布式储存系统
    计算集群跑虚拟机,基本不储存数据,或者只有高速储存用于缓存
    如果一个计算节点挂了,可以在另一个计算节点上重启
    如果一个储存节点挂了,分布式文件系统会处理
    计算和储存集群之间有低延迟网络连接

    超融合是把计算和储存节点整合在一起,但储存数据仍然跨多个节点。如果一个节点挂了,系统会选择另一个有数据备份的节点重启虚拟机。或者储存部分有另外的互联通道,这样就算一个节点挂了,其他节点仍然可以访问这个节点上的数据

    @echo1937 不是 top of row 是 top of rack ,这样可以预先接好线,然后以 rack 为单位,迅速安装到新地点。
    更极端的还有 sun 搞过的集装箱机房。以集装箱为单位,接上电源和网络就能用。
    这种情况下,挂了的节点是不修的。直接用冗余节点顶上。积累到一定数量,整个 rack 拿出来维修。
    kenny9572
        11
    kenny9572  
       2023-07-06 08:30:14 +08:00 via Android
    其实就是分布式存储+虚拟化而已
    dog82
        12
    dog82  
       2023-07-06 08:55:37 +08:00
    超融合就是存储虚拟化+本地计算资源虚拟化
    既能利用本地计算资源又方便管理

    其实用起来问题很多
    lm930129
        13
    lm930129  
       2023-07-06 09:02:25 +08:00
    超融合起步就是三台物理机,共享存储资源,然后其他的没事区别,优点就是统一管理,有多副本,可以自动恢复损坏的虚拟机,迁移,扩容起来方便。
    Frytea
        14
    Frytea  
       2023-07-06 13:31:31 +08:00   ❤️ 1
    @LxnChan 这个理解是不准确的。

    虚拟机配置文件、镜像这些,跟“超融合”概念关系不大。

    超融合 = 单台服务器即可提供虚拟化+存储资源,融合的是计算和存储。

    而资源池才是将多个超融合节点的计算资源汇总在一起的概念。

    资源池也不是说要跨越物理界限,意识是在一个地方统一的调配这些资源。

    放在实际来说,我们并不需要一台超过服务器本身物理资源的超级虚拟机,而是需要在一个地方统一管理散布在多个物理节点上的大量个虚拟机。
    Champa9ne
        15
    Champa9ne  
       2023-07-06 22:43:59 +08:00
    自己也用过一些 vmware 的虚拟化平台产品,但是不是运维,也不是了解的很深入。

    想问问各位老哥,vmware 的超融合是怎么实现类似磁盘阵列的数据保护呢?之前和别人讨论过,他说是多冗余节点实现。难道一个服务为了做数据保护就要部署多个冗余节点?那如果这个服务要求高算力,那岂不是成本一下子翻了 n (个节点)倍?

    还是说再超融合的语境下,没有单独的数据保护说法,多冗余节点是同时实现了负载均衡、数据保护等功能这样设计?这样的设计和算力节点、存储节点分离,存储节点自己再做阵列或其他数据保护措施的方案相比有什么优势吗?

    求指点求指点
    Kumo31
        16
    Kumo31  
       2023-07-07 10:51:11 +08:00
    @Champa9ne #15 数据保护不需要服务部署多个节点吧,超融合是和存储虚拟化紧密结合的,底层的分布式存储本身会做数据的多副本或者 EC ,这个是完全存储层做的,其实已经足够了,但上层一般还会再做一些定时快照之类的功能。和传统架构相比的话,HCI 就是管理方便,运维、扩展成本低
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2643 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 23ms · UTC 11:47 · PVG 19:47 · LAX 03:47 · JFK 06:47
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.