V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
请不要把任何和邀请码有关的内容发到 NAS 节点。

邀请码相关的内容请使用 /go/in 节点。

如果没有发送到 /go/in,那么会被移动到 /go/pointless 同时账号会被降权。如果持续触发这样的移动,会导致账号被禁用。
jeremyding
V2EX  ›  NAS

组 raid1 不如 数据复制到两份硬盘

  •  1
     
  •   jeremyding · 1 天前 · 3207 次点击
    以下是群晖技术支持给我的回复,说实话,如果只是数据复制到两份硬盘,而不是组 raid1 ,估计也不会遇到数据恢复失败的问题。


    我们已收到您的日志。根据目前信息,您使用硬盘 2 修复硬盘 1 的存储池时,出现了 UNC 错误和写入错误[1],修复失败[2]。自 2026.01.18 起,存储池降级运行,仅依赖存在大量 UNC 错误的硬盘 1 。2026.01.24 硬盘 1 再次报错,存储池损毁,进入只读保护状态。

    目前,您的数据仅存于硬盘 1 ,该硬盘已出现严重硬件错误( UNC 错误和介质错误“media error”[3])。建议您更换故障硬盘并从备份恢复数据。

    若无备份且数据重要,建议停止操作,避免加重硬盘损伤,并联系专业数据救援服务。

    对于硬盘 2 ,能从当前的日志看到的是修复没有完成报失败,说明硬盘 2 并没有和硬盘 1 执行完全同步,我们认为硬盘 2 中并没有有意义的数据(不完整)。
    57 条回复    2026-02-11 19:28:32 +08:00
    luoshengdu
        1
    luoshengdu  
       1 天前   ❤️ 1
    热数据怎么办?一个持续占用的数据库怎么复制 [买热备软件=花钱]
    24 小时随机时间有业务写入,怎么持续复制 [高频度监测事件=性能开销]
    数据可恢复性,复制相较于 raid 控制器的延迟有优势吗? [数据落盘的可靠性]
    RAID1 上面不止可以放数据,可以放任何系统以便热迁移。复制能不停机热迁移吗?

    本主题说的只是在我们这种低端家用场景,确实用不着高可用、高可靠性。丢数据、停机、数据不一致都是无所谓的!
    newaccount
        2
    newaccount  
       1 天前
    raid1 还是很有必要的,你的问题是在磁盘出问题之后,修复时继续出错
    硬盘损坏我也遇到过,做法是确认硬盘损坏之后,停机不再使用,等新硬件到货
    不过当时是考虑这个旧机器时间久了,怕以后出问题的几率增大,就买了新机器
    然后顺便升级一下配置,换成 5 盘位,这样两两 raid1 之后,还能剩余一块单独当备份用
    dcsuibian
        3
    dcsuibian  
       1 天前
    每太看懂时间线,能理一下项目背景么
    另外没开邮件提醒么,开了邮件提醒的话,应该不至于出现这么大的问题
    OneLiteCore
        4
    OneLiteCore  
       1 天前
    家用数据情况下备份是最重要的与其 Raid 不如 Crontab + Rsync ,商用场景的话那服务停机一秒都是损失,使用场景不一样
    datocp
        5
    datocp  
       1 天前 via Android
    数据有价,

    一直对 raid1 感兴趣的一个问题,如果硬盘 1 某个数据出错,那么硬盘 2 数据是否会因为同步出错。鉴于对 raid 的盘如何恢复数据的不了解。直接将 r720 刷第三方 it/r730 使用官方 it 。心大,平时系统备份,数据库文件同步,相信自己的人品。。。至少这种常用的硬盘格式自己也有一定能力读取/修复数据。

    有人给我组了个 22 个盘的双 raid10 。可是这玩意小文件速度同样能掉到 5kb/s 以下。。。平时系统备份,数据库备份完成再同步到其它服务器。这种场景我更愿意使用自己了解的 it 模式,而不是 raid 取出硬盘不知道怎么恢复。
    loading
        6
    loading  
       1 天前 via Android   ❤️ 4
    raid 技术是高可用技术,就是单个硬盘故障不会 down 机,它不是数据备份技术!
    asen001
        7
    asen001  
       1 天前   ❤️ 1
    用 raid 不能代替备份,重要数据还是需要多备份
    Vipcw95
        8
    Vipcw95  
       1 天前
    来点起因经过结果
    jeremyding
        9
    jeremyding  
    OP
       1 天前
    感谢大家,已经明白 raid1 的作用了,跟数据备份不一样。
    zyq2280539
        10
    zyq2280539  
       1 天前
    我一直都是 crontab+rsync 脚本手动备份,一直舍不得花钱用相同大容量盘做备份,一般都是按照文件夹的规模去寻找备份盘。
    Ketteiron
        11
    Ketteiron  
       1 天前
    raid1 保证高可用,不保障数据安全,必须定时备份。
    有人可能会问,我都拿出一块盘来备份了怎么还得另外备份,这是很常见的误区。
    据我在多个 nas 群的观察,大部分人都是被人忽悠去上 raid 0,1,5,10 ,只知道优点,但不去了解这些技术的原理,并且错误地曲解了冗余和备份的关系。
    raid 保障的是即使出故障系统也不会挂的高可用性,大多数 nas 玩家其实并没有这么高级的需求,系统挂了数据不丢才是最要紧的事,说实话这跟 raid 没半毛钱关系,反而会因为 raid 引入的硬件复杂度+软件复杂度导致丢了不该丢的数据。

    只要问自己一句:"当发生意外时,我的 nas 是不是不能停机需要继续提供服务?"
    如果答案是 yes ,就去查看各种 raid 的优缺点,选一个合适的,并且依然需要备份兜底。
    如果答案是 no ,只需要找一个简单的定时/增量备份方案就行,raid 在这里只会带来害处。
    EchoWhale
        12
    EchoWhale  
       1 天前 via iPhone
    raid != backup

    很多人用错了,大部分家庭用户不需要 raid ,搞好 321 备份就好了
    Ketteiron
        13
    Ketteiron  
       1 天前
    @datocp #5 是的,raid1 的最大缺点就是会同步错误数据。
    https://serverfault.com/questions/2888/why-is-raid-not-a-backup
    stephenhallo
        14
    stephenhallo  
       1 天前
    raid 是高可用,不是用来数据备份的
    dilidilid
        15
    dilidilid  
       1 天前
    @luoshengdu 你说的所有这些问题几乎都可以用 ZFS/btrfs 快找/send+receive 解决。唯一的缺陷是不能保证实时性,但我想对绝大部分家用场景丢失几个小时的数据是无所谓的。

    另外就是你说的这些高频 IO 操作比如数据库现在几乎都在 SSD 上完成了,但 SSD 做 RAID1 的家用用户显然是少数。反倒是 rsync/send+receive 大法效果更好
    scegg
        16
    scegg  
       1 天前
    RAID 不是备份。
    备份不是 RAID 。
    两个需求,没有互相替代的说法。
    需要什么,就上什么。都需要,就一起上。
    crazycen
        17
    crazycen  
       1 天前
    很多企业以为做了 RAID1 RAID5 万事大吉,而不做备份,导致的数据丢失比比皆是!
    syubo2810
        18
    syubo2810  
       1 天前
    我就没做 raid ,都是同步备份,同 nas 不同盘备份,没容量损失,也不容易丢数据
    做 raid 是为了服务器用的,保证高可用性,正常 nas 其实不需要
    momo1999
        19
    momo1999  
       1 天前
    又一个把 raid 当备份的。
    mengyx
        20
    mengyx  
       1 天前
    个人用途下,兼顾易用性、成本,可以考虑 Btrfs RAID1 / RAID1C3 ;
    支持文件级别的完整性校验、坏块自动修复、快照等能力,可以等效于 2 个/3 个本地副本;
    这样不会出现静默损坏,备份也只需考虑异地副本。
    esee
        21
    esee  
       1 天前
    高可用 和 备份 不是二选一
    fbichijing
        22
    fbichijing  
       1 天前
    看不太明白你想表达什么信息? raid1 不就是为了防止单磁盘坏掉数据丢失的一种技术吗?当发现有一块坏掉的时候,就需要人为换硬盘或者修复,让两块硬盘能继续工作。是什么情况会导致你说的这种结果?你说的现象是:磁盘一本身有问题,然后错误被同步到磁盘二。有一天磁盘一完全坏掉,raid1 想通过磁盘二修复磁盘一,但是发现磁盘二本身有问题。于是无法复原系统?
    eroko
        23
    eroko  
       1 天前
    数据备份请记住 3-2-1
    ryd994
        24
    ryd994  
       1 天前 via Android
    楼主你这个情况分两份也没用啊。现在的情况是 2 盘坏了,重建/重新同步时发现 1 盘也坏了。定期 smart 测试很重要。smart 测试可以检测到大部分读取错误,也就是 1 盘这种情况完全可以早就发现。smart 报错的盘只能降级为下载盘,随时坏了不心疼。

    你现在不定期跑 smart 测试,不定期读取数据验证,那就算你存了两份,还是躲不过盘 2 损毁,盘 1 无法读取的问题。因为你从来都没有验证过盘 1 上的数据是否能读取。没有恢复测试的备份等于不存在,因为你不知道这个备份是否还存活,备份内容是否还正确。备份不是把数据复制一份,然后指望硬件不坏就完事的。好的备份是一整套流程,从数据备份到校验到恢复,都需要定期执行。比如 zfs 定期 resilver ,就是验证数据和镜像内容。

    充分证明了我一贯的观点:如今这个大硬盘时代(单盘>2TB ),任何只有 1 度冗余的 raid 都是不够的。因为重建耗时超过 24 小时,且全程是满负荷读写,非常有可能在重建过程中再挂一块。你要数据安全,raid6 以上是必须。在这一点上 raid10 都不如 raid6 ,因为 raid10 是先做 raid1 再做 raid0 。重建时负荷最大的是坏盘配对的镜像盘,所以最有可能挂的还是那一块。偏偏最不能挂的就是那一块。根据墨菲定律,raid10 的安全性和 raid5 没有本质区别。

    对于家庭使用,瓶颈是网速,raid10 的性能优点没有实际意义。
    对于生产环境,性能是重点,数据安全可以通过别的方式解决。比如近年流行的分布式文件系统。不仅可以应对硬盘故障,还能应对机器任何部分的故障(比如电源炸了)。

    @datocp #5 你描述的情况属于冷错误。硬盘没有报错,但返回了错误数据。raid 原版模型里没有考虑这种情况。原版模型里硬盘只有正常工作和彻底掉线两种状态。不会卡死,不会返回错误数据。
    ZFS 带校验,可以排除冷错误问题。高级的 raid 卡可以在后台定期校验,也可以自动检测冷错误。

    非启动盘,一般不建议使用硬 raid 。你说的小文件速度慢,基本可以确定为没有 BBU cache ,也没有 nand cache 。自带非易失缓存的 raid 卡都是高端产品,价格不便宜。

    相反,ZFS 或 btrfs 都可以加 SSD 做缓存。而且基于文件系统的 raid 可以根据文件特点做不同的写入策略,也有助于性能。
    Alliot
        25
    Alliot  
       1 天前
    @mengyx #20 嗯... 如果单纯存文件的话,Btrfs RAID 1 问题不大。 如果还需要跑点服务,还是 ext4 xfs 吧。
    ProphetN
        26
    ProphetN  
       1 天前
    家用使用 rsync 和 SnapRAID 这些非实时同步技术毫无疑问是更好的。

    Raid 的同步写入本身就是风险操作,尤其是考虑家用 NAS 没有硬 Raid 、没有 ECC 内存、使用静音盘、成品 NAS 散热差的情况下。

    更何况使用 Raid ,还必须接受扩容困难的缺点。
    dufldylan1
        27
    dufldylan1  
       1 天前
    老家县城一个 qnap 8t*3 ,北京租房里一个 windows 8t*2 。我直接一个 syncthing
    Meltdown
        28
    Meltdown  
       1 天前
    没看懂,是太倒霉两块硬盘都坏了?那直接复制不也是会遇到这个问题吗
    S1ahs3r
        29
    S1ahs3r  
       1 天前
    RAID 当然不是备份,但是如果你 RAID 阵列破损,此时服务还可用的话,即使你不去修复阵列,也能用应用层的导出功能提前保护数据。

    更可以 RAID+备份都做,毕竟频次不同。

    不用把网上的人说的当金科玉律一遍一遍的念。
    alfawei
        30
    alfawei  
       1 天前
    我依旧建议 shr/raid1 , 去年群晖 ds220+ 8t 硬盘有一块故障,立刻收到邮件和推送,晚上下单新硬盘,之后重建恢复。 没有 raid1/shr 即使不丢数据是一方面 但我那么多 docker 数据,图片数据库,再折腾一遍配置 我会疯掉的。 我的机器有 30 多个 docker ,一般人不会再额外备份 docker ;还有大量的网盘同步设置,群晖之间互相同步数据。
    xjzshttps
        31
    xjzshttps  
       1 天前
    我是觉得阵列还是需要上,
    但是推荐 zfs 等软件阵列,自带数据校验+快照的。

    我是使用的 zfs 的 raid10+ 定时快照。
    单纯讲 zfs ,
    不出现文件系统级别的恶行 bug 或 nas 本身被入侵加密勒索是可以看作有备份的。
    任何两块盘拿出来都能读出数据,还能回滚到特定时间。

    不过重要常用数据还是有 syncthing 多设备同步+syncthing 快照。
    YaakovZiv
        32
    YaakovZiv  
       1 天前
    这是软件组建 raid 失败,所以数据并未在两个盘完整同步。真实使用的是硬件 raid 还是软件 raid 。
    RightHand
        33
    RightHand  
       1 天前 via Android
    raid1 是当一块硬盘坏了的时候还能让你在进行备份一次的机会
    ashong
        34
    ashong  
       1 天前
    raid1 本来也不是备份,raid1 + snapraid + 冷备
    zhandouji2023
        35
    zhandouji2023  
       1 天前 via Android
    我有两个 4 盘位威联通,都组了 raid5,然后 2 号威联通同步 1 号威联通文件
    shakoon
        36
    shakoon  
       23 小时 51 分钟前 via Android
    最近我 pc 上用两个 6t 的紫盘组了 raid0 ,速度得到大幅提升。存的都是照片和视频,在 nas 上有备份,所以完全不担心。
    Lentin
        37
    Lentin  
       23 小时 15 分钟前
    老生常谈了,磁盘阵列不是备份
    https://201.ustclug.org/images/raid-is-not-backup.jpg
    msg7086
        38
    msg7086  
       15 小时 23 分钟前
    @ryd994 #24
    > 因为重建耗时超过 24 小时,且全程是满负荷读写,非常有可能在重建过程中再挂一块。

    这里其实有个误区,通常并不是因为满负荷导致再挂一块,而是因为第二块其实早就挂了,只不过是在重建的过程中再次「发现」了第二块硬盘挂了而已。

    扇区校验错误只有在读取扇区的时候才会被发现。也就是说,一般家用 RAID 环境,硬盘可能不知不觉早就已经千疮百孔了,因为某一次读取到了已经有错误的扇区,导致硬盘报错离线,然后重建阵列的时候轻易地读到了另一块硬盘上已经有错误的扇区,这才表现出好像是「重建时再挂一块硬盘」的表象。

    要解决这个问题,其实很简单,设置每隔一段时间做一次 scrub 就行了。scrub 本身就是模拟重建过程,如果硬盘已经千疮百孔,不至于到重建的时候才发现。
    jjx
        39
    jjx  
       14 小时 41 分钟前
    家用没必要上阵列,不过得确需要更简单的多盘备份工具
    mrzx
        40
    mrzx  
       13 小时 35 分钟前
    @msg7086 这就是为什么硬盘不要买一个批次的,而且要提前到 5 年左右就要主动更换了.

    并且群晖的硬盘健康检测机制存在问题.群晖是易用,但 SHR 的数据恢复就是一坨屎.

    我 2012 年就开始用 NAS 了,那时候是 freenas,现在改名 truenas,硬盘不知道已经坏了 7 块,还是 9 块了,一直用的 raidz1(类似 raid5,只允许坏一块盘),连硬件平台都更换了 3 波了..系统盘一直拿一块 16G 的 SLC 颗粒 U 盘(2 块 U 盘组 raid1),数据安全性拔高了不少

    硬盘只用企业级 CMR 硬盘,那个寿命跟家用级的硬盘也是不能比的...

    我现在 NAS 也做了自动快照,并不怕中勒索病毒,大不了就丢失 1 天的数据,立刻还原..
    obeyatonce
        41
    obeyatonce  
       12 小时 40 分钟前
    学到了,我就是那种拿 raid 当备份的 nas 用户。。。。这就去做冗余备份
    charles0
        42
    charles0  
       12 小时 27 分钟前 via iPhone
    现代的数据安全小贴士:
    1. RAID 不能代替备份
    2. 没有测试过能恢复数据的备份不算备份
    3. 备份遵循 3-2-1-1-0 原则( 3 份数据、2 种介质、1 份异地、1 份不可变/离线/空气间隔、0 恢复错误),其中 0 恢复错误指的是必须定期测试恢复数据
    charles0
        43
    charles0  
       12 小时 18 分钟前 via iPhone
    @msg7086 除了 scrub ,还有定期测试能否从备份中恢复数据,很多人强调过这一点,比如现代的 3-2-1-1-0 原则里的 0 恢复错误,要求定期从备份中恢复数据并进行校验,确保备份真正可用
    charles0
        44
    charles0  
       12 小时 13 分钟前 via iPhone
    @luoshengdu 你这些应该直接用分布式数据库了
    ryd994
        45
    ryd994  
       11 小时 30 分钟前 via Android
    @msg7086 #38 持续读写负载导致发热、磨损,还是很严重的。虽然和硬盘的正常寿命比可能九牛一毛,但也可能是最后一根稻草。特别是如果都是同批次或者同时期购买,那概率就更大了。我的 nas 是希捷和西数不同型号混用,而且还有一块备件盘偶尔会换掉,避免磨损程度一样。

    此外,硬盘还有 ure 的问题。家用盘一般标称 10^-15 ,保守估计只能算它 10^-14 甚至更低。10TB 也不过是 10^13B ,所以这个概率就不可忽视了。所以只有一盘冗余是绝对不够的。

    @mrzx #40 truenas 的系统盘不需要用高级 SSD 。备份一下配置就够了。系统盘上没有什么有价值的数据。

    然后 smr 盘也不是绝对不能用。我的 raidz2 6 盘阵列里就有 2 块 smr 盘。smr 如果从零开始填数据,完全没有问题。性能差一点,但也超过 100MB/s 。
    但是绝对不能往有数据的 zpool 里加空的 smr 盘,resilver 过程是持续随机写入,smr 盘能掉到 1MB/s 以下。
    怎么办?你需要有一块同容量或更大的 cmr/ssd 作为暂存。先用 cmr 盘重建。重建完成之后下线 cmr 盘,dd 复制到 smr 盘上,再把 smr 盘加回阵列里,之后只需要很少 resilver 就能同步。如果能把 zpool 下线就更好,那就连 resilver 都不需要。
    Pteromyini
        46
    Pteromyini  
       11 小时 23 分钟前
    raid 不是备份用的啊,搬个老回复:
    阵列提供服务保证,备份提供数据保证
    RAID0:提高顺序性能->增强存储服务质量
    RAID1-X:冗余数量内硬件损坏不中断服务提高系统 SLA->增强存储服务持续性
    热备、冷备、异地:提供数据备份和安全保证。
    家用或者某些临时写入场景,冗余阵列的目的基本是保证提供最低限度服务和有机会导出阵列内的资料而不是直接重建。
    个人认为:
    正确做法是:导出资料、上热备、下线出错阵列、线下尝试恢复阵列或者抛弃
    mrzx
        47
    mrzx  
       10 小时 30 分钟前
    @ryd994 我可不想这么麻烦,都上 CMR 硬盘,SMR 除了性能问题之外,数据易丢失也是个问题

    SMR 硬盘缺点:
    1.写入放大 + 磁道牵连 + 超大缓存(意外断电及其容易丢数据,更大概率损毁元数据)

    2.坏块扩散:一个磁道出问题,牵连相邻的,坏块越来越多,CMR 坏块独立。

    3.长期写入衰减 + 静默错误:用久了写入慢,出现读不出来的静默错误,没提示,等发现数据已经坏了。

    "SMR 硬盘重建阵列时 大概率会炸" 我用 nas 2012 年就开始使用了...硬盘坏的也很多了..

    家用盘,几乎都是 SMR 除了一些特殊产品,比如希捷黑盘,那黑盘的价格几乎和企业盘,NAS 盘没什么区别了..而且黑盘还没有 RV 振动传感器 要知道,NAS 会放多块硬盘的.硬盘放在一起就会放大震动效应,会互相振动

    黑盘还没有 TLER,很容易被 raid 阵列触发认为你是坏盘,直接踢出阵列,增加阵列损坏的风险...


    truenas 系统盘即使保存配置,也受版本影响的,我家里的硬件平台整体迁移了 3 次(现在 nas 服务器配置了 256G 内存,服务器主板+E5 cpu)...我很清楚,而且阵列信息都在配置里,怎么能算没价值的数据呢?如果系统盘损毁,你又没保存配置,请问你原先做的所有用户权限怎么恢复的过来?

    后期 truenas 的版本要求系统盘也必须存放再 SSD 硬盘里了,安装时有个检测机制,我是一路升上去的,没这个问题

    你知道 raidz2 有个问题,就是写入性能低下,双副本天生自带的,没办法...及时的更换硬盘和重组也可以规避 raidz1 带来的风险...当然了,raidz2 更安全一些..

    我这边是银欣的 cs380 机箱,8 个硬盘槽位 我是 4 块硬盘组一个 raiz1 等于有 2 组 raidz1 分散了风险..不然 8 块盘组一个 raidz1 风险太大了...

    大家最容易忽略的是 NAS 要用"好硬盘"
    uCharles
        48
    uCharles  
       9 小时 51 分钟前
    看了这个帖子才知道我的 RAID 用错了
    ryd994
        49
    ryd994  
       9 小时 13 分钟前 via Android
    @mrzx
    1. 这是性能问题不是数据正确性问题。只要软件要求它落盘( flush )的时候它确实落盘了,那就只是性能问题。ZFS 的正确性不依赖硬盘的缓存,而是在关键节点上落盘实现的。COW 文件系统就是这一点好。写到一半挂了,那你至少有旧数据还在。
    2. smart 定期检测,有坏道的立刻淘汰。不管是不是 smr 都迟早要坏的。我从 18 年用到现在,还没坏过一块硬盘。那两块 smr 盘我就是等着它先坏的。我有 cmr 备件待命,也实测过我上面说的重建方法,对我来说可以接受。
    3. ZFS 经常 scrub ,不会出现你说的问题。不 scrub 用什么 ZFS 。


    “truenas 系统盘即使保存配置,也受版本影响的,我家里的硬件平台整体迁移了 3 次(现在 nas 服务器配置了 256G 内存,服务器主板+E5 cpu)...我很清楚,而且阵列信息都在配置里,怎么能算没价值的数据呢?如果系统盘损毁,你又没保存配置,请问你原先做的所有用户权限怎么恢复的过来?”
    truenas 系统升级不影响数据盘的 ZFS 版本,只要 ZFS 版本不变,就能在对应版本的 openzfs 导入。如果 ZFS 版本有更新,truenas 不会自动升级,只有你确认升级才升级。
    阵列信息不在配置文件里。你把数据盘放到任何一台有 openzfs 驱动的系统上都能读取。硬盘加载的顺序和卷标不重要,只要能读取硬盘,ZFS 都能自动识别。ZFS 和 raid 卡不一样。
    用户和权限设置在配置文件里啊。我说了备份配置文件没有? truenas 可以导出配置文件的啊。你所有的用户和服务配置信息都在里面。
    我捡垃圾换了好几次硬件了,都没什么问题。

    “后期 truenas 的版本要求系统盘也必须存放再 SSD 硬盘里了,安装时有个检测机制,我是一路升上去的,没这个问题”
    垃圾 SSD 单盘足矣。官方推荐配置是考虑企业用户推荐的。你不关心 SLA 的话就无所谓。数据安全由 ZFS 保证。

    “你知道 raidz2 有个问题,就是写入性能低下,双副本天生自带的,没办法...”
    家用 nas 也就存存备份文件。瓶颈是网络,我 6 盘 raidz2 也有 500MB/s 读写。远超千兆网络上限了。我也没那么多数据要备份。
    跑下载跑应用的,我上面提到过,就是单盘,垃圾 SSD ,有坏道的旧硬盘,我都用。备份数据的 app (比如 immich )的数据库文件和备份的数据还是在 raidz2 上,性能可以接受。垃圾 SSD 上只有 docker 镜像,这些都可以从网上下载。恢复的时候只要数据盘在就行了。

    你有一个误区就是程序和数据分不开。程序要性能,数据要安全。同时要性能和安全的话成本会非常高。分开程序和数据是业界的趋势。docker 就是一个例子。程序部分只读,就不需要担心状态一致性的问题,这就可以很方便地横向扩展。
    ryd994
        50
    ryd994  
       8 小时 54 分钟前 via Android
    @mrzx smr 盘也这么多年了,性能问题是技术局限。但是数据正确性还是有保障的。你对 smr 的偏见还是比较强。
    对于数据安全,我的观点一直是流水的硬盘,铁打的数据。通过合理的 raid 和备份,还有定期的校验,完全可以在不可靠的廉价硬件上实现可靠的数据保存。
    我目前用的是 4 块西数 my book 拆壳的白标氦气盘,不同渠道分别购买。2 块希捷的拆壳盘,smr 。另外还有 1 块白标氦气盘做备件。
    应用盘和下载盘都是翻抽屉找到的老机械盘,又不是不能用。区别是应用盘没坏道,定期 smart+scrub ,ZFS 开 3 副本,这样就算有坏道也大概率能纠正。整盘坏就算了,反正只是 docker 镜像,我实测过从零恢复(其实是我折腾 truenas app 的时候搞坏了)。
    下载盘就是我上面贴的坏道盘,什么时候它想不开了挂就挂吧,我不在乎。
    mrzx
        51
    mrzx  
       8 小时 46 分钟前
    @ryd994 我打错了,我想说的用户权限都在配置文件里,阵列信息无所谓,是可以直接导入的.

    主要是你的论点是配置文件没什么"有价值的数据", 我说有,并且拿用户权限举例子,用户权限就是有价值的数据,你用的越久,权限设置的越复杂,让我重头设置一次,会崩溃的.....我家里的网络和父母的,亲戚的网络都用 VPN 隧道打通了,都在用我的 NAS..

    我家是万兆内网,双运营商线路,一条电信,一条联通,其实我还有多块 SSD 做缓存.做了 ARC 缓存 还有 4 块 32G 傲腾做 2 个组的 SLOG 缓存,性能释放还可以的.

    你觉得够了,那只是因为你得需求只是如此...
    mrzx
        52
    mrzx  
       8 小时 39 分钟前
    @ryd994 我家里 2 个台式机都没怎么买硬盘,就一个 ssd 做系统盘,通过 iscsi 挂载实现硬盘大容量扩容的,

    以前直接用 smb 协议,发现性能低下,而且再魔兽世界某一个版本更新后,就不能直接通过 smb 读取主程序直接运行游戏程序了..最后才采用了这套方案

    你说的没错,SMR 我的确看不上,再怎么样技术迭代,数据安全性肯定是没 CMR 安全...

    年纪大了,实在没精力折腾,如果放在以前,我可能对如何在"不可靠的廉价硬件上实现可靠的数据保存"感兴趣,并且投入精力去折腾....
    ryd994
        53
    ryd994  
       8 小时 22 分钟前 via Android
    @mrzx 用户权限在导出的配置文件里,这我说了好多遍了。其实说是权限,实际只是用户名和 UID 之间的对应关系而已。真正的文件权限信息也是在文件系统里的,只是记录的是 UID 。

    “我家里 2 个台式机都没怎么买硬盘,就一个 ssd 做系统盘,通过 iscsi 挂载实现硬盘大容量扩容的,”
    你问问这个帖子里有几个是像你这样开网吧的?你有这个性能需求我不拦着。但是 smr 也不是不能用,我从头到尾就是这么一句。你上面对 smr 的数据正确性的观点,显然是偏见。smr 的性能问题是客观事实,我提出的方案也只是一种方法而已。不用也是可以的。

    折腾吗?我这套系统从 18 年到现在,并没有折腾过什么,硬盘也没坏过。从 nas4free 到 freenas 到 truenas ,真就是流水的系统流水的硬件,铁打的数据。
    应用盘下载盘折腾的比较多,但那些都是不重要的数据。都是用来玩的东西。
    mrzx
        54
    mrzx  
       8 小时 10 分钟前
    @ryd994 对对对,你说的都对.

    我来最终总结一下
    你的观点是,我对 SMR 有偏见,SMR 能用,不是每个人都有我这样的需求

    我的观点是,我有这样的需求,你的需求指标不能代表所有人,此外,我就是对 SMR 不信任,因为我再这上面吃过亏.

    至于折腾不折腾,我觉得

    "但是绝对不能往有数据的 zpool 里加空的 smr 盘,resilver 过程是持续随机写入,smr 盘能掉到 1MB/s 以下。
    怎么办?你需要有一块同容量或更大的 cmr/ssd 作为暂存。先用 cmr 盘重建。重建完成之后下线 cmr 盘,dd 复制到 smr 盘上,再把 smr 盘加回阵列里,之后只需要很少 resilver 就能同步。"

    这就是折腾...我用 CMR 完全不需要这些复杂考虑....
    ryd994
        55
    ryd994  
       7 小时 34 分钟前 via Android
    @mrzx 呃,但是我至今也没需要重建过,除了测试用的那一次。这么多年遇不到一次,这个麻烦还是可以接受的。
    我也不是要说服你用 smr ,你有性能需求可以理解。你不接受这个麻烦也可以理解。
    对于不需要那么高性能的人来说,smr 的数据安全性并没有问题,没必要闻 smr 色变。
    对于非 zfs 的普通 raid 来说,smr 就更不是问题了。wd 偷偷改 smr 是很黑心,但是 wd 并不傻,事实上就是很多人用 smr 完全没问题。

    最近这个行情,硬盘价格也比较贵。在充分了解 smr 的缺点之后,smr 也是可以用的。拆壳的白标氦气盘也是可以用的,那是正经的企业盘盘体,比所谓 nas 盘还可靠。促销时的价格比 smr 盘只贵一点,如果能遇到促销也是可以考虑。
    mrzx
        56
    mrzx  
       7 小时 0 分钟前
    @ryd994 嗯,我 2012 年用到现在,坏过很多硬盘了,重建了很多次了....
    MrKrabs
        57
    MrKrabs  
       4 小时 26 分钟前
    raid0 路过
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   1777 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 37ms · UTC 15:54 · PVG 23:54 · LAX 07:54 · JFK 10:54
    ♥ Do have faith in what you're doing.