V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
felilong123
V2EX  ›  程序员

这次 cloudflare 宕机是什么原因造成的?

  •  
  •   felilong123 · 12 小时 5 分钟前 · 5703 次点击
    听说是 AI ?



    60 条回复    2025-11-19 10:38:38 +08:00
    wsseo
        1
    wsseo  
       12 小时 4 分钟前
    重大影响
    wsseo
        2
    wsseo  
       12 小时 1 分钟前
    现在是时好时坏,哎
    surbomfla
        3
    surbomfla  
       11 小时 57 分钟前
    问题原因等官方发布报告吧,目前很多网站访问恢复了,希望不要再挂了吧
    coderlxm
        4
    coderlxm  
       11 小时 55 分钟前 via Android
    刚才好了一会然后又挂了,现在又好了哈哈
    zsuxiong
        5
    zsuxiong  
       11 小时 55 分钟前
    大半个全球互联网都瘫痪了。
    JoeJoeJoe
        6
    JoeJoeJoe  
    PRO
       11 小时 54 分钟前   ❤️ 1
    测试一下自己对世界互联网的影响力 :)
    laojuelv
        7
    laojuelv  
    PRO
       11 小时 54 分钟前 via iPhone
    我以为我的梯子坏了。还是 ip 被封了
    harrietliu
        8
    harrietliu  
       11 小时 53 分钟前
    大概是下午四点五十左右就崩掉了
    darrh00
        9
    darrh00  
       11 小时 50 分钟前
    v2ex 有备份访问方式吗?
    daybreakfangyang
        10
    daybreakfangyang  
       11 小时 48 分钟前
    AI 觉醒啦?🙂
    moefishtang
        11
    moefishtang  
       11 小时 46 分钟前
    用来摸鱼的网站都炸了😑
    All in CloudFlare.All in boom.
    PositionZero
        12
    PositionZero  
       11 小时 43 分钟前 via Android
    这地图应该换成世界地图
    ToPoGE
        13
    ToPoGE  
       11 小时 43 分钟前   ❤️ 7
    不是网络攻击

    cloudflare CTO 已经明说了


    I won’t mince words: earlier today we failed our customers and the broader Internet when a problem in
    @Cloudflare
    network impacted large amounts of traffic that rely on us. The sites, businesses, and organizations that rely on Cloudflare depend on us being available and I apologize for the impact that we caused.

    Transparency about what happened matters, and we plan to share a breakdown with more details in a few hours. In short, a latent bug in a service underpinning our bot mitigation capability started to crash after a routine configuration change we made. That cascaded into a broad degradation to our network and other services. This was not an attack.

    That issue, impact it caused, and time to resolution is unacceptable. Work is already underway to make sure it does not happen again, but I know it caused real pain today. The trust our customers place in us is what we value the most and we are going to do what it takes to earn that back.

    https://x.com/dok2001/status/1990791419653484646
    bOOOOc
        14
    bOOOOc  
       11 小时 42 分钟前 via iPhone
    ervqq
        15
    ervqq  
       11 小时 42 分钟前
    https://www.cloudflarestatus.com/ 看官方监控,现在已经恢复了
    SenLief
        16
    SenLief  
       11 小时 40 分钟前
    突然发现常去的网站都是套的 cf ,一挂全挂了。
    usn
        17
    usn  
    PRO
       11 小时 39 分钟前 via iPhone
    cf 真的太烂了,这就是垄断互联网之后为所欲为的表现
    usn
        18
    usn  
    PRO
       11 小时 38 分钟前 via iPhone
    事实上任何垄断都不好
    How
        19
    How  
       11 小时 35 分钟前 via Android
    互联网发展了二十多年就辛迪加了,赛博朋克就在不远的未来
    israinbow
        20
    israinbow  
       9 小时 56 分钟前
    @usn #17 不是 cf 垄断, 是它不要钱所以大家都在用.
    arloor
        21
    arloor  
       9 小时 47 分钟前 via Android   ❤️ 1
    @israinbow 那也是垄断啊
    docx
        22
    docx  
       9 小时 44 分钟前 via iPhone   ❤️ 21
    免费给你用,你说他垄断,这对吗?
    iango
        23
    iango  
       9 小时 15 分钟前
    @usn
    cloudflare 还排不上第一名,只能算第二梯队前列,要跟 AWS 、Google 、Azure 竞争。
    CDN 服务老大是 Akamai 。
    usn
        24
    usn  
    PRO
       8 小时 56 分钟前   ❤️ 1
    @iango 好的,明白了,cf 只是善,但是能力不行
    RTSmile
        25
    RTSmile  
       8 小时 53 分钟前 via iPhone
    @usn 能力比你强多了
    usn
        26
    usn  
    PRO
       8 小时 52 分钟前
    @RTSmile
    RTSmile
        27
    RTSmile  
       8 小时 47 分钟前 via iPhone
    @arloor 远远达不到垄断的程度,这次虽然崩得网站不少但是还是有一大堆网站没受影响,足以说明 cloudflare 和别家的 cdn 都是正常竞争。
    kimizen
        28
    kimizen  
       8 小时 47 分钟前   ❤️ 2
    @arloor 不准你这么说我的赛博大恩人!
    hh7418695
        29
    hh7418695  
       4 小时 40 分钟前
    @JoeJoeJoe 哈哈哈哈哈哈哈哈神评
    rick13
        30
    rick13  
       2 小时 43 分钟前
    等 blog 呗,cf 对于事故复盘 blog 还是认真的
    x86
        31
    x86  
       2 小时 43 分钟前
    大概率是阻止我航班起飞🥵
    noqwerty
        32
    noqwerty  
       2 小时 22 分钟前 via iPhone   ❤️ 1
    官方博客的 postmortem 已经发布了: https://blog.cloudflare.com/18-november-2025-outage/
    acthtml
        33
    acthtml  
       2 小时 17 分钟前
    这 cto 写的说明真实简洁明了。
    aloxaf
        34
    aloxaf  
       2 小时 6 分钟前


    在错误处理上偷懒导致的( 😂
    villivateur
        35
    villivateur  
       2 小时 5 分钟前
    @noqwerty 简单看了下,应该是错误配置导致一个文件体积迅速增长撑爆磁盘?如果是这样的化,应该比较好解释为什么中途好了一阵子,可能就像之前的段子说的,在硬盘里提前放一个没用的大文件,硬盘不够用了就先删除,可以临时撑一阵子。
    realpg
        36
    realpg  
    PRO
       2 小时 5 分钟前   ❤️ 1
    这要是个中国云厂商 估计 V2 帖子得多一百倍
    hafuhafu
        37
    hafuhafu  
       2 小时 4 分钟前
    看了一下博客,我没理解错的话:
    原因:说是权限变更导致数据库某个查询输出了意外的多条数据,然后导致产生的配置文件体积超级加倍,并下发到了所有机器上。然后机器上有个跨网络路由软件会读这个配置文件,但是软件内对读取文件的大小进行了限制,因为异常的文件太大了,超过了这个限制,所以就导致路由软件失效了,然后就全崩了。
    排查:他们最早以为是被大规模 D 了,后面排查到了正确的原因,用配置文件的早期版本替换了。
    时间线:
    大规模出现故障 2025 年 11 月 18 日 11:20 UTC
    核心流量恢复正常 2025 年 11 月 18 日 14:30 UTC
    所有系统正常运行 2025 年 11 月 18 日 17:06 UTC
    Debug1998
        38
    Debug1998  
       2 小时 2 分钟前
    昨天晚上小黄网进不去,我以为我梯子挂了。
    kamikaze472
        39
    kamikaze472  
       2 小时 0 分钟前
    @realpg #36 我个人感觉, 之前阿里云崩了, 远没有 Cloudflare 崩了 帖子多
    noqwerty
        40
    noqwerty  
       1 小时 54 分钟前 via iPhone
    @villivateur 不是磁盘空间不足,是新部署的 ClickHouse 查询返回了重复的特征,这个特征文件是传给下游一个判断请求是否来自爬虫的模型的,特征数量超出了模型代码预期,于是直接抛错了
    JYii
        41
    JYii  
       1 小时 53 分钟前
    @realpg #36 那不肯定的吗,v 站基本都是国人,依赖国内服务,国内厂商炸了肯定反馈更多。还是说你要阴阳其他东西。
    hafuhafu
        42
    hafuhafu  
       1 小时 43 分钟前
    @hafuhafu -> 还不是文件体积大小的问题。是里面配置的功能数量的限制。一般正常情况下,这个数量大概会有 60 个+,所以他们预设了正常情况下一个比较大的值 200 当最大限制,并且代码里取值的时候用 unwrap ,如果有异常程序就直接崩溃了。不懂 rust 不过这个 unwrap 这么危险么...
    Tink
        43
    Tink  
    PRO
       1 小时 38 分钟前
    数据库配置失误。

    故障原因并非网络攻击,而是数据库权限变更导致机器人管理系统的配置文件异常增大,超出系统预设限制,引发核心代理服务崩溃。受影响的服务包括 CDN 、安全服务、Workers KV 、Access 认证和控制面板等。
    realpg
        44
    realpg  
    PRO
       1 小时 32 分钟前
    @JYii #41
    这么多帖子 有一个喷 cf 的吗? 甚至回复都没一个指责的...
    poilkj19
        45
    poilkj19  
       1 小时 30 分钟前
    @Debug1998 我也是,我还充了会员呢,以为站长跑路了
    fcbwalk
        46
    fcbwalk  
       1 小时 24 分钟前
    @realpg cf 大善人,喷不起来啊,有几个这样良心的公司。
    jzhm
        47
    jzhm  
       1 小时 24 分钟前
    @kimizen #28 哈哈哈哈哈
    wowo243
        48
    wowo243  
       1 小时 22 分钟前
    @Debug1998 #38 小黄网都用 cf 吗
    anzu
        49
    anzu  
       1 小时 16 分钟前
    > 当你用了 unwrap() 而未经测试的时候
    killva4624
        50
    killva4624  
       1 小时 13 分钟前
    @noqwerty #32 和之前阿里云配置变更引发的异常好相似。
    Rainwater
        51
    Rainwater  
       1 小时 5 分钟前
    @realpg #44 付费的用户肯定会喷,大部分都是白嫖的
    usVexMownCzar
        52
    usVexMownCzar  
       1 小时 4 分钟前 via iPhone
    @wowo243 必须的,昨晚想擦枪,好几个枪械网站都打不开🌚
    ruanimal
        53
    ruanimal  
       58 分钟前
    @hafuhafu unwarp 相当于 assert , 而且这种情况什么异常处理也没用
    cmos
        54
    cmos  
       48 分钟前
    @hafuhafu 42#
    我们公司用 unwarp ,在 code review 的时候会被拷打
    okayan
        56
    okayan  
       36 分钟前
    @kimizen 哈哈哈哈
    Debug1998
        57
    Debug1998  
       22 分钟前
    @wowo243 吃瓜网用的
    Nugine0
        58
    Nugine0  
       13 分钟前
    整个流程只要有一个阶段发挥作用都不会全球崩溃吧。
    设计:不评估数据库权限问题?
    开发:谁让你用 unwrap 的?
    测试:非法配置文件 bug 很难测出来?
    上线:你灰度呢?直接改全球?
    故障:雪崩不做防御?

    这么看来 cloudflare 也挺草台的
    dylyft
        59
    dylyft  
       12 分钟前
    @realpg 还是有的, 17 楼就在喷呢
    dif
        60
    dif  
       7 分钟前
    免费的东西,就是挂一天也没关系。这都是以前折腾免费主机,免费域名锻炼出的。
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   5762 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 30ms · UTC 02:45 · PVG 10:45 · LAX 18:45 · JFK 21:45
    ♥ Do have faith in what you're doing.