V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
paopaotang001
V2EX  ›  Tesla

没开过电车,特斯拉为什么坚持纯视觉?

  •  
  •   paopaotang001 · 11 天前 · 14216 次点击
    一直开的油车,最近 SU7 事故有感,既然在夜晚、恶劣天气情况下辅助驾驶不好用,为什么特斯拉坚持纯视觉方案而不是激光雷达呢?

    之前看帖子有些人说电车只分特斯拉和其它,所以其它厂商跟特斯拉的差距是在算法上吗?像这次 SU7 事故车辆也是用的视觉方案,那特斯拉在类似的情况下可能会采取哪种措施,有没有电车车主来科普一下。
    258 条回复    2025-04-04 12:18:58 +08:00
    1  2  3  
    H97794
        201
    H97794  
       10 天前
    @juded #199 你不觉得你的论点,更应该对上面#106"虽然特斯拉纯视觉硬件便宜,可它 6 万 4 卖的贵呀 doge"说吗?
    ahz549467483
        202
    ahz549467483  
       10 天前
    @hallostr 这都能跪嘛。我真的服气
    cenbiq
        203
    cenbiq  
       10 天前   ❤️ 3
    我发现这个论坛似乎很多人没法理性思考了,自动驾驶是一个多加一个传感器就多厉害一分的事吗?显然并不是吧。纯视觉方案还远未达天花板,在这之前当然可以引入激光雷达,但问题是你的本职工作自动驾驶这个事你还没能解决的很好,多引入一个两个传感器会有什么质的变化吗?一旦纯视觉接近天花板,给纯视觉巨大的投入也只能得到非常微不足道的回报的时候,再考虑如何引入并融合其它传感器来提升智能才是最佳时机。
    H97794
        204
    H97794  
       10 天前
    @QlanQ #180 不是应该你或者其他现有的新能源来证明特斯拉错了? 证明加激光雷达的智能驾驶比特斯拉纯视觉强吗?
    noErr
        205
    noErr  
       10 天前
    雷达精度太差
    hallostr
        206
    hallostr  
       10 天前
    @ahz549467483 这能理解成跪?看来你很熟悉跪啊
    QlanQ
        207
    QlanQ  
       10 天前
    @H97794 #204 我为什么要自证呢?为什么特斯拉不证明一下,只用视觉就足够了,足够优秀了,自动驾驶已经全面落地可用了,甚至 完全自动驾驶已经在排期了呢?

    现在 至少在国内,不管是什么原因,特斯拉的智驾 也不算是最优秀的吧。那为啥 能说明 视觉就比 视觉 + 雷达强?
    shunia
        208
    shunia  
       10 天前
    @cenbiq 也要符合经济发展的规律。

    当你明知道多维传感能达到更好的效果的时候(现代飞机、战斗机已经完全证明了这一事实),并且经济效益足够高的情况下,提前拿出更符合未来趋势的技术方案,并且在过程中不断优化迭代,显然才是更务实的做法。

    增加激光雷达、毫米波雷达,并不代表不需要发展本身就存在的视觉感知。

    自动驾驶就是多加一个传感器就多厉害一分的事情,因为我们不可能假设增加的硬件设备是完全无用的,那么反过来只要它能提供任何一点作用,那对道路上的参与者来说,都会多一分安全。即便车的硬件设备或者软件系统不能提供足够的能力来对这些感知做出反馈,但是只要能给到驾驶者做参考,也一定是在普遍意义上给道路参与者提供更高的安全性的。
    x1aoYao
        209
    x1aoYao  
       10 天前
    @legendBro 特斯拉汽车也不是四足机器人呀。人没进化出激光雷达,但是有用激光雷达的汽车/扫地机。别人反驳的只是特斯拉的逻辑
    cenbiq
        210
    cenbiq  
       10 天前   ❤️ 1
    @shunia 但如果总和其它传感器带来的总成本投入(考虑批量生产和额外算法成本)分配到纯视觉方案算法升级带来的智能收益 > 仅投入传感器和相应算法所带来的智能收益呢?
    Tink
        211
    Tink  
       10 天前
    @QlanQ #64 这点有点奇怪,我实际使用中发现特斯拉那个摄像头下雨天尤其是傍晚地面上全是水,折射反光的情况下,他那个拍出来的比我肉眼看的要清除多,所以下雨的时候我都是看屏幕开哈哈
    4641585
        212
    4641585  
       10 天前
    @Tink 镜头加个偏振片可以消除反射光
    Tumblr
        213
    Tumblr  
       10 天前
    马斯克早就回应过这个问题啊,他认为道路和交通设计是基于纯视觉的,并没有哪一条街哪一条路是为了雷达而设计,所以用纯视觉方案才是最优解。并且他也说过,和 SpaceX 的工程师搞火箭的时候他尝试参与了激光雷达,他很了解激光雷达,并认为激光雷达不适合用在自动驾驶上。
    a280807225
        214
    a280807225  
       10 天前
    已经有个博主开着 fsd 走了 su7 那个道路安全通过,而且车主增加难度又踩了油门踏板过去的
    paopaotang001
        215
    paopaotang001  
    OP
       10 天前
    @juded 这个确实哈哈,特别是国内电车这么卷的情况下,感觉我都买特斯拉了 FSD 难道不应该是标配嘛。
    paopaotang001
        216
    paopaotang001  
    OP
       10 天前
    @AOK123 “原因不是因为激光雷达贵,而是因为视觉作为人类最基本的感知,在互联网上积累了大量的数据可以用于训练大模型。大量数据能给纯视觉方案提供很高的上限,无所谓有没有激光雷达了。”

    比较像正解的答案,大模型训练赌对了,加上 AI 的发展主要取决于算力差距了。
    letking
        217
    letking  
       10 天前
    @zzzzzdai 那你对深度学习是真不懂。
    H97794
        218
    H97794  
       10 天前
    @QlanQ
    "@ferock #175 如果 你始终坚持 特斯拉 是对的,那就到此为止了,你是对的"
    这种东西能用对错区别? 人家上面也表达了,没说 特斯拉是对的.
    不是你,强行代表别人说 特斯拉是对的? 你不是在表达相反的意思?
    那不应该你提点相关的论据?

    "为什么特斯拉不证明一下,只用视觉就足够了,足够优秀了,自动驾驶已经全面落地可用了,甚至 完全自动驾驶已经在排期了呢?"
    特斯拉没 fsd 上路?
    后半句真不要脸了呀!
    tt67wq
        219
    tt67wq  
       10 天前
    @jhytxy 要不是 FDS 把我分扣光我就信了!
    ztty
        220
    ztty  
       10 天前
    @ferock #196 我觉得你的逻辑是不全面的,拿你说的:“你问路,A 和你说往东,B 和你说往西” 例子,你这明显就是只看到了信息源多的缺点,而忽视了优点。

    信息源有冲突的时候,也有不冲突的时候。冲突的时候不知道该怎么办,或者反而因为冲突做了错误的决策都是有可能的,这是缺点。

    而当信息源更多,且不冲突的时候,也可能会做出比单一信息来源算法更正确的决策,这是优点。

    你说的决策悖论只是你自己创造的词,实际上信息源多的时候并不会总是冲突,所以悖论并不存在
    JoshuaEstell
        221
    JoshuaEstell  
       10 天前 via iPhone
    @wy315700 还耳朵呢,城市开车禁止鸣笛,更何况现在多数人开车还戴蓝牙耳机或者车机还放着音乐,甚至乘客和司机之间还会交谈,按照你的说法应该立法统统禁止
    shunia
        222
    shunia  
       10 天前
    @cenbiq #209 你假设了一个前提,就是视觉方案还有巨大的提升空间,并且各家目前都没有在视觉方案上深挖。你的这个假设显然是不成立的。

    中国市场实际只用了非常短的时间就把多维感知的智驾系统切换到了纯视觉方案的智驾系统,这恰恰说明了至少是靠前梯队的智驾产品已经把视觉方案做的足够好了,才能在拆掉其他感知系统之后依然能交付出高水准的智驾系统的。一个足以交付生产的车机系统,绝对不是像我改代码似的几天就做好的事情。

    从国内市场来看,视觉智驾也明显比多维感知智驾要差一些,比如智驾靠前梯队的顶配车型依然是多维感知方案,大部分视觉方案交付的时候都只能先支持高速智驾。这就正好反向证明了,在提供差距不太大的智驾水平的前提之下,视觉系统只是降本的最佳实践,而非更好方案的最佳实践。
    lmmortal
        223
    lmmortal  
       10 天前
    加了雷达也会出事故,相比纯视觉可能降低事故率的作用并不明显,反正出了事故车企也总是在风暴的漩涡,所以就无所谓了
    cenbiq
        224
    cenbiq  
       10 天前   ❤️ 1
    @shunia 但国内自动驾驶即使使用了多维感知方案却仍和 FSD 有差距,这是否说明纯视觉仍然有较大空间?现在存在一套纯视觉自动驾驶方案 > 几乎所有其它多维/纯视觉自动驾驶方案,那么关键因素在哪难道不明确吗?
    shunia
        225
    shunia  
       10 天前
    @cenbiq #223 不是哥们,哪来的“即使使用了多维感知方案却仍和 FSD 有差距”啊?这结论是咋得出来的?你拿 FSD 的哪一代和国内的哪个产品的哪一代,在哪个场景比较得出来得这种结论?

    咱们都读过书,能不能别虚空对比啊?
    param
        226
    param  
       10 天前 via Android
    人走路主要靠视力辨别方向,但是有时候也要靠听力识别周边环境的车辆。没有听力行不行?聋人照样能过马路。舍弃了听力,对总体的影响不大。但戴着耳机过马路就是会更危险。不能说听力完全没用,只是说影响太小。
    AOK123
        227
    AOK123  
       10 天前
    @maxxxxx #157
    决策延迟是整个系统的全局优化问题,跟芯片算力关系也很大。如果其他条件都不变,加入激光雷达肯定会更慢,但我不认为这会产生用户感知上的变化,普通人毕竟人的反应速度只有 200ms 。

    “给用户感觉钝钝的”我认为更多的是取决于决策算法是否足够稳定和果断。举个例子,如果决策不够果断(或者说不够激进),即使整个系统运行在很高的帧率,算法也会为了过分确保安全而在很多情况下选择停车等待,给用户造成钝钝的感觉。特斯拉的决策算法在这方面似乎做的很好,但具体的技术细节不得而知。
    param
        228
    param  
       10 天前 via Android
    补充一下,人在走路的时候,眼睛发挥主要作用。而耳朵能在一些 corner case 起作用。大部份情况还是相信眼见为实,耳听为虚。如果听力成本高,而带来的作用不高,只在一些眼睛看不到的 corner case 起作用,那么放弃听力一样可以走路,节省掉这笔听力成本算了。
    cenbiq
        229
    cenbiq  
       10 天前
    @shunia 行我明白了,你的结论基于你认为纯视觉的 FSD 和其它家方案不存在差距,或则存在高于 FSD 水平的差距,那么可以看下 [FSD 对比 ADS 被吊打,第三梯队果然不过如此-哔哩哔哩] https://b23.tv/sBAgVoy FSD 国内版本和 ADS 同路段日常小路对比,我想开过几年车的应该都能看懂。
    oldcai
        230
    oldcai  
       10 天前
    现阶段什么方案都不成熟。特斯拉技术还算最成熟的了。
    param
        231
    param  
       10 天前 via Android
    激光雷达+视觉比纯雷达更强的情况,也只发生在算法足够聪明把两者数据完全吃透的前提条件下,目前还做不到。虽然给到的数据更多了,但是目前的数据利用率做不到 100%利用。
    param
        232
    param  
       10 天前 via Android
    @cenbiq 我觉得你说的才是正确答案,只有你说出了我的想法。很多事物的原因是复杂的,人们总是只能用简单的思维来理解,所以大部份人因为真理的复杂性都理解不了,只能接受简单版本的答案。
    param
        233
    param  
       10 天前 via Android
    简单的理解,比如说:
    1.激光雷达贵,砍掉省钱
    2.信息更大肯定更加准确
    3.马斯克啥都玩过,所以不会错
    cenbiq
        234
    cenbiq  
       10 天前   ❤️ 1
    @param 是的,我虽然不是行内人,但也能大致理解到自动驾驶存在两个方面,一是驾驶理解能力( 0-100 分,可以假设 60 分为拟人也就是等同于成年人对驾驶的理解),二是感知能力(最低拥有两个摄像头则类似人的水平)。如果驾驶理解能力不足( 6 岁孩童),那么给他增加感知设备带来的总体驾驶水平收益可能是极低极低的,甚至可能是负担。
    cenbiq
        235
    cenbiq  
       10 天前
    @param 我找 GPT 大致推导了一个公式,D=C/100·(1+a·S·P)。S 为传感器量化数,P 为传感器类型维度; S·P 为总体感知能力; a 为感知能力对驾驶水平的影响系数 GPT 提示约为 0.02~0.05 ;
    cenbiq
        236
    cenbiq  
       10 天前
    @cenbiq 然后给定 S=4 (每类 4 个) P=3 ( 3 类传感器),求 C 的收益最大化临界值,它给的结论是

    - 当 C < 37 ,提升 C 的收益更大,优先优化决策与规划能力(如更好的 AI 训练、强化学习)。
    - 当 C > 37 ,感知能力的提升开始逐渐接近甚至超过 C 的提升收益,合理分配资源。
    - 当 C >= 60 ,感知能力的提升变得更有价值,因为决策系统已经足够成熟,可以利用更丰富的感知数据。

    并最终建议

    对于 S = 4, P = 3 这样的较强感知系统:
    - 如果 C < 37 ,应该主要投入资源优化决策与规划能力。
    - 如果 37 <= C <= 60 ,可以同时考虑提升感知能力,但提升 C 仍然更重要。
    -如果 C >= 60 ,感知能力的提升成为主要瓶颈,应重点优化传感器融合、数据处理能力等。

    结合 GPT 的意见,再考虑到融合传感器带来的成本,尤其是考虑到目前 FSD 方案下纯视觉完全没有融合传感器的情况(这可能放大了融合的成本),FSD 极有可能目前仍然认为提升 C 值更具有性价比(并可同时提升 S 来放大 C 的收益,只要不提升 P 也就是传感器维度成本不会爆增加,也就是不融合其它传感器只是加强学习驾驶和增加摄像头,如果 FSD 如此,那么其它投入更小的自动驾驶方案呢?),但这也预示着最终提升 C 、S 值不再具有性价比,到时 FSD 必然只有提升 P 这一个选项,也就是增加传感维度。
    param
        237
    param  
       10 天前 via Android
    @cenbiq
    你的比喻很形象,表达能力比我强,能说出我心里表达不出来的想法。

    另外当传感器已经达到一定数量后,再去堆叠传感器,带来的提升也是边际效益递减的,同样的成本用来提升视觉理解能力反而智能提升更明显。

    也许是其他厂商没有特斯拉这么好的条件、没有这么好的 gpu 、没有这么好的算力去提升视觉理解能力,在视觉理解能力上达到瓶颈了,所以增加传感器带来的提升比钻研视觉理解能力所带来的提升更大。于是这些厂商选择使用激光雷达,对于他们自身的情况是没错的。

    而特斯拉可能因为 ai 的发展、算力的发展,恰恰使他们在视觉能力上的大幅度提升成为可能,于是他们就没有精力采集激光雷达数据做融合多模态训练,而是选择先把基础的视觉理解能力提升上去。当特斯拉在视觉理解能力的提升上遇到了瓶颈,与此同时激光雷达也降到了合适的低价,那时也未必不去考虑增加多一种传感器。正如 llm 的智能提升遇到瓶颈再去搞推理模型一样。
    param
        238
    param  
       10 天前 via Android
    如果我这个说法成立的话,那么特斯拉暂时走纯视觉路线,同时其他厂商继续使用激光雷达,并没有说对说错,都只是选择了符合自身情况的路线而已。
    param
        239
    param  
       10 天前 via Android
    如果我这个说法成立的话,那么特斯拉暂时走纯视觉路线,同时其他厂商继续使用激光雷达,并没有谁对谁错,都只是选择了符合自身情况的路线而已。
    param
        240
    param  
       10 天前 via Android
    并不存在谁对谁错
    llh880808
        241
    llh880808  
       10 天前
    @me1onsoda #168 我只是在用层主的伪仿生学逻辑来反驳他自己

    我不评价这种逻辑成立与否,因为他甚至不能自圆其说,根本不值得进一步讨论
    m4d3bug
        242
    m4d3bug  
       10 天前 via Android
    就算是有雷达也终究需要摄像头识别牌子上的内容做双重判断。从事后重走的视频来看,杂粮在 3 秒前的 3 公里内可以说是做到了 0 识别 0 日志,水马雪糕桶 3 个路牌全部没识别。就算多个雷达没有视觉的双重判断一样是一坨
    szx300
        243
    szx300  
       10 天前 via iPhone
    @Jim142857 #90 从 2 月 25 号收到更新,我也开了快一个月了,每天上下班都要开 FSD ,好多人没体会过我觉得没啥发言权的,现在国内智驾都往纯视觉方案走了!
    szx300
        244
    szx300  
       10 天前 via iPhone
    @w1989378593 #121 才上市一年没到的车企他的智驾能叫智驾吗?没有数据得沉淀,让车主当以命试车!
    szx300
        245
    szx300  
       10 天前 via iPhone
    @ThomasKim #122 那时侯国内还没有 FSD 吧??
    szx300
        246
    szx300  
       10 天前 via iPhone
    @leo7723 #124 EAP 怎么就用不了呢? G60 沪昆江西段修路晚上我开的 EAP 速度在 90 左右,十几个变道到逆向车道有些都没有雪糕筒,EAP 根据地面引导线开的,就是开的体感不舒服。FSD 开通后也跑了次江西,
    szx300
        247
    szx300  
       10 天前 via iPhone
    @shunia #225 我认为他说的没错,最基础的用车人体感上就比国内任何智驾领先,安全防御驾驶也很到位,第一版在国内推出没有本地数据支撑做到这个程度难道不厉害吗?期待后面的更新迭代!
    ferock
        248
    ferock  
       10 天前 via iPhone
    @ztty #220

    所以,你的意思你开车只有信息一致的情况?那你应该去买彩票…


    哪怕只有一次信息不一致。在你的逻辑里,你说怎么办?你说的这个缺点,怎么办?
    ferock
        249
    ferock  
       10 天前 via iPhone
    @ztty #220

    另外,如果信息不冲突…那你要两块时间一样的表干嘛?互相作证吗?那这一刻时间一样了,下一秒不一样了,你又选谁? 手表定律这个词你自己搜索一下吧


    说了多少遍了,怎么总是觉得自己会比别人更聪明
    https://m.xbiao.com/20150423/31290.html
    lianyue
        250
    lianyue  
       10 天前
    差生 文具多
    herozzm
        251
    herozzm  
       9 天前 via iPhone
    @tt67wq 你还在依赖网上带节奏的言论,你根本没仔细看,如果是个人压线或者其他操作其实很正常,你人可能比 fsd 扣分还严重,一句话你最容易被带节奏,自己根本不用心去看其中猫腻和细节,无法形成自己的认知
    herozzm
        252
    herozzm  
       9 天前 via iPhone
    @tt67wq 网上那个扣分视频明显就是带节奏的,几点:
    1. 就算正常的人不会深夜去处理违章
    2. 不可能每个违章都会被拍并罚款,短短一个 fad 试驾就那么多的一打实锤罚款不科学,比我从拿驾照开车到现在十几年还多,我平时驾驶还不怎么守规矩,实线并到➕闯红灯也经常干(明显就是故意带节奏)
    herozzm
        253
    herozzm  
       9 天前 via iPhone
    我发现国内自我批判认知咋这么难,一堆人拿着明显错漏百出的带节奏信息来堂而皇之的当证据
    herozzm
        254
    herozzm  
       9 天前 via iPhone
    还有几个视频 对比某为和 fsd 的智驾,博主很无力地说点进去都懂的,不敢说某为坏话
    maxxxxx
        255
    maxxxxx  
       9 天前
    @herozzm 陈震的观众可以说是互联网被筛选出来最蠢的那一拨人了。
    param
        256
    param  
       9 天前 via Android
    端到端时代,激光雷达很难派上用场,还有一个原因在于,我们只能采集到优秀司机用眼睛开车的数据,司机自己无法透视。一些激光雷达能够透视的场景,用 if else 编程的方式确实可以控制,但是想要让这种透视的驾车经验训练进端对端模型,就必须要有一批司机拿着激光雷达的透视云点图来进行开车,生产出大量的透视开车经验数据,这才能办得到。
    ferock
        257
    ferock  
       9 天前 via iPhone
    @herozzm #254
    param
        258
    param  
       9 天前 via Android
    人用视觉开车,特斯拉也用视觉。这话应该这么理解的。
    人类通过眼睛开车的经验可以录制下来作为训练素材练成端对端模型,这是真正的人工智能。
    而激光雷达做不到,没有这种经验可以学习,只能用编程式控制,那不是真正的人工智能。
    1  2  3  
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1103 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 24ms · UTC 17:51 · PVG 01:51 · LAX 10:51 · JFK 13:51
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.