V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
Leesky
V2EX  ›  问与答

对于 450 个 50000 维的数据样本,有什么好的方法做降维嘛?

  •  
  •   Leesky · 2018-12-07 01:52:41 +08:00 · 1349 次点击
    这是一个创建于 2197 天前的主题,其中的信息可能已经有所发展或是发生改变。

    数据可能存在共线性问题,但是想用非线性降维,然后用非线性分类器做二分类预测,但是想不到好的降维方法。

    6 条回复    2018-12-08 22:23:12 +08:00
    szxczyc
        1
    szxczyc  
       2018-12-07 03:11:39 +08:00 via iPhone
    做过 100000 个 8000 维的,二分类,没有降维,特征工程。
    binux
        2
    binux  
       2018-12-07 04:45:29 +08:00 via Android
    维度比样本数多那么多。。。人肉先验知识降吧。。
    Mohanson
        3
    Mohanson  
       2018-12-07 07:58:39 +08:00 via Android
    shakoon
        4
    shakoon  
       2018-12-07 08:18:48 +08:00
    乘法交换律了解一下
    Leesky
        5
    Leesky  
    OP
       2018-12-08 22:23:00 +08:00
    @Mohanson 我是想尝试用 t-sne 来着,但是看了下是做降维可视化的,而且降到 2,3 维,但是我需要找的维数不可能这么低,所以现在也在试试用这个 t-sne 自己设置自由度,看效果如何
    Leesky
        6
    Leesky  
    OP
       2018-12-08 22:23:12 +08:00
    @szxczyc 我也是做二分类的
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   4594 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 23ms · UTC 05:40 · PVG 13:40 · LAX 21:40 · JFK 00:40
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.