V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
say2old
V2EX  ›  问与答

这种乱码“ɧŮÈ˵İ×ÄÛ´óÐغͺÚË¿”是怎么产生的?

  •  
  •   say2old · 2016-08-31 22:13:56 +08:00 · 6485 次点击
    这是一个创建于 2997 天前的主题,其中的信息可能已经有所发展或是发生改变。

    有人知道像网页 http://www.mafengwo.cn/i/3157416.html 上这种乱码,是什么编码误存成 utf-8 导致的吗?是否可以还原?

    32 条回复    2017-05-10 23:50:29 +08:00
    smithtel
        1
    smithtel  
       2016-08-31 22:25:59 +08:00
    还原就不要想了。。
    say2old
        2
    say2old  
    OP
       2016-08-31 22:36:03 +08:00
    为啥?感觉是一种编码被误当做另一种编码存储了,信息本身并没有任何丢失,应该可以还原吧?
    @smithtel
    publicID002
        3
    publicID002  
       2016-08-31 22:39:05 +08:00
    @say2old 映射应该不是一一对应的,所以信息应该有丢失
    SoloCompany
        4
    SoloCompany  
       2016-08-31 22:58:16 +08:00
    骚女人的白嫩大胸和黑丝
    SoloCompany
        5
    SoloCompany  
       2016-08-31 23:01:00 +08:00   ❤️ 31
    echo ɧŮÈ˵İ×ÄÛ´óÐغͺÚË¿ | iconv -t latin1 | iconv -f GB18030
    ETiV
        6
    ETiV  
       2016-08-31 23:05:08 +08:00
    @SoloCompany 看了眼你头像, 心中默念了阿弥陀佛...
    andrewpsy
        7
    andrewpsy  
       2016-08-31 23:06:21 +08:00
    @SoloCompany 破帖服
    shoaly
        8
    shoaly  
       2016-08-31 23:08:59 +08:00
    @SoloCompany 完美的诠释了 talk is cheap, show them the code
    larry1594
        9
    larry1594  
       2016-08-31 23:11:39 +08:00
    @SoloCompany 你怎么识别这是 latin1 的?
    SoloCompany
        10
    SoloCompany  
       2016-08-31 23:13:10 +08:00 via iPhone
    @larry1594 因为 iso-8859-1 太长了输入困难
    larry1594
        11
    larry1594  
       2016-08-31 23:18:47 +08:00
    @SoloCompany 你是默认对方用的 latin1 还是猜的,还是经验。非常好奇,谢谢指教!
    SoloCompany
        12
    SoloCompany  
       2016-08-31 23:21:12 +08:00 via iPhone   ❤️ 2
    @larry1594 latin1 真的不用猜的,特征太明显了
    msg7086
        13
    msg7086  
       2016-08-31 23:22:53 +08:00   ❤️ 2
    @larry1594 除了 latin1 还有哪个乱码会被如此广泛使用的?
    liqingcan
        14
    liqingcan  
       2016-08-31 23:23:58 +08:00
    上头那个一眼看穿编码的,服!
    SoloCompany
        15
    SoloCompany  
       2016-08-31 23:27:02 +08:00 via iPhone
    @msg7086 严格来说 latin1 并不是编码,只是把 byte seq 还原出来而已
    msg7086
        16
    msg7086  
       2016-08-31 23:27:51 +08:00
    @SoloCompany 所以我说乱码 XD
    MySQL 的默认设定害死人。
    jsrc
        17
    jsrc  
       2016-09-01 00:05:03 +08:00
    强力围观
    panlilu
        18
    panlilu  
       2016-09-01 00:11:39 +08:00
    服气
    czb
        19
    czb  
       2016-09-01 05:49:06 +08:00 via Android
    服气
    mringg
        20
    mringg  
       2016-09-01 07:44:18 +08:00 via Android
    服!!!!
    jeffw
        21
    jeffw  
       2016-09-01 08:19:25 +08:00 via iPhone
    服!
    sunhr
        22
    sunhr  
       2016-09-01 08:49:46 +08:00
    服!
    say2old
        23
    say2old  
    OP
       2016-09-01 09:17:02 +08:00
    @SoloCompany 厉害!服!
    honk
        24
    honk  
       2016-09-01 09:23:44 +08:00 via Android
    Phariel
        25
    Phariel  
       2016-09-01 09:25:53 +08:00 via Android
    @SoloCompany 破站服!!!
    DJBird
        26
    DJBird  
       2016-09-01 09:28:40 +08:00
    @SoloCompany 大神果然老司机:thumbsup:
    lxy
        27
    lxy  
       2016-09-01 09:39:56 +08:00
    几年前还是学生的时候,在微博上关注了一个 80 后美女作家,有天她抱怨, futureme 给她发来的邮件变成了乱码,并且附了一段。后来我用 notepad++以及好像是 UE 十六进制编辑尝试了各种转码,最后解了出来,并发到她的评论区。半天后我再看,我的评论没了,于是反思了一下,大概是内容暴露了她几年前就已经有男朋友的事实……
    mgcnrx11
        28
    mgcnrx11  
       2016-09-01 09:50:52 +08:00 via iPhone
    @lxy 哈哈
    petelin
        29
    petelin  
       2016-09-01 10:58:20 +08:00
    之前一直在想 python 的编解码,,,所以 python 来一波,原因的话就是 gbk 编成的 bytes 用 iso-8859-1 解码了,可以看出来,每一个字符都不超过 255 ,
    ```
    In [71]: for c in 'ɧŮÈ˵İ×ÄÛ´óÐغͺÚË¿':
    ...: print(ord(c),end=',')
    ...:
    201,167,197,174,200,203,181,196,176,215,196,219,180,243,208,216,186,205,186,218,203,191,
    ```
    左边 python3 右边脑残 python2
    ![]( )
    hicdn
        30
    hicdn  
       2016-09-01 12:39:17 +08:00
    文章利用的 cp1252 ,但是不能完全解出来
    SoloCompany
        31
    SoloCompany  
       2016-09-01 13:36:39 +08:00 via iPhone
    @hicdn 文章是 utf8-latin-utf8
    但转码过程中由于编码空间问题已经丢失了部分信息
    aleen42
        32
    aleen42  
       2017-05-10 23:50:29 +08:00
    跟帖服`
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2790 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 28ms · UTC 12:12 · PVG 20:12 · LAX 04:12 · JFK 07:12
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.