V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
Livid
V2EX  ›  正则表达式

全角标点符号有自己的 Unicode 范围么?

  •  
  •   Livid · 2014-09-10 15:59:56 +08:00 · 1982 次点击
    这是一个创建于 3745 天前的主题,其中的信息可能已经有所发展或是发生改变。
    比如 。 , …… ;这样的全角标点符号,是否有一个明确的 Unicode 范围?
    4 条回复    2014-09-10 16:59:11 +08:00
    timonwong
        1
    timonwong  
       2014-09-10 16:04:56 +08:00   ❤️ 1
    如果只考虑CJK:

    3000..303F; CJK Symbols and Punctuation

    Resource: http://unicode.org/Public/UNIDATA/Blocks.txt
    Livid
        2
    Livid  
    MOD
    OP
       2014-09-10 16:10:39 +08:00
    @timonwong 嗯,要的就是它。

    http://www.unicode.org/charts/PDF/U3000.pdf

    多谢。
    dorentus
        3
    dorentus  
       2014-09-10 16:13:52 +08:00
    我首先想到的是这个: http://en.wikipedia.org/wiki/CJK_Symbols_and_Punctuation
    但是省略号是用的这里的: http://en.wikipedia.org/wiki/General_Punctuation_(Unicode_block)
    然后还有这个: http://en.wikipedia.org/wiki/Halfwidth_and_Fullwidth_Forms_(Unicode_block)

    有个好玩的事情,U+FF61 和 U+3002 都是全角句号的样子,在浏览器里面搜索我自己打出来的全角句号的话,也都能匹配到。
    imn1
        4
    imn1  
       2014-09-10 16:59:11 +08:00
    unicode全角符号有几个范围,有些是相像但跟GBK并不对应的(只有汉语,没装日语或其他相关字体会显示不出来)

    http://www.unicode.org/charts/ 搜fullwidth
    应该是FF00里面的才跟GBK/BIG5/EUC-KR里面的全角对应
    3000没有细看,记忆中是跟SHIFT-JIS的全角对应
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   857 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 23ms · UTC 21:06 · PVG 05:06 · LAX 13:06 · JFK 16:06
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.