V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
windirt
V2EX  ›  程序员

这样的汉字排列组合还能弄出更多吗?

  •  
  •   windirt ·
    windirt · 2016-07-08 14:38:22 +08:00 · 3439 次点击
    这是一个创建于 3060 天前的主题,其中的信息可能已经有所发展或是发生改变。
    问题是没有钱
    有钱是没问题
    没有钱是问题
    问题是钱没有
    钱没有是问题
    钱有没有問题 
    是有钱没问题
    是没钱有问题
    是钱没有问题
    有问题是没钱
    没问题是有钱
    没钱是有问题
    

    表面上看是六个字,随机排列,理论上是 6 的阶乘 720 个,但是因为汉字词组问题占用了两个字,以及不能放在问题前面等等的汉语语义条件限制了最终的可用输出数量,求以程序化的方式实现输出更多的符合汉字语义的组合

    10 条回复    2016-07-09 09:57:45 +08:00
    lzhr
        1
    lzhr  
       2016-07-08 15:03:45 +08:00
    可以找找语义分析的 api
    mizuki
        2
    mizuki  
       2016-07-08 16:06:34 +08:00
    钱是没有问题
    acros
        3
    acros  
       2016-07-08 16:21:37 +08:00
    这个排列能靠计算机处理吗···

    是钱有没问题?
    forty
        4
    forty  
       2016-07-08 16:35:52 +08:00
    谁说钱不能放在问题前面?有没钱,问题是。口语这么说很正常,叫做倒装句。
    forty
        5
    forty  
       2016-07-08 16:37:53 +08:00
    是没钱,问题有。没钱,问题是有。
    rock_cloud
        6
    rock_cloud  
       2016-07-08 16:42:25 +08:00
    找个大一点的语料库,然后把包含这六个字的所有长度为 2 到 6 的组合提取出来,并统计出现的频率。
    S_{w_i^n}
    w^n 是所有长度为 n 的组合, w_i^n 是第 i 个长度为 n 的组合
    定义一个打分:
    \sum_{n=2}^6{n!S_{w_i^n}} 如果 w_i^n 在枚举的组合中出现。
    最终把所有的枚举按照打分排序,估计差不多。
    forty
        7
    forty  
       2016-07-08 16:43:29 +08:00
    问:没有题是钱?
    问:有题是没钱?
    钱?是问有题没……
    binjoo
        8
    binjoo  
       2016-07-08 16:45:39 +08:00
    这是汉语几级?
    forty
        9
    forty  
       2016-07-08 16:45:42 +08:00
    没有题是问钱
    dandycheung
        10
    dandycheung  
       2016-07-09 09:57:45 +08:00
    题是没有问钱、没问钱是有题
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2473 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 83ms · UTC 02:27 · PVG 10:27 · LAX 18:27 · JFK 21:27
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.