V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
这是一个专门讨论 idea 的地方。

每个人的时间,资源是有限的,有的时候你或许能够想到很多 idea,但是由于现实的限制,却并不是所有的 idea 都能够成为现实。

那这个时候,不妨可以把那些 idea 分享出来,启发别人。
gamexg
V2EX  ›  奇思妙想

有没有人实现一个易于计算机理解的语言?人工智能三步走。

  •  
  •   gamexg · 2015-12-05 20:40:55 +08:00 · 2503 次点击
    这是一个创建于 3294 天前的主题,其中的信息可能已经有所发展或是发生改变。

    第一步:
    设计一个中立语言,实现中立语言到中文、英语等语言的转换。
    中立语言要求设计成为易于计算机理解,易于转换到其它语言。
    书写的时候就明确指定语句的意思,后期计算机就能自动翻译到其他语言了。
    不过感觉这个会比重建一个维基百科的难度还大 9999999 倍。

    第二步
    中文、英文等语言到中立语言转化。
    将互联网上的资料转换到中立语言。

    歧义、歧义、歧义!

    第三步
    将第二步获得的中立语言资料的内容抽取出来,建立一个已经建好索引的资料库。
    不过这个资料库会出现好多逻辑错误...

    不要求全部实现,第一步实现就能节省很多翻译的工作了。

    第 1 条附言  ·  2015-12-08 16:47:37 +08:00
    这个想法的主要起因是看到一些 api 文档之类的东西由各个国家的志愿者翻译成多国语言很麻烦。感觉这里如果有计算机参与应该更方便些。(google 译者工具箱定制功能太弱)

    想达成的目标: 一次输入,多语言输出,成为翻译辅助工具。学习 java ,但是绝对会比 java 还麻烦, java 是一次编译处处调试,这个是一次录入(很麻烦),处处补充(语义)。

    一次麻烦的输入指的是人工标明语义信息(即转中立语言),目前自然语言处理主要的麻烦是歧义,这里要求人工确认歧义,应该会降低实现的难度。

    多国语言输出是依靠之前标明的语义信息来查询语义库内最相近的内容然后输出。感觉这里主要是看语义库丰富程度了,越丰富翻译质量越好。不过这里难度很大,如果不限制环境这个语义库应该是不可能完成的任务。不过感觉可以通过限制文档类型(计算机 api 方向,不包含俚语之类的内容)的方式降低整体的难度。而且每次翻译都可以人工补充。
    14 条回复    2015-12-08 09:15:55 +08:00
    XianZaiZhuCe
        1
    XianZaiZhuCe  
       2015-12-05 21:12:41 +08:00 via Android
    这跟人工智能有啥关系?
    watzds
        2
    watzds  
       2015-12-05 21:13:48 +08:00 via Android
    中立语言,英语?
    dikcen
        3
    dikcen  
       2015-12-05 21:14:05 +08:00
    nbndco
        4
    nbndco  
       2015-12-05 21:23:24 +08:00 via iPhone
    我觉得在对 NLP 展开各种宏大想象之前至少先理解一下 NLP 吧
    RqPS6rhmP3Nyn3Tm
        5
    RqPS6rhmP3Nyn3Tm  
       2015-12-05 22:12:53 +08:00 via Android
    有很多人造语言,你说的应该是理语,也叫逻辑语。
    然而并没有什么卵用,连世界语使用者都比它多
    Yvette
        6
    Yvette  
       2015-12-05 22:23:21 +08:00 via iPhone
    手语
    msg7086
        7
    msg7086  
       2015-12-06 07:35:28 +08:00
    没有歧义?来我们先学法语吧。
    haogefeifei
        8
    haogefeifei  
       2015-12-06 11:58:42 +08:00
    逗。
    gamexg
        9
    gamexg  
    OP
       2015-12-06 14:55:54 +08:00
    @XianZaiZhuCe 原因当时刚刚在 V2EX 看到了要抛弃身体变成人工智能的帖子...

    @watzds @dikcen @BXIA @Yvette @msg7086 知道世界语之类的语言,但是不是这种类型的。设想中立语言并不是可读、可书写的语言,而是附带很多属性的,恐怕只能通过计算机使用的语言,例如:

    录入“我很悲伤”这句话时计算机会猜测一些属性(歧义)要用户确认,例如"我"会标识性别属性,悲伤会标识程度、类型之类的属性。

    语言本身就附带这些属性,感觉向其它语言转换就容易些了。当然建立这些资料的难度也是很难实现的。猜测只有单词量少、语义简单的环境才有可能实现,计算机 API 之类的文档环境可能有点希望...

    @nbndco NLP 只知道目前主流是通过神经网络、统计学做的, 语义规则的难度太大,已经不是主流了。主要的难度就是歧义、模糊性,但是第一步试图将这个麻烦在书写时由人类解决掉,或者说第一步实现的目标是一次书写,自动输出多种语言。不过前面也说了感觉这个的难度也是近乎不可能实现的...
    watzds
        10
    watzds  
       2015-12-06 18:29:01 +08:00 via Android
    然而大家说的都是中文,却很难交流
    yangzh
        11
    yangzh  
       2015-12-06 18:59:52 +08:00 via iPhone
    llvm
    nbndco
        12
    nbndco  
       2015-12-06 20:57:01 +08:00
    @gamexg 你要做的事情没有意义,只不过你把当前的计算机保存语义信息的任何方法起了个名字,把那些二进制信息起名叫做“ XX 中立语言”罢了。然后难点又在第二步,那你的中立语言究竟有何意义?
    如果你说要显式定义中间变量的表现形式,这样的优越性何在?不就是你说的几十年来的规则。
    miao1007
        13
    miao1007  
       2015-12-07 22:58:01 +08:00
    你需要垠语言
    evilic
        14
    evilic  
       2015-12-08 09:15:55 +08:00
    "中立语言要求设计成为易于计算机理解",看看中立语言搞成 0 和 1 可以么?易于机器理解,而且还像阿拉伯数字那样中立……
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5100 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 24ms · UTC 07:38 · PVG 15:38 · LAX 23:38 · JFK 02:38
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.