IBM的人工智能辩论机器:如果有血液,我的血液将沸腾

  • 时间:
  • 浏览:1

  (上图为2018年6月18日旧金山举办的Project Debater人机辩论公开赛)

  “I can't say it makes my blood boil, because I have no blood. But it seems some people naturally suspect technology because it's new. (原困我有血液,它将你不后能 的血液沸腾。有什么都人火山岩石石的怀疑新技术,原困这是新的。)”IBM的人工智能辩论系统Project Debater(以下简称: Debater)在2018年6月18日在旧金山举办的一次公开现场人机辩论赛中,就“远程医疗”什儿 辩论进行陈述时,那么陈词。

  Debater是人类历史上首次出显的不后能 与人类对手进行简化辩论的AI人工智能系统,旧金山辩论赛的人类对手为曾在2016年获得以色列国家辩论冠军以色列大四女生Noa Ovadia和以色列国际辩论协会主席Dan Zafrir。Debater与两位人类辩手在两场辩赛中,成功在“否有应该增加使用远程医疗”辩论中扭转了更多现场观众的最初观点。

  无论是人类辩手还是Debater,详细时会现场拿到辩题并临时准备。现场观众的评价是:整体来看,人类辩手的表达更好,但AI辩手传递信息量的雄厚度则优于人类。Debater历时逾六年研发,是IBM继1997年打败人类国际象棋大师的“Deep Blue”(深蓝)和2011年在益智游戏节目《危险边缘》国战胜人类冠军的“Watson”(中文音译:沃森)以后 的又一里程碑。

  显然,人工智能在国际象棋中要学习的是层厚应用进程化的游戏规则、在益智游戏节目中要学习的是冷冰冰的百科知识,而与人类辩论则要理解和掌握人类的政治、文化、法律、宗教、经济甚至是夫妻感情和艺术等非理性内容,一并时要在短时间内完成广泛而层厚的阅读理解以及长篇陈述表达,表达除要有简化的逻辑外,时要融入适当的幽默和情绪以感染现场观众。种种挑战,原困成功,亦如Debater的阐述:原困我有血液,我的血液将沸腾。

  就在2018上海人工智能大会前夕, 笔者采访了IBM海法研究院的三位科学家,深挖了Project Debater手中的AI技术、科研价值,及其在AI发展历程中的地位。

  36篇顶级学术论文

  【上图为Project Debater首席研究员Noam Slonim博士(右)、Project Debater全球经理Ranit Aharonov博士(左)接受视频采访】

  Debater是由IBM Research开发的AI技术集成项目,该项目由IBM研究院以色列海法实验室于2011年提出。与传统辩论相同,Debater与人类辩手各有4分钟陈述自己论点,4分钟反驳对方论点,2分钟总结陈词。

  对于给定的主题,Debater系统会在巨大的知识库内进行搜索,寻找最相关的观点和证据,或者在其中选者最吸引人、最简化、支持度最高的论点,把那先 构建成好几个 详细的观点加以叙述。与人类辩手一样,Debater以后 并我不知道辩题,在现场非要60 分钟左右的准备时间。当Debater知道了辩题后的60 分钟之内,就会通过自己的算法在知识库和语料库中搜索,形成不不利于自己论点的论证。

  六年来,IBM研究院团队为Debater系统赋予了三种能力,主次能力都可开创新的人工智能领域:数据驱动的演讲稿撰写和表达——Debater第一次证实了计算机不想后能 消化海量语料库,针对给定的有争议的简短主题描述,不想后能 撰写社会形态良好的演讲内容,并清晰且有针对性地表达出来,甚至时会适时地展现幽默感;听力理解——不想后能 识别长段连续口语中隐含的重要概念和观点;模拟人类困境——通过独特的知识表达最好的办法来模拟人类争议和困境,使系统不想后能 根据时要提出有原则的论点。

  截止到2018年9月,Debater项目一共在6大研究领域诞生了36篇国际性学术论文以及相关的数据集。

  其中,在海量语料库挖掘辩论内容领域(Argument Mining),涉及:在语料库中侦测论点、在语料库中自动侦测证据、自动表态论点、通过循环预测进行论点综合分析、整个语料库中无监督式论点侦测、弱监督式论点内容搜索引擎、用自然语言计算辩论质量、辩论质量评估、用联合推理模型进行辩论关系分类等9篇学术论文。

  在层厚神经网络和弱监督领域,涉及:用弱监督学习抽象概念、用弱监督学习训练辩论内容搜索引擎、用于提高辩论内容挖掘神经网络的高质量人工标注数据与低质量自动产生数据的混合、近似句侦测、语音输出时的强调词预测和强调句预测、辩论表达时的停顿预测、自动辩论内容识别、辩论打分等9篇国际学术论文。

  在自然语言防止领域,涉及:用概念图谱表达文本语义的相关性、侦测辩论社会形态和框架等4篇国际学术论文。在文本到语音转换领域,涉及:改进演讲稿模型等3篇国际学术论文。此外,还产生了7篇数据集相关的国际学术论文。

  IBM以色列海法研究院Project Debater首席研究员Noam Slonim博士表示,尽管是六年以后 刚开始Debater的研究,但时值今日依然认为一切工作才以后 起步,就计算辩论三种而言详细时会太满有趣的问题报告 图片等待的图片 被发掘。

  找到用于决策的有效信息

  (上图为IBM 以色列海法研究院AI Tech副总裁Aya Soffer博士接受视频采访)

  AI领域的重大挑战是那先 ?在AI领域应该关注那先 样的人类问题报告 图片,从而以关注的问题报告 图片去推动AI领域的下一步发展?

  IBM 以色列海法研究院AI Tech副总裁Aya Soffer博士表示,在真实的世界中暂且时要回答什么都琐碎的问题报告 图片,或者要回答真正重要的问题报告 图片,从而做出真正重要的决策。从海量信息中找到不不利于正确决策的信息,是非常困难的:首先,能帮助许多人做出正确决策的信息量以后 就少;其次,如何找到那先 信息就更加困难。或者,从对于决策的重要性出发,IBM研究院六年前选者要把辩论作为AI的下好几个 重大挑战做研究,或者使得AI拥有辩论的功能和用途。

  辩论是好几个 开放式的挑战,这与以后 AI所防止的挑战详细不同。以后 的AI挑战老是 有具体的衡量指标用于判断输赢,而在辩论中则那么明确的最好的办法进行打分。辩论中就像实际的商业决策一样,那么清晰而简单标准,不后能 用分数高低衡量输赢。Debater项目的三种目标或者建立好几个 系统,帮助许多人在答案详细时会非黑即白时,作出基于证据的决定。

  辩论在算法方面的重大挑战包括Debater不后能 听长达4分钟的内容,对方人类辩手在讲的过程中原困是更快的语速,充满激情的演说,一并还带有道德性、伦理性陈述,Debater要在听力理解中做到不想后能 理解对方所表达的主旨。这与业界所熟悉的自己智不利于手详细不同,原困像自己智不利于手类AI只时要听懂话语就不后能 ,比如开灯、关灯,而Debater要在很长的话语中听懂对方的主旨。

  此外,在辩论刚开始时要做好几个 本方观点开场白,即观点陈述文章,要求Debater具有自动写成功能,不后能 具有说服力的清晰地阐述。Debater还总结了人类专家辩手的一点共性,进行模拟、建模后注入到系统中,就形成了好几个 知识图谱。一旦刚开始辩论,Debater就不后能 在原困形成的知识图谱中进行索引和导航,找到不后能 支撑观点的证据。

  走近人类的智慧网

  “关于AI的下一步,或者智慧网上那么接近人类。我实在Debater是好几个 很好的例子,它展示了许多人如何教授机器,或者有雄厚的时间、充分的数据和算法就不后能 充分前进。”Aya Soffer表示。

  就Debater三种的下一步发展,Noam Slonim表示,人类的辩论能力包括好几个 主次,也或者几千年前亚里士多德提出的辩论三原则:逻辑(logos)、表达(ethos)、夫妻感情(pathos)。亚里士多德以后 指出辩论术是对话中辩驳的技术,而修辞学则是演讲中说服的技术,两者在表现形式上不同,但却有着内在的一致性。现在的AI还非要关注到逻辑三种,而对于自己的立场、向对方传达信息时所带有的色彩、传递最好的办法和修辞表达最好的办法的研究还很少。

  今天的Debater仍然是好几个 初级阶段,但原困不想后能 向世界展示它的可行性和可达到性。那么,Debater以后 的下好几个 挑战是那先 ?

  Aya Soffer认为,下好几个 挑战或者要你不后能 工智能更像人类。就好像好几个 小孩子去上学,看完两三张大象的图片后,协会了暂且同的层厚看大象,那么再下一次再看完大象的图片,即使是其它的层厚不后能 知道这是大象,也或者人不后能 理解概念,或者在概念的基础上学以致用到新的领域,什儿 开放域的强应用能力是目前机器不具备的。

  目前AI再发达,尚非要把概念进行学以致用的应用。IBM研究员们希望AI下一步的发展是从比较窄的例子上学习,而后扩展到比较宽泛的领域、跨不同领域的应用,以及不想后能 从概念上学习。这详细时会再学习的能力,或者具备不想后能 自行推理的能力。

  对于Debater的商业应用,将不不利于各类决策。辩论三种详细时会源于冲突和竞争,或者源于更有建设性的讨论。辩论雄厚了决策制定的过程,帮助许多人权衡新想法、新理念的利弊。辩论暂且是为了说服他人,也是为了理解和学习彼此的观点,做出更加无偏见的决策。

  IBM以色列海法研究院Project Debater全球经理Ranit Aharonov博士表示,Debater的原困商业应用范围包括:金融顾问,通过Debater找出金融事实,用以支持或反对金融分析师所思考的金融投资选者;律师,借助Debater来寻找相关案件和主张,或借助Debater模拟法庭辩论来分析优势和劣势;公共事务决策,通过Debater公正的优/缺点分析和对人类困境的模拟,为决策提供基于事实、那么人为偏见的观点;企业决策,通过Debater拓宽思路,在关键决策中纳入原困那么考虑到的新观点等。

  展望未来,实在计算辩论是好几个 崭新的科学领域,或者所支持的是人类非常古老和传统的辩论文化。对于计算辩论的研究,无论是人工智能三种,还是研究学者,详细时会“热血沸腾”式里程碑式,将对人类的前途有着深远的意义和影响。