(原标题:机器能做阅读理解!中国团队夺得国际顶级赛事冠军)
机器能做阅读理解!中国团队夺得国际顶级赛事冠军
新华社合肥8月6日电(记者汪奥娜)近日,由斯坦福大学发起的SQuAD(Stanford Question Answering Dataset)挑战赛榜单更新成绩。在这一机器阅读理解领域的国际顶级赛事中,科大讯飞与哈工大联合实验室(HFL)提交的系统模型在来自全球学术界和产业界的研究团队中夺得第一名。
这是记者从科大讯飞股份有限公司获悉的。“机器阅读理解的背后是对知识的理解、推理与表示,是人工智能在认知方面接近人类的重要突破口,因此该赛事成为各家主流科技研究团队的逐鹿之地。”科大讯飞人工智能研究院副院长王士进表示。
SQuAD挑战赛通过众包的方式构建了一个包含10万个问题的机器阅读理解“题库”,由人工标注者提出并回答。参赛者提交的系统模型需要在阅读文章后,用词、词组或句子回答问题,然后与人工标注的答案比对,最终得到精确匹配和模糊匹配的结果。
由于竞争激烈,SQuAD平台自去年推出后,挑战赛的榜单不断被刷新。这次哈工大讯飞联合实验室取得了精确匹配77.845%和模糊匹配85.297%的成绩,刷新了微软亚洲研究院之前创造的记录。
据了解,夺冠模型为“基于交互式层叠注意力模型”,最大的特点在于可以通过“自发学习”的方式找到问题对应原文的片段。
“我们的模型可以根据给定的问题对篇章进行多次过滤,同时根据已经被过滤的文章进一步筛选出问题中的关键提问点。也就是说,不只从问题到篇章,也从篇章到问题,交互式地逐步精确答案的范围,这是与其他参赛队伍最为不同的特点。”王士进说。
王士进表示,机器现在已经能给试卷主观题评分,未来还能根据卷宗做法条预测,甚至能针对病历提出治疗建议。下一步,哈工大讯飞联合实验室将在工业化应用的尝试中,通过现实海量数据的不断测试,找到模型优化的方法。模型的变种将可能应用于教育、司法、医疗等多个领域。(完)
(原标题:机器能做阅读理解!中国团队夺得国际顶级赛事冠军)