迄今为止提出的许多MRC模型在各种任务和数据集中都显示出超越人类能力的评估值,但我认为在被问到时很难轻易说是,您是否比人类更了解给定的背景?
首先,关于当前的MRC技术是否真正“理解”有许多差异。理解和消化内容,然后回答,显然不同于学习问题的类型以及在给定文章中查找和组合特定模式以产生输出。
第二,目前的MRC任务,评估指标和数据集反映“现实世界”的程度尚不清楚。 Link的论文是解决这一部分的第一项工作,它分析了57个MRC任务和数据集,并对任务,评估指标和数据集进行分类和定义。大多数研究过此页面的人都知道它,但是对于一次组织它的目的来说似乎不错。
本文作为一个未解决的问题(1)当前MRC技术的哪些方面应加以补充? (2)最后,我们提出两个主题:对“理解”我们了解多少?我认为,这都是进入类似于人类的AI所需要考虑的事情。