问题通常称为问答任务,旨在从成对记录问题和答案的数据集中学习,以便在提出问题时生成适当的答案。您可以想到一个聊天机器人,与此不同的是,问题生成是一项任务,当您给它提供一个段落时,它会自动生成可以出现在该段落中的问题。
该技术可用于自我监督学习中,该学习可自动生成和学习用于问答任务的数据集,也可用作实现聊天机器人“ suntalk”的技术。下面的github存储库是使用SKT KoGPT-2创建的问题生成模型,也可以下载经过训练的模型。
codertimo / KorQuAD-Question-Generation
KorQuAD数据集的问题生成模型。通过在GitHub上创建一个帐户,为codertimo / KorQuAD-Question-Generation开发做出贡献。
另外,以下链接是有关如何使用Google的多语言语言模型mT5创建多语言问题生成模型的文章。
如何优化mT5以创建问题生成器🤔(适用于100多种语言)
自Google发布大规模的多语言模型mT5以来,已经过去了一个月。我非常兴奋能够使用mT5进行一些疯狂的实验。关于mT5的特殊怪癖是它能够执行任何…
为了创建一个主动提出问题而不是被动回答的对话模型,除了产生问题之外,还有很多其他方面需要思考,例如确定何时提出问题,但是似乎需要所有这些技术要素才能实现更自然的对话。