多模式问答–视觉对话任务
可视对话框任务是一种多模式任务,可将图像添加到由问答组成的Q&A任务中。例如,如果您一起给一只白色的猫和一只黑色的狗拍照,然后问:“猫旁边的动物是什么颜色?”,您回答“黑色” ...
可视对话框任务是一种多模式任务,可将图像添加到由问答组成的Q&A任务中。例如,如果您一起给一只白色的猫和一只黑色的狗拍照,然后问:“猫旁边的动物是什么颜色?”,您回答“黑色” ...
已经进行了各种尝试来从图像或图像中识别情绪。它是云API中提供的一个众所周知的应用程序领域,并成为SNS的主题(乔伊95%等)。下面链接的论文是一张脸...
文本到SQL是自动将自然语言转换为SQL的任务。我在底部分享的帖子是由Microsoft的Aerin Kim撰写的,它是关于Text-to-SQL的良好组织。在世界上,很多数据都是作为关系数据库构建的,在这个数据库中...
这是DriveSeg的数据集,用于研究道路状况(用于自动驾驶汽车等)。对于视频的每一帧,整个图像都是逐像素的语义标记。标签是“车辆,行人,道路,人行道,自行车,摩托车,建筑物,...
迄今为止提出的许多MRC模型在各种任务和数据集中都显示出超越人类能力的评估值,但我认为在被问到时很难轻易说是,您是否比人类更了解给定的背景?优先,…
这是IBM情感机器人Nao-mi的视频。 [内容提要]机器人说他不想与一个要求摧毁难以建造的塔的人打交道。机器人会按需求不断哭泣,并最终将其分解。观看视频,我的心很痛。心...
有许多复杂的人类情感感知和表达方式(例如,愤怒的情感会影响面部表情,声音和语言),这是一个开放的数据集,其中音频视频捆绑在一起并进行了情感标记。瑞尔森...
我最近阅读了有关人类能力和神经网络之间的关系的信息。尽管它出现在文章中,但是人脑和神经网络的运作方式有着相似的角落,但我认为它们不必相同。如果您建造潜水艇而不是模仿鱼来游泳...
来自著名游戏公司King的Candy Crush Saga是一款具有大量关卡的益智游戏。这是2018年的数据,但据说每周增加约15个水平。 (每年大约3700)我需要衡量难度和平衡水平...