码

以其集成的自然语言处理程序包而闻名的HuggingFace增加了语音识别。以下是相关链接：具体来说，添加了由Facebook开发的Wav2Vec 2.0，Wav2Vec 2.0首先使用大量未标记的数据来进行无监督学习，并且非常…

通过单张照片创建3D模型的技术已经以MeInGame的名称公开。查看上传到公共存储库的结果，如果没有设计者的工作，它还不足以应用于服务，但是它将大大减少初始建模工作……

在Kakao Brain中，Pororo是一个能够响应各种自然语言任务的集成自然语言框架，已作为开源发布。 Pororo代表自然语言处理的神经模型平台，您可以将其视为与HuggingFace相似的目的。 Pororo ...

自从由多层卷积层组成的AlexNet问世以来，已有许多关于深度学习模型结构的研究。例如，Google Inception使用具有不同内核大小的卷积层，例如3×3、5×5和7×7…

随着深度学习模型的参数数量显着增加，训练所需的内存也随之增加。 OpenAI的GPT-2由1.5B参数组成，而Google的mT5也具有13B参数。另外，OpenAI的GPT-3的参数数量...

随着深度学习模型的规模呈指数增长，不再难于通过一台机器实现可用的学习时间。 GPT-2是一种著名的会话模型，具有约1.5B的参数和800万个...

SuperGLUE是一项挑战，需要针对各种自然语言理解任务评估AI技术的性能。与现有的GLUE相比，它具有较高的难度，并且微软最近宣布的DeBERTa模型实现了SOTA（最先进）并进行了评估。

KoChat是由Hyunwoong Ko发布的韩国开源聊天机器人框架。这是KoChat github存储库：在谈论聊天机器人时，人们通常只想到对话模型，但实际上，从产品的角度来看，它是聊天机器人，机器学习算法仅占其中的一小部分。

Facebook AI Research（FAIR）发布的一项技术FrankMocap负责从单个图像或视频中提取3D模型的姿态。特别是它的特点是不仅可以估计身体，而且可以估计手的形状。