国立韩国语学院已经大规模发布了用于人工智能学习的韩国语材料(13种18亿个单词)。它是通过解决版权问题而构建的,据说任何人只要编写在线协议并获得“所有人的语料库”网站的批准,便可以下载和使用该文件。
与上一个“ 21世纪世宗计划”相比,据说这次构建的数据增加了日常对话,信使和网络文档等口语材料的比例。这反映出近年来对口语对话的兴趣和需求不断增长的趋势,因为诸如人工智能扬声器和聊天机器人之类的交互式服务正在增加。
特别是在日常对话数据的情况下,据说已经从标准单词的收集到进一步发展并按地区和年龄收集了各种对话数据,从而为处理人工智能技术中的区域方言做好了立足之本,因此在各个领域中使用将是有用的。下面的链接是“每个人的语料库”站点,您可以在其中下载数据以及与公共相关的新闻文章。
国立韩国语学院,大规模发布用于人工智能学习的韩国语材料… '13种18亿个单词'
国立韩国语学院(董事Kang Kang-Chun So)在国立韩国语学院网站``所有人的语料库''的第25日(星期二)发布了价值18亿字的13种朝鲜语学习材料,这些材料对于提高人工智能的朝鲜语处理能力至关重要。为了使聊天机器人或人工智能助手能够自然地理解,分析和说出韩语作为语料库(可以称为大数据),韩国的人工智能技术的性能得到了极大的提高。这取决于确保良好的韩国语料库,因此,韩国国立语言学院自18年以来一直在与人工智能行业合作。