在Kakao Brain中,Pororo是一个能够响应各种自然语言任务的集成自然语言框架,已作为开源发布。 Pororo代表自然语言处理的神经模型平台,您可以将其视为与HuggingFace相似的目的。 Pororo的优势不仅是针对韩文任务进行了优化,而且还支持诸如语音识别之类的音频处理。
这是使用Pororo执行简单的韩国MRC任务的示例。 [摘自Pororo github]
Pororo的技术文档(https://kakaobrain.github.io/pororo/),当前包含的主要任务是:
- 文字分类
- 自动作文评分
- 年龄适应性预测
- 自然语言推论
- 复述识别
- 审核评分
- 语义文本相似度
- 句子嵌入
- 情绪分析
- 零镜头主题分类
- 序列标记
- 上下文化嵌入
- 依赖解析
- 填空
- 机器阅读理解
- 命名实体识别
- 词性标记
- 语义角色标签
- 序列2
- 选区解析
- 语法错误校正
- 音素到音素
- 音素到音素
- 机器翻译
- 释义生成
- 问题产生
- 文字摘要
- 词义消歧
- 杂项
- 自动语音识别
- 图片字幕
- 搭配
- 合法化
- 形态学变化
- 光学字符识别
- 语音合成
- 代币化
- 单词翻译
- 词嵌入
我没有测试它们中的每一个,但是涉及许多不同的任务,因此我认为这将在许多方面对研究有所帮助。已经开发了许多用于朝鲜语自然语言处理的开源项目,但是我认为很少有框架将多个任务集成到一个框架中,但是我认为,随着Pororo的发布,这一部分并没有得到很大解决。将来,我希望能够发布Pororo自身不断的性能改进以及基于此的许多第三方开源。
这是Pororo github链接: