10 月52020 相互作用码 使用HuggingFace和ONNX Runtime进行NLP加速 相互作用, 码 基于Transformer的语言模型显示出的性能改进令人惊讶,但是随着模型大小的成倍增长,对服务成本的关注也变得越来越重要。 Bert-base或GPT-2具有大约1亿个参数,因此模型大小,内存带宽,...