ngraph专题

文献阅读(233)nGraph

文章目录 1 abstract & introduction2 related work3 intermediate representation & framework bridges 题目:Intel nGraph An Intermediate Representation, Compiler, and Executor for Deep Learning时间:2018会议:

计算框架相关的编译器知识(XLA, nGraph)

Tensorflow XLA的加速原理主要是融合Kernel def  model_fn(x,y,z):    return tf.reduce_sum(x + y * z)  如果运行模型时不使用 XLA,图表会启动三个内核,分别用于乘法、加法和减法。 官网原话:XLA 可以优化计算图,将加法、乘法和减法 “融合” 到单个 GPU Kernel中。此外,这种融合运算不会将 y*z 和 x