Emma

概要:

  • 训练大型神经网络需要复杂的工程,涉及GPU集群和同步计算。
  • 数据、管道、张量并行以及专家混合技术等并行技术有助于将训练分布在多个GPU上。