pytorch运行模型,CPU利用率仅50%,加进程后利用率100%但训练速度不升反降

694 次浏览0个评论2021年06月16日

本人希望运行一个pytorch的model在CPU上,希望能充分利用多机的多核CPU性能:

  • 目前在单机上直接使用CPU,利用率50%;

  • 两台机器使用DDP分布式时也可以正常运行,每个机器CPU利用率50%,训练速度加倍;

  • 但使用单机的multiprocessing进行2个进程执行后,CPU利用率100%,但训练速度变化不大,甚至下降,进程越多速度越慢。

希望能找到方法使得CPU能被充分利用,提高单机上的训练速度。求大神指点

提交评论

请登录后评论

用户评论

    当前暂无评价,快来发表您的观点吧...

更多相关好文

    当前暂无更多相关好文推荐...

    公告提示

    Pytorch是Facebook的AI研究团队发布了一个Python工具包,是Python优先的深度学习框架。作为numpy的替代品;使用强大的GPU能力,提供最大的灵活性和速度,实现了机器学习框架Torch在Python语言环境的执行,基于python且具备强大GPU加速的张量和动态神经网络。