本文源自:金融界
金融界 2024 年 10 月 21 日消息,国家知识产权局信息显示,超聚变数字技术有限公司申请一项名为“资源管理方法及计算设备”的专利,公开号 CN 118760517 A,申请日期为 2024 年 6 月。
专利摘要显示,本申请公开了资源管理方法及计算设备。该方法应用于服务器集群的管理节点,服务器集群用于处理分布式任务,分布式任务包括多个子任务,服务器集群中的多个目标计算单元用于分别训练子任务。该方法包括:在处理分布式任务的过程中,确定每个目标计算单元训练子任务时是否出现异构计算资源溢出事件;若是多个目标计算单元中的第一目标计算单元出现了异构计算资源溢出事件,则对训练分布式任务的资源执行扩容操作。如此,一旦任一目标计算单元训练子任务时出现此事件,训练子任务所需的资源不足则无法支撑训练完成,便对训练分布式任务的资源执行扩容操作,保证资源的足够性以便于分布式训练的继续。如此,提升了分布式训练的训练效率。