新型系统可以自动“学习”如何在数千台服务器上调度数据处理操作

麻省理工学院的研究人员开发的新型系统可以自动“学习”如何在数千台服务器上调度数据处理操作,而这通常是由不精确的人工设计算法完成的任务。这样做可以帮助当今耗电的数据中心更加高效地运行。
数据中心可以包含数以万计的服务器,这些服务器不断运行来自开发人员和用户的数据处理任务。群集调度算法可实时跨服务器分配传入任务,以有效利用所有可用的计算资源并快速完成工作。
但是,传统上,人们会根据一些基本准则(“策略”)和各种折衷来微调那些调度算法。例如,他们可以对算法进行编码,以快速完成某些作业,或者在作业之间平均分配资源。但是工作负载(意味着组合任务的组)各种各样。因此,人类几乎不可能针对特定的工作负载优化其调度算法,因此,他们常常无法发挥其真正的效率潜力。
麻省理工学院的研究人员将所有手动编码转移到了机器上。在sigcomm上发表的一篇论文中,他们描述了一种利用“强化学习”(rl)(一种反复试验的机器学习技术)来针对特定服务器群集中特定工作负载量身定制调度决策的系统。
为此,他们建立了新颖的rl技术,可以对复杂的工作量进行训练。在培训中,系统尝试了多种可能的方式来跨服务器分配传入的工作负载,最终在利用计算资源和快速处理速度方面找到了最佳折衷方案。除了“减少工作完成时间”这样的简单指令,不需要人工干预。
与最佳的手写调度算法相比,研究人员的系统完成工作的速度提高了大约20%到30%,而在交通繁忙时则完成速度提高了一倍。但是,大多数情况下,系统会学习如何有效压缩工作负载而几乎没有浪费。结果表明,该系统可以使数据中心使用更少的资源,以更高的速度处理相同的工作负载。
电气工程和计算机科学系的博士生hongzi mao说:“如果您有使用机器进行反复试验的方法,他们可以尝试以不同的方式安排作业,并自动找出哪种策略比其他方法更好。” (eecs)。“这可以自动提高系统性能。利用率的任何微小提高,即使提高1%,都可以节省数百万美元,并为数据中心节省大量能源。”
eecs教授和计算机科学与人工智能实验室(csail)的研究员穆罕默德·阿里扎德(mohammad alizadeh)补充说:“制定调度决策没有万能的选择。” “在现有系统中,这些是您必须预先决定的硬编码参数。相反,我们的系统将根据数据中心和工作负载学习调整其调度策略特征。”
通常,数据处理作业进入数据中心,以“节点”和“边缘”的图形表示。每个节点代表一些需要完成的计算任务,其中节点越大,所需的计算能力越强。连接节点的边缘将连接的任务链接在一起。调度算法根据各种策略将节点分配给服务器。
但是传统的rl系统并不习惯于处理这样的动态图。这些系统使用软件“代理”进行决策并接收反馈信号作为奖励。从本质上讲,它会尝试在给定的上下文中学习任何理想行为,从而最大化其对任何给定动作的回报。例如,它们可以帮助机器人学习如何执行与通过与环境交互来拾取物体等任务,但这涉及通过更容易设置的像素网格处理视频或图像。
为了构建他们的基于rl的调度程序decima,研究人员必须开发一种模型,该模型可以处理图形结构的作业,并可以扩展到大量作业和服务器。他们系统的“代理”是一种调度算法,该算法利用了图神经网络,通常用于处理图结构数据。为了提出适合计划的图神经网络,他们实现了一个自定义组件,该组件聚集了跨图路径的信息-例如快速估计完成图的给定部分需要多少计算。这对于作业调度很重要,因为“子”(下)节点要等到其“父”(上)节点完成后才能开始执行,因此,预测图表中沿不同路径的未来工作对于制定良好的调度决策至关重要。

带独立GPS单元和GeoSetter的地理标记
星河亮点再次登上了全球5G终端一致性测试认证的最高峰
成都将建全国首条8.6代AMOLED显示器件生产线,总投资630亿元
为什么很多人更喜欢买iPhone11?
使用BLE 4.2的系统设计使设备更加保护隐私和节能
新型系统可以自动“学习”如何在数千台服务器上调度数据处理操作
iPhone手机的售价仍然在扶摇直上 但利润率却大不如从前了
SEW变频器MOVIfit的PLC组态/S11安全控制设置流程分享
这样的设计才应该是iphone8该有的,Home键炫酷!
等电位联结的分类_等电位联结的作用
这个机械狗是OPPO在感知技术的体现,集成众多先进的技术
可编程微流控器件实现覆盖可见光和红外光谱的动态多波段伪装
泰克TEKTRONIX低压单端探头TAP1500的使用操作步骤
国产32位单片机 XL32F002A,多种封装,SOP8封装5毛不到
电子行业辞典中英文对照(E字为首)
如何选择合适的称重传感器
三坐标测量机是具体检测什么?
智慧农业怎样发展才是比较好的
锂电隔膜瑕疵在线检测设备可实时检测产品瑕疵
什么是CPU的位和字长