在2024年10月15日至17日于美国加州圣何塞举行的敞开核算全球峰会(OCP Global Summit)上,阿里云与UALink联盟一起宣告了一次严重的技能腾跃。此次峰会招引了全球超越7000名来自基础设施软硬件技能范畴的专家,会集探讨了AI基础设施的未来,特别是OCP基金会推出的人工智能敞开体系战略。
作为此次峰会的亮点之一,阿里云服务器研制主管文芳志与UALink联盟主席Kurtis Bowman联合宣布了题为《UAlink:加快AI的未来》的讲演。讲演详细的介绍了AI服务器ScaleUP互连技能的开展,以及UAlink规范的演化,强调了技能协同协作的潜力。
UAlink协议作为职业领导者的一起建议,意在成为AI服务器ScaleUP互连技能的新规范。其中心特色包含高功用内存语义拜访、显存同享、高带宽及超低推迟,这些特性将为AI服务器的互连技能供给强壮动力。UALink联盟定于10月底正式建立,并在年末发布第一版UAlink规范,标志着AI服务器互连技能进入新阶段。
在面临全球,尤其是中国市场的开展挑战时,AlinkSystem(ALS)工业生态应运而生,旨在推动UAlink规范的落地履行。ALS供给了统一规范的互连体系,包含ALS-D数据面与ALS-M管控面,为AI练习和推理场景供给全方位解决计划。详细而言,ALS-D不只支撑国际规范的UAlink,还完成了竞争力的数据传输,具有超高带宽和超低时延等优势。
阿里云根据AlinkSystem的规范规划了新一代超大规模AI集群的磐久AI Infra 2.0服务器。这款服务器体现了敞开生态、高能效及高牢靠性的规划理念,界说了AI核算节点与ScaleUp/ScaleOut互连体系,兼容业界干流AI计划,并推动了“一云多芯”的开展的新趋势。经过与职业协作伙伴的密切协作,AlinkSystem完成了全面兼容UAlink生态,打造超高功用、超大规模的ScaleUP集群互连才能。
磐久AI Infra 2.0服务器特有的一级互连支撑64到80个节点,二级互连则可扩展至超越2000个节点,供给PB级同享显存及TB级带宽,强力支撑AI算法的练习与推理。这款服务器集成了阿里复研的CIPU3.0芯片,具有高带宽、大规模的AI服务器ScaleOut扩展才能,一起满意云网络的弹性与安全需求。
在硬件规划上,AI Infra 2.0服务器的单机柜支撑最高80个AI核算节点,业界密度体现优异;选用高效能400V PSU,单体供电功率高达98%。在散热方面,机柜选用液冷计划,可根据实时负载动态调整冷却才能,全体效能提高30%。运维办理方面,全新的Cable Cartridge规划提高了保护功率达50%。
与此一起,该服务器支撑弹性节点与智能路由,具有高牢靠供电及分布式冷却技能,实时监控并自愈各种硬件毛病,极大地提高了服务器的牢靠性。自AlinkSystem工业生态在敞开数据中心大会上发布以来,已有20多家相关厂商参加,一起拟定与完成相关协议规范。
阿里云不只在UAlink规范的推行上积极探究,仍是OCP、CXL、UCIe和UEC等多个互连技能职业安排的重要成员,用举动推动敞开互连技能规范的构成与执行。这些协作不只展现了阿里云在AI基础设施范畴的技能实力与发明新式事物的才能,而更明显的是显示了其推动敞开核算与AI技能开展的领导地位。
未来,阿里云将持续引领AI技能的推动,为全球客户供给更强壮、灵敏和高效的AI基础设施解决计划。关于想在AI范畴探究潜在时机的人们来说,这些技能的迭代与协作无疑将翻开新的大门,不单单是技能开展的新纪元,更是商业与改造的新机遇。
在我使用了数十家AI绘画、AI生文东西后,激烈推荐给我们以下这个东西——简略AI。简略AI是搜狐旗下的全能型AI创造帮手,包含AI绘画、文生图、图生图、AI案牍、AI头像、AI资料、AI规划等。可一键生成构思美图,3步写出爆款文章。网站供给生成构思美图、动漫头像、种草笔记、爆款标题、活动计划等多项AI创造功用。东西链接: