英特尔发布了新的GPUFlex:转码性能是NVIDIA的5倍,功耗只有一半。
早在2020年6月165438+10月,英特尔就发布了首款面向服务器和数据中心的独立GPU。基于XeLP低功耗架构的DG1内核,面向高密度、低延迟的Android云游戏和流媒体服务。
全新的Flex系列基于ArcA系列独立显卡的XeHPG高性能架构和DG2核心,支持H.264、H.265(HEVC)、AV1硬件编解码和VP4解码传输。
该系列包括两种型号:
一个是Flex170,有32个Xe核心(512个执行单元/512个XMX引擎)和32个光学跟踪核心。参考频率1950MHz,最大加速2050MHz,256位16GBGDDR6内存。
全卡功耗150W,单槽设计,PCIe4.0x16系统接口。
第二个是Flex140,16 Xe核的一半(256个执行单元/256个XMX引擎)和16个光学跟踪单元。基准频率和最大加速度分别降为1600MHz和1950MHz,为1950 MHz。
全卡功耗也减半至75W,系统接口也减半至PCIe4.0x8。
这样的规格应该分别对应顶级台式机机型ArcA770和主流机型ArcA580的水平。当然,它们没有视频输出接口,频率和功耗估计也会不一样。
FlexGPU系列集成了多达四个Xe媒体引擎。与NVIDIA aa 10相比,它可以提供5倍于媒体转码的吞吐量和2倍于媒体解码的吞吐量,并且只需要一半的功耗。开源的AV1硬件编码器可以节省30%以上的带宽。
可支持单卡最多36路视频流的1080p60转码吞吐量和8路视频流的4K60转码吞吐量。
在4U服务器中扩展到10卡配置时,可支持高达360个视频流的H.265-H.2651080p60转码吞吐量。
借助DeepLink的超级编码功能,Flex140可以在一张卡上搭载两套编解码设备,满足“一秒延迟”的要求,提供8K60实时转码,适用于AV1和H.265HDR格式。
安卓云游戏方面,Flex170和140分别支持最多68和46个720p30数据流,Flex1406卡可实现216个720p30数据流。
目前已经支持GooglePlay商店近90款热门游戏。
此外,英特尔还提供了一套包含开源组件和工具的OpenSoftwareStack,以有效实现FlexGPU针对可视化云工作负载的功能,包括对oneAPI和OpenVINO的支持。
戴尔、HPE、新华三、浪潮、联想、超微都将陆续推出搭载FlexGPU的系统。
在应用方面,从媒体传输和Android云游戏开始,然后扩展到Windows云游戏、AI和VDI(虚拟桌面基础设施)。