阿里云提供了一个快速部署OpenAI最新开源模型GPT-OSS的解决方案,用户只需10分钟即可完成零代码一键部署。GPT-OSS包括120B和20B两个版本,性能分别比肩OpenAI的o4-mini和o3-mini闭源模型,且采用Apache 2.0开源协议。该部署方案通过PAI Model Gallery实现,相比传统部署方式具有部署周期短、运维简便和性能有保障等优势,特别适合希望自主部署且需要高并发高性能计算的用户。
关键点
- OpenAI发布了两款开源模型(gpt-oss-120b和gpt-oss-20b),这是其六年来首次发布开源权重模型。
- 这些模型采用Apache 2.0开源协议,在核心推理测试中性能与OpenAI的o4-mini和o3-mini相当甚至更优。
- 模型采用MoE架构和原生MXFP4格式,有效压缩体积的同时保持高性能。
- 模型经过安全训练,即使遭受恶意微调也无法达到高危害能力水平。
- 阿里云通过PAI Model Gallery提供零代码一键部署解决方案,只需10分钟即可完成部署。
- 该方案利用云原生服务(EAS)实现托管式运维,大大降低了运维难度和人力投入。
- 该服务提供稳定、高度可用的模型服务,适用于实时、低延迟推理场景,建议试用时长为1小时。