职位描述
1、负责公有云IaaS异构计算(CPU/GPU/NPU/FPGA等)产品的系统优化与产品设计规划工作;
2、推动异构计算产品与最新AI技术(如P/D分离、vLLM、SGLang、强化学习等)的深度融合(如模型训练加速、推理优化),提升GPU资源部署效率、使用效率、降低硬件适配成本;
3、推动异构算力适配层建设,提供标准API接口屏蔽底层硬件差异,降低业务开发复杂度;
4、跟踪业界最新模型发展趋势(如MoE架构、端侧大模型),推动异构产品与最新技术趋势的协同创新;
5、探索异构计算与行业场景(如具身智能、自动驾驶)的融合方案,推动生态合作与技术标准共建;
6、参与开源社区建设,建设在AI加速框架(如vLLM)与AI加速库领域的业界影响力。
职位要求
1、计算机科学、人工智能或相关领域硕士研究生及以上学历,3年以上AI产品经理或大模型工程经验;
2、熟悉异构计算架构(CPU/GPU/FPGA等)及调度原理,熟悉CUDA等并行编程框架;
3、熟悉P/D分离、vLLM、SGLang、并行策略等最新工程优化技术,具备大模型推理加速与部署落地的实战经验优先;
4、熟悉强化学习算法等业界最新技术演进趋势;
...