职位描述
1、发现优化大模型的简单、普适的想法,并应用到各个规模的模型中提升效果;
2、推进数据建设、指令微调、偏好对齐、继续预训练等模型优化方面的工作,提高模型质量和适应性;
3、探索复杂指令、长上下文、多轮对话下,大模型更为复杂的理解、推理和生成能力;
4、基于语言处理、内容创作、教育Tutor、角色扮演、复杂Agent、AI搜索和工具、代码助手等服务和应用优化模型效果;
5、推进大模型效果评估,尤其是复杂场景(多轮对话、开放领域)评估集建设和自动化评估能力建设;
6、深入研究和探索大模型在ToB企业服务中的更多使用场景,拓展模型的应用范围,如搜索、推荐、广告、创作、客服和办公等各类场景。
职位要求
1、计算机相关专业本科及以上学历,1年以上算法研发工作经验,有相关方向技术和研究背景的候选人优先;
2、优秀的代码能力、数据结构和基础算法功底,C/C++或Python熟练;
3、有领域顶级会议文章(NeurIPS、ICML、ICLR、CVPR、ICCV、ACL、KDD等)、有编程/AI比赛获奖(ACM/ICPC、NOI/IOI、Top Coder、Kaggle等)优先;
4、熟悉NLP相关的算法和技术,在相关领域有过良好研究记录者优先,熟悉大模型预训练、SFT与RL算法者优先; 5、在大模型领域,主导参与过大影响力的项目或论文者优先;
6、出色的独立分析和解决问题的能力,能深入解决大模型优化和应用存在的问题;良好自驱力和沟通协作能力,能和团队一起探索新技术,推进技术进步。
...