|
|
|
|
职位描述 用小程序查看更多 |
|
岗位职责: 参与端侧大语言模型、大模型推理时计算研发工作,包括但不限于: 1.研究端侧大语言模型针对端侧场景的重点能力增强,包括知识记忆和运用、逻辑与数理推理、指令理解与规划决策、代码和工具使用等方面 的能力。 2.开展复杂环境下端侧大模型轻量化知识迁移与持续学习研发工作。 3.聚焦大模型推理的强化学习算法优化研发,基于预训练流程优化的模型推理能力增强,基于知识蒸馏的推理增强,任务难度自适应的推理研发。 岗位要求: 1.自然语言处理、机器学习、强化学习等人工智能相关领域硕士研究生及以上学历,其中科研岗需拥有博士研究生学历。 2.在大模型(LLM)、强化学习、智能体(agent)、知识记忆等方向有研究经历。 3.精通大模型相关开发工具,包括pytorch、deepspeed,熟悉大模型分布式训练原理。 4.有大模型训练经验优先,有竞赛获奖经历优先,有顶级AI会议/期刊(NeurIPS、ICLR等)发表经历者优先。 5.熟悉华为昇腾AI大模型在MindSpore上的快速部署,有相关经验者优先。 6.具有较强动手能力、沟通能力和团队协作能力。 |
|
|
|
|
|
|