|
|
| |
| |
职位描述 用小程序查看更多 |
|
职责描述: 1、紧跟业界大模型与文本生成技术,推进公司大模型工程化及业务场景落地; 2、跟进和探索大模型相关的前沿研究; 3、 进行大模型在领域上的实际场景研究,结合工业界实际场景进行大模型的效果提升等等; 4、模型预训练相关的数据处理与构造; 5、大模型性能测试; 6、参与预训练大模型(如 prompt 调优、大模型指令微调、多机多卡训练、模型蒸馏与量化等)、可控文本生成(如大纲生成、报告生成、文案辅助写作等)、智能问答与对话生成(如多轮对话、机器阅读理解、文档智能问答等)等相关开发工作。 任职要求: 1. 硕士及以上学历,计算机相关专业,1年以上大模型算法经验,对大模型有较深理解; 2. 熟练掌握 pytorch 等深度学习框架,有较强的算法工程能力;熟悉生成式大模型及文本生成算法原理,有算法落地实践经验; 3. 具备优秀的分析和解决问题的能力,良好的沟通、学习及自驱能力; 4. 在ACL、EMNLP、SIGIR等相关顶会有论文发表及竞赛获奖者优先。 |
|
| |
|
|
| |
|