1.工作地点 北京市
2.教育程度
计算机科学、人工智能、数学等相关专业本科及以上学历
3.岗位职责
● 负责大语言模型(LLM)的部署、训练、调优及落地应用开发,包括数据预处理、模型微调、性能优化等。
● 开发基于大模型的行业解决方案(如智能问答、数据分析、自动化工具等),对接业务需求。
● 跟踪前沿技术(如分布式训练、模型压缩、多模态技术等),优化模型部署效率与成本。
● 负责数据库设计、架构规划、性能调优及高可用方案部署(MySQL/PostgreSQL/MongoDB等)、开发与建设工作。
● 支持业务部门数据需求,在用系统维护及迭代开发与日常运维工作,优化SQL查询效率,解决复杂场景下的数据处理问题。
● 完成领导交办的其他工作。
4.人员要求
● 熟悉大模型训练全流程(如LoRA微调、RLHF、Prompt工程),具备实际项目经验,有昇腾GPU经验者优先。
● 参与过基础模型或预训练模型的预训练、调优、指令设计等工作。
● 精通至少一种主流数据库(如MySQL),具备索引优化、分库分表、读写分离等实战经验。
●有扎实的编程能力,熟练掌握Python/Java等语言,熟悉PyTorch/TensorFlow框架及HuggingFace生态。
● 有LangChain/LLamaIndex等应用框架经验,或熟悉向量数据库(如Milvus)者、了解大模型与数据库联动场景(如用LLM生成SQL、数据分析报告自动化)者、具备全栈开发能力(前端/后端/DevOps),能独立完成原型搭建者优先。
● 熟悉Linux环境,掌握Docker/Kubernetes等工具,了解云平台部署。
● 逻辑清晰,自主学习能力强,能快速适应新技术与多任务并行。沟通顺畅,具备跨部门协作经验,能将技术方案转化为业务价值。
● 有知识产权领域相关项目经验者优先。