|
|
| |
| |
职位描述 用小程序查看更多 |
|
岗位职责: 1、参与大模型本地化部署与性能优化,支持大模型的本地化部署,参与模型量化(INT4/FP8)、显存优化及推理加速等工作;参与构建商业应用,确保响应延迟满足客户要求,并支持高并发; 2、AIAgent开发与优化,开发面向智能客服、数据分析Agent等的AI应用,使用LangChain/Dify等框架实现任务规划、工具调用及多智能体协作; 3、通过用户反馈分析持续优化应用的交互体验、性能等,提升客户满意度优化 任职要求(需满足条件1,条件2-4至少满足其中一条) 1、计算机/人工智能相关专业,有课程设计、开源项目或竞赛,接受应届毕业生,实习生(在校生可全职实习≥6个月); 2、AIAgent开发,熟悉LangChain/Dify等框架,具备工作流、智能体、工具(如API集成)开发经验(课程/项目均可); 3、了解RAG、记忆管理(向量数据库)或多智能体通信(MCP协议)者优先; 4、大模型部署与优化,掌握PyTorch基础,了解模型量化、蒸馏或推理加速技术,了解常见的本地模型推理框架,有非cuda设备(RO*/昇腾)部署经验者加分。 |
|
| |
|
|
| |
|