工多多-星外工多多-大模型实习生（VLA强化学习）-岗位职责： 1.协助开展VLA模型强化学

　星外工多多 [切换] 客服微信

　登陆/注册

所有操作

≡

　　　星外工多多：　交流群

　企业信息页　　　　　>

　查找人才　　　　　　>

　关注的人才　　　　　>

　企业认证　　　　　　>

　充值财务　　　　　　>

　切换角色　　　　　　>

	职位描述　用小程序查看更多
	岗位职责： 1.协助开展VLA模型强化学习训练，参与RLHF流程搭建，包括奖励模型优化、策略微调等核心环节。 2.配合整理对齐数据集，优化强化学习训练链路，提升模型指令理解与输出一致性。 3.跟踪强化学习与大模型融合的前沿技术，完成小型技术调研与实验验证，输出简要分析报告。 4.协助优化模型训练效率，参与实验数据记录、效果复盘，支撑算法迭代优化。任职要求 1.在读硕士及以上学历（计算机、AI、自动化等相关专业），每周可实习3天以上，实习期不少于3个月。 2.精通Python，熟练掌握PyTorch框架，具备扎实的强化学习与神经网络基础，了解VLA核心原理。 3.熟悉PPO,GRPO，有VLA模型微调或强化学习项目经验者优先。 4.具备良好的数学基础与逻辑思维，能独立推进简单实验，有较强的问题解决能力。

职位照片

尚未上传照片。

马上投简历　　收藏　　复制网址　　投诉下架

谁看过此职位

只显示非匿名用户

欢迎您的到来！星外工多多,让天下没有难找的工作！


微信交流群	[星外工多多] 全功能服务号	[星外工多多] 客服