|
|
|
|
职位描述 用小程序查看更多 |
|
岗位职责: 1.跟进VLA(视觉-语言-动作)多模态领域的前沿技术,调研并复现顶会论文(如CVPR、ICCV、NeurIPS、ICLR等),探索创新性的VLA算法与应用; 2.参与VLA大模型的数据构建,包括多模态标注(视觉、语言、动作序列)、对齐及预处理; 3.负责VLA模型的训练、微调和评测,探索在机器人操作、智能体决策等场景中的落地应用; 4.研究并实现VLA模型的运动控制与部署方案,支持实际业务场景(如机器人、自动化设备)的应用需求。
岗位要求: 1.计算机、人工智能、机器人学、自动化等相关专业的硕士或博士研究生,研究方向涉及多模态学习、机器人学习或大模型优先; 2.熟悉多模态学习/表示学习/机器人控制/强化学习等基础理论和常用方法; 3.熟练掌握Python/C及PyTorch等主流深度学习框架,具备良好的工程实现能力; 4.熟悉ROS/IsaacSim等机器人仿真平台; 5.拥有良好的团队沟通与协作能力,责任心强,自驱力强。 |
|
|
|
|
|
|