工多多-星外工多多-多模态大模型算法工程师-1.跟进VLLM预训练、SFT、RLHF

　星外工多多 [切换] 客服微信

　收藏　消息　免费找工作 | 企业免费招人 | 雇主免费招人

　登陆/注册

所有操作

≡

　　　星外工多多：　交流群

　我的工多多(企业招人)　>

　企业信息页　　　　　>

　发布正规职位　　　　>

　查找人才　　　　　　>

　关注的人才　　　　　>

　企业认证　　　　　　>

　充值财务　　　　　　>

　切换角色　　　　　　>

	多模态大模型算法工程师　　点击:12次工作编号:1382139	24000-33000/月
	重庆正大华日软件有限公司　查看企业资料及职位	2025-9-17
	重庆市-渝北区　经验 \| 硕士 \| 招1人 \| 全职

	工作地址

	(重庆市渝北区黄山大道中段55号双鱼座B座) 用小程序查　用百度查

	职位描述　用小程序查看更多
	1.跟进VLLM预训练、SFT、RLHF等技术，探索视频行为理解、真实场景解析及音频-视频协同建模的应用； 2.研究多模态稀疏检索、稠密表征技术，解决视频中物体行为建模、场景语义关联及环境声音识别问题； 3.研发行为识别、动作预测算法，结合视频、音频等多源数据实现施工场景的精细化建模（如机械操作、人员活动）； 4.设计跨模态特征融合策略（视频+音频），提升目标追踪、意图推断与上下文关联能力（如通过声音定位施工设备状态）； 5.建立工地场景的环境声音建模能力，识别机械施工声（如打桩、切割）、异常噪声等，与视频中设备行为进行关联验证； 6.研究多模态时序对齐技术，解决视频帧与音频信号的同步问题，提升施工状态判定的准确性； 7.推动多模态模型压缩（量化、剪枝、蒸馏），优化视频+音频数据的联合特征编码与推理调度策略； 8、开发高效推理框架，提升高分辨率视频任务的实时性与吞吐量； 9、构建视频-音频-文本相关性标注与评测系统，支持行为描述生成与场景匹配评估； 10、研究多模态幻觉缓解技术（如跨模态一致性校验），提升模型输出的可信度与鲁棒性；

职位照片

尚未上传照片。

	联系办法
	联系人：范琳琳　联系电话： [请登陆后查看] 　用小程序打开

马上投简历　　收藏　　复制网址　　投诉下架

重庆正大华日软件有限公司　查看企业资料及职位 **(已实名)　查看个人雇主资料及职位

谁看过此职位

只显示非匿名用户

欢迎您的到来！星外工多多,让天下没有难找的工作！


微信交流群	[星外工多多] 全功能服务号	[星外工多多] 客服

《用户服务协议》　《隐私政策》　投诉与举报　关于我们　更新历史　小程序/APP下载

广州市星外信息科技有限公司　保留所有权利　注册商标　人力资源许可证　增值电信经营许可证:粤B2-20251456　粤ICP备05000912号-2