星外工多多 [切换] 客服微信  收藏  消息  免费找工作 | 企业免费招人 | 雇主免费招人   登陆/注册  
 
   
 请输入关键词:
 
所有操作  
   星外工多多:  交流群  
   我的工多多(企业招人) >
   企业信息页     >
   发布正规职位    >
   查找人才      >
   关注的人才     >
   企业认证      >
   充值财务      >
   切换角色      >
 
   
  多模态大模型算法工程师  点击:3次
工作编号:1382139
24000-33000/月
重庆正大华日软件有限公司 查看企业资料及职位 2025-9-17 
重庆市-渝北区  经验 | 硕士 | 招1人 | 全职
  工作地址
(重庆市渝北区黄山大道中段55号双鱼座B座) 用小程序查   用百度查

  职位描述  用小程序查看更多
1.跟进VLLM预训练、SFT、RLHF等技术,探索视频行为理解、真实场景解析及音频-视频协同建模的应用;
2.研究多模态稀疏检索、稠密表征技术,解决视频中物体行为建模、场景语义关联及环境声音识别问题;
3.研发行为识别、动作预测算法,结合视频、音频等多源数据实现施工场景的精细化建模(如机械操作、人员活动);
4.设计跨模态特征融合策略(视频+音频),提升目标追踪、意图推断与上下文关联能力(如通过声音定位施工设备状态);
5.建立工地场景的环境声音建模能力,识别机械施工声(如打桩、切割)、异常噪声等,与视频中设备行为进行关联验证;
6.研究多模态时序对齐技术,解决视频帧与音频信号的同步问题,提升施工状态判定的准确性;
7.推动多模态模型压缩(量化、剪枝、蒸馏),优化视频+音频数据的联合特征编码与推理调度策略;
8、开发高效推理框架,提升高分辨率视频任务的实时性与吞吐量;
9、构建视频-音频-文本相关性标注与评测系统,支持行为描述生成与场景匹配评估;
10、研究多模态幻觉缓解技术(如跨模态一致性校验),提升模型输出的可信度与鲁棒性;
 
 

  职位照片
尚未上传照片。

  联系办法
   联系人:范琳琳   联系电话: [请登陆后查看]  用小程序打开  
 

  马上投简历  收藏   复制网址  投诉下架

  重庆正大华日软件有限公司 查看企业资料及职位**(已实名) 查看个人雇主资料及职位

  谁看过此职位
  只显示非匿名用户
 
 
欢迎您的到来!星外工多多,让天下没有难找的工作!
微信交流群 [星外工多多] 全功能服务号 [星外工多多] 客服
《用户服务协议》 《隐私政策》  投诉与举报  关于我们  更新历史  小程序/APP下载

广州市星外信息科技有限公司 保留所有权利 注册商标 人力资源许可证 增值电信经营许可证:粤B2-20251456 粤ICP备05000912号-2