工多多-星外工多多-多模态音视频交互模组-核心职责 1、开发开放、全场景的新一代

　星外工多多 [切换] 客服微信

　登陆/注册

所有操作

≡

　　　星外工多多：　交流群

　企业信息页　　　　　>

　查找人才　　　　　　>

　关注的人才　　　　　>

　企业认证　　　　　　>

　充值财务　　　　　　>

　切换角色　　　　　　>

	工作地址

	(深圳市南山区仙茶路万科云城深圳国际创新谷5栋C座303) 用小程序查　用百度查

	职位描述　用小程序查看更多
	核心职责 1、开发开放、全场景的新一代机器人多模态音视频交互模组； 2、支持 2-8 MIC，强噪声声学环境拾音； 3、3D智能视觉，物体，人体，身份，行为等检测识别； 4、提供流畅拟人的实时音视频互动、图文互动能力，支持Agent/MCP/插件/指令自由扩展对话能力； 5、对接产品需求，拆解机器人语音交互音频技术指标（延迟、抗干扰等）； 6、负责前端音频算法（降噪、回声消除等）选型、集成联调，适配云端音视频接入； 7、熟悉常用音频传输协议与编解码标准，优化云端传输稳定性与带宽占用； 8、协同确定麦克风/扬声器/RGB-D布局与选型，保障软硬件适配； 9、协调音频链路与机器人控制和多模态交互系统，管控整体延迟； 10、输出音视频链路设计说明书、测试规范等技术文档。任职要求 1、本科及以上，电子工程、声学、信号处理等相关专业； 2、1年以上音频相关工作经验，机器人/智能音响音频方案经验优先； 3、精通音视频前端核心算法，熟悉音视频前端处理流程； 4、具备音视频算法集成与调试能力，能独立解决嵌入式平台音视频链路问题； 5、了解麦克风/扬声器/RGB-D等硬件特性，有软硬件协

职位照片

尚未上传照片。

马上投简历　　收藏　　复制网址　　投诉下架

谁看过此职位

只显示非匿名用户

欢迎您的到来！星外工多多,让天下没有难找的工作！


微信交流群	[星外工多多] 全功能服务号	[星外工多多] 客服