|
|
| |
| |
工作地址 |
|
|
|
|
(深圳市南山区仙茶路万科云城深圳国际创新谷5栋C座303)
用小程序查
用百度查
|
| |
职位描述 用小程序查看更多 |
|
核心职责
1、开发开放、全场景的新一代机器人多模态音视频交互模组; 2、支持 2-8 MIC, 强噪声声学环境拾音; 3、3D智能视觉,物体, 人体, 身份, 行为等检测识别; 4、提供流畅拟人的实时音视频互动、图文互动能力,支持Agent/MCP/插件/指令自由扩展对话能力; 5、对接产品需求,拆解机器人语音交互音频技术指标(延迟、抗干扰等); 6、负责前端音频算法(降噪、回声消除等)选型、集成联调,适配云端音视频接入; 7、熟悉常用音频传输协议与编解码标准,优化云端传输稳定性与带宽占用; 8、协同确定麦克风/扬声器/RGB-D布局与选型,保障软硬件适配; 9、协调音频链路与机器人控制和多模态交互系统,管控整体延迟; 10、输出音视频链路设计说明书、测试规范等技术文档。
任职要求
1、本科及以上,电子工程、声学、信号处理等相关专业; 2、1年以上音频相关工作经验,机器人/智能音响音频方案经验优先; 3、精通音视频前端核心算法,熟悉音视频前端处理流程; 4、具备音视频算法集成与调试能力,能独立解决嵌入式平台音视频链路问题; 5、了解麦克风/扬声器/RGB-D等硬件特性,有软硬件协 |
|
| |
|
|
| |
|