|
|
| |
| |
职位描述 用小程序查看更多 |
|
1.负责语音识别(ASR)、语音合成(TTS)、声纹识别、语音增强、语音情感分析等语音核心技术的研发与优化。 2.设计和构建端到端语音处理流水线,包括数据采集、清洗、标注、模型训练、评测与部署。 3.针对具体业务场景(如智能助手、智能座舱、机器人、IoT设备等),进行语音模型的适配与落地。 4.研究并应用前沿的语音大模型技术,探索语音与大语言模型(LLM)的融合应用。 5.优化语音模型的推理效率,包括模型压缩、量化、流式推理等,满足端侧或低延迟场景的部署需求。 6.跟踪语音领域前沿技术动态(如Whisper、VALL-E、Seed-TTS等),持续提升系统性能与用户体验。 |
|
| |
|
|
| |
|