|
|
|
|
工作地址 |
|
|
|
(广州市天河区黄埔大道西122号之二1701房,1702房,1703房,1704房,1705房,1905房)
用小程序查
用百度查
|
|
职位描述 用小程序查看更多 |
|
"工作内容:1、承担在语音大模型等方向上技术的研究与开发。包括声音克隆、zero-shot语音合成、文生语音、语音翻译、ASR、音效生成等。2、承担背景音分离、降噪、说话人识别、VAD等语音基础技术的研发与工程化。3、负责相关算法在移动端、PC端、云端等场景的产品化落地。
职位要求:1、精通深度学习、大模型训练、音频信号处理等领域的基础技术与原理,熟悉SeedTTS、ChatTTS、CosyVoice、SenseVoice等模型和技术; 2、熟练掌握Python/C/C语言,数据结构和算法基础扎实,了解CUDA开发和TensorRT; 3、熟练掌握Tensorflow、Caffe、pytorch等任一种深度学习框架。" |
|
|
|
|
|
|