|
|
| |
| |
工作地址 |
|
|
|
|
(深圳市南山区桃源街道福光社区留仙大道3370号南山智园崇文园区1号楼1904)
用小程序查
用百度查
|
| |
职位描述 用小程序查看更多 |
|
职责描述: 1、针对不同硬件平台(Nvidia,MTK,Qualcomm等),进行模型转换、量化、剪枝等工作; 2、分析模型结构,将LLM、VLM,CV、NLP、KWS等模型部署到对应平台,并提升模型的推理速度与精度表现; 3、负责开发维护高效统一的模型量化压缩评估工具及模型推理框架,构建模型轻量化部署能力; 4、跟进新技术动态,优化现有模型,部署方案,优化资源占用,降低推理时延和精度损失,提升模型效果。 5、协助团队完成项目相关技术文档的编写和整理。 6、与算法、硬件、软件等相关团队密切配合,共同推进项目进度。 岗位要求: 1、本科及以上学历;计算机、人工智能等相关专业。 2、熟悉深度学习基本原理,掌握至少一种深度学习框架(如PyTorch、TensorFlow); 3、熟悉C/C、Python等编程语言,具备良好的编程基础; 4、熟悉NPU、GPU等SOC的编程,模型网络结构优化以及内存等优化; 5、熟悉模型部署相关流程,如有TensorRT、NeuroPilot/SNPE等工具链使用经验; 6、有大语言模型和多模态大模型工程化部署、模型优化的经验; 7、如有在人工智能等期刊/会议 |
|
| |
|
|
| |
|