星外工多多 [切换] 客服微信  收藏  消息  免费找工作 | 企业免费招人 | 雇主免费招人   登陆/注册  
 
   
 请输入关键词:
 
所有操作  
   星外工多多:  交流群  
   我的工多多(企业招人) >
   企业信息页     >
   发布正规职位    >
   查找人才      >
   关注的人才     >
   企业认证      >
   充值财务      >
   切换角色      >
 
   
  AI推理部署工程师  点击:1次
工作编号:1690099
16666.67-41666.67/月
深圳陆兮科技有限公司 查看企业资料及职位 2025-12-18 
深圳市-福田区  无经验 | | 招1人 | 全职
  工作地址
(深圳福田区深圳新一代产业园5栋4层401) 用小程序查   用百度查

  职位描述  用小程序查看更多
1.负责通用语言大模型与多模态模型的端侧推理优化与量化,在Android/iOS/Linux等平台稳定上线,达成延迟、内存、功耗与稳定性目标。
2.从训练框架导出到目标引擎(如ONNXRuntimeMobile、llama.cpp/GGUF、MNN、sherpa-onnx等)并保证算子/图优化与精度对齐。
3.负责端到端推理流水线,包括模型压缩、格式转换、算子/内核适配、自动化评测、崩溃与性能回溯。
4.设计并维护针对不同硬件的加速方法,包括iOS/AppleSilicon(CoreML/ANE/Metal),Android(CPU/GPU/NPU),端侧芯片(如rk3588,jetson等)。
5.建立性能与能耗基准体系:TTFT、吞吐(tok/s或QPS)、峰值/常驻内存、包体/模型体积、加载时延/冷启动与稳定性。
6.跨团队协作:与算法侧共建量化校准与精度评估;与客户端/平台侧共同开发应用。
 
 

  职位照片
尚未上传照片。

  联系办法
    
 

  马上投简历  收藏   复制网址  投诉下架

  深圳陆兮科技有限公司 查看企业资料及职位**(已实名) 查看个人雇主资料及职位

  谁看过此职位
  只显示非匿名用户
 
 
欢迎您的到来!星外工多多,让天下没有难找的工作!
微信交流群 [星外工多多] 全功能服务号 [星外工多多] 客服
《用户服务协议》 《隐私政策》  投诉与举报  关于我们  更新历史  小程序/APP下载

广州市星外信息科技有限公司 保留所有权利 注册商标 人力资源许可证 增值电信经营许可证:粤B2-20251456 粤ICP备05000912号-2