工多多-星外工多多-AI推理部署工程师-1.负责通用语言大模型与多模态模型的端侧

　星外工多多 [切换] 客服微信

　收藏　消息　免费找工作 | 企业免费招人 | 雇主免费招人

　登陆/注册

所有操作

≡

　　　星外工多多：　交流群

　我的工多多(企业招人)　>

　企业信息页　　　　　>

　发布正规职位　　　　>

　查找人才　　　　　　>

　关注的人才　　　　　>

　企业认证　　　　　　>

　充值财务　　　　　　>

　切换角色　　　　　　>

	AI推理部署工程师　　点击:1次工作编号:1690099	16666.67-41666.67/月
	深圳陆兮科技有限公司　查看企业资料及职位	2025-12-18
	深圳市-福田区　无经验 \| \| 招1人 \| 全职

	工作地址

	(深圳福田区深圳新一代产业园5栋4层401) 用小程序查　用百度查

	职位描述　用小程序查看更多
	1.负责通用语言大模型与多模态模型的端侧推理优化与量化，在Android/iOS/Linux等平台稳定上线，达成延迟、内存、功耗与稳定性目标。 2.从训练框架导出到目标引擎（如ONNXRuntimeMobile、llama.cpp/GGUF、MNN、sherpa-onnx等）并保证算子/图优化与精度对齐。 3.负责端到端推理流水线，包括模型压缩、格式转换、算子/内核适配、自动化评测、崩溃与性能回溯。 4.设计并维护针对不同硬件的加速方法，包括iOS/AppleSilicon（CoreML/ANE/Metal），Android（CPU/GPU/NPU），端侧芯片（如rk3588，jetson等）。 5.建立性能与能耗基准体系：TTFT、吞吐（tok/s或QPS）、峰值/常驻内存、包体/模型体积、加载时延/冷启动与稳定性。 6.跨团队协作：与算法侧共建量化校准与精度评估；与客户端/平台侧共同开发应用。

职位照片

尚未上传照片。

	联系办法

马上投简历　　收藏　　复制网址　　投诉下架

深圳陆兮科技有限公司　查看企业资料及职位 **(已实名)　查看个人雇主资料及职位

谁看过此职位

只显示非匿名用户

欢迎您的到来！星外工多多,让天下没有难找的工作！


微信交流群	[星外工多多] 全功能服务号	[星外工多多] 客服

《用户服务协议》　《隐私政策》　投诉与举报　关于我们　更新历史　小程序/APP下载

广州市星外信息科技有限公司　保留所有权利　注册商标　人力资源许可证　增值电信经营许可证:粤B2-20251456　粤ICP备05000912号-2