|
|
| |
| |
职位描述 用小程序查看更多 |
|
一、岗位职责(核心) 1. 模型本地化部署与工程化 负责大模型(LLaMA、Qwen、DeepSeek、文心一言等)在本地服务器 / 边缘设备 / 私有云的私有化部署、容器化、服务化。 适配本地硬件(GPU/NPU/CPU),用 TensorRT、ONNX Runtime、OpenVINO、vLLM、Ollama 等做推理加速。 模型轻量化:量化、剪枝、蒸馏、LoRA/QLoRA 微调,适配低资源硬件。 封装 API、构建推理服务、对接业务系统,保障高并发稳定。 2. 本地化训练与场景调优 基于本地数据做领域微调、RAG 知识库构建、检索增强,提升垂直场景准确率。 多语言 / 方言适配:NLP 模型本地化、语义对齐、文化敏感词过滤。 分析本地用户行为,优化模型输出,适配区域习惯与合规要求。 3. 性能优化与运维 模型推理速度、内存占用、吞吐量优化,解决部署瓶颈。 搭建监控、日志、告警体系,保障服务稳定与可观测。 容器化(Docker/K8s)、CI/CD、资源调度与成本优化。 4. 合规与安全 数据脱敏、模型加密、访问控制,满足本地数据安全与隐私法规。 内容审核、风险控制,确保 AI |
|
| |
|
|
| |
|