|
|
| |
| |
大模型算法工程师-(时序预测) 点击:1次
工作编号:1695012
|
/月 |
|
顺丰速运有限公司 查看企业资料及职位
|
2025-12-18 |
| 上海市- 5-10年经验 | 大学本科 | 招1人 | |
|
| |
职位描述 用小程序查看更多 |
|
1. 基座大模型研发与创新 * 参与研发面向大规模多元时间序列的预训练基座模型。 * 探索适用于时序数据的Transformer变体(如Informer, FEDformer, PatchTST等)及创新架构。 * 负责构建超大规模、高质量的时序预训练数据集,设计自监督预训练任务。 2. 模型深度优化与领域适配 * 针对电力、金融、工业等特定高价值场景,对基座模型进行深度微调与优化。 * 研发高效的模型适配技术(如PEFT),确保模型能快速、低成本地适配多样化下游任务。 3. 系统工程与高性能推理 * 负责将模型从研究原型推进到生产级系统,优化训练框架,利用混合并行技术实现千亿参数模型的分布式训练。 * 主导模型的高效推理优化,应用量化、编译优化等技术,降低服务延迟与资源消耗。 4. 技术前瞻与行业赋能 * 追踪时间序列分析、大模型预训练的前沿学术进展,并引入到产品研发中。 * 与业务团队合作,将模型能力转化为可衡量的业务价值,定义行业新标准。 1. 必备条件 * 学历:计算机科学、人工智能、统计学等相关专业硕士及以上学历(博士优先)。 * 经验:3年以上深度学习研发经验,并至少满足以下一个方向的专业要求: 2. 专业方向(二选一) * 方向一:深度时间序列预测专家 * 对时间序列预测有深刻理解,熟悉ARIMA、Prophet等经典方法及LSTM、TCN、DeepAR等深度模型。 * 具有开发或深度优化现代时序神经网络模型(如Informer, Autoformer, TimesNet等)的成功项目经验,并在公开数据集或实际业务中取得显著效果提升。 * 方向二:通用大模型开发专家 * 具备大规模语言模型(LLM)或多模态大模型的预训练、指令微调(SFT)或对齐(RLHF)全流程实践经验。 * 对Transformer架构、缩放定律、大模型训练稳定性有第一手的技术洞察和实操经验。 3. 核心技能 * 精通Python,熟练掌握PyTorch框架,具备出色的工程实现与调试能力。 * 扎实的机器学习基础,出色的数据敏感性和分析能力。 * 熟悉Linux开发环境,具备大规模分布式训练或高性能推理优化经验者优先。 * 拥有处理海量时序数据(TB级以上)的实际经验,熟悉相关数据处理和特征工程流程。 4. 优先条件 * 在时间序列分析、机器学习顶级会议(如ICLR, NeurIPS, ICML)或期刊上有发表论文。 * 在金融风控、量化交易、能源预测、工业物联网、智能运维(AIOps)等领域有成功的预测模型落地经验。 * 具备优秀的团队协作、沟通能力和强大的自我驱动学习能力。 |
|
| |
|
|
| |
|