|
|
| |
| |
大模型算法高级工程师-(智能体) 点击:12次
工作编号:1731382
|
/月 |
|
顺丰速运有限公司 查看企业资料及职位
|
2026-1-4 |
| 上海市- 5-10年经验 | 大学本科 | 招1人 | |
|
| |
职位描述 用小程序查看更多 |
|
基座大模型研发与创新
参与设计并研发面向大规模多元时间序列的预训练基座模型,探索适用于时序数据的 Transformer变体(如Informer,FEDformer, PatchTST)及创新架构。
负责构建超大规模,高质量的时序预训练数据集,设计掩码重建,上下文预测等自监督预训练任务。
研究时间序列中的关键问题,如长周期依赖建模,多尺度特征提取,缺失值处理,以及时序与文本/事件等多模态信息的对齐与融合。
模型深度优化与领域适配
针对特定高价值场景(如电力负荷预测,量化金融,工业设备预测性维护),对基座模型进行深度微调与优化,实现"通用能力"到"领域专家"的转化。
研发高效的模型适配技术(如参数高效微调 PEFT),确保基座模型能够快速,低成本地适配到多样化的下游任务。
系统工程与高性能推理
负责将模型从研究原型推进到稳定,高性能的生产级系统。优化训练框架,利用混合并行(数据并行,模型并行,流水线并行)技术实现千亿参数模型的分布式训练。
主导模型的高效推理优化,应用量化(INT8/ FP4),编译优化等技术,大幅降低服务延迟与资源消耗,支撑海量时序数据的实时预测需求。
技术前瞻与行业赋能
追踪时间序列分析,大模型预训练的前沿学术进展,并将有潜力的技术引入到产品研发中。
与业务团队紧密合作,深入理解行业痛点,将基座模型的强大能力转化为可衡量的业务价值,定义时间序列预测领域的新标准。
岗位要求
必备条件 计算机科学,人工智能,统计学或相关专业硕士及以上学历(博士优先).具备大规模语言模型(LLM)或多模态大模型的预训练,指令微调(SFT)或对齐(RLHF)全流程实践经验。
对Transformer架构,缩放定律,大模型训练稳定性有第一手的技术洞察和实操经验。
精通Python,熟练掌握PyTorch框架,具备出色的工程实现与调试能力。
核心技能
扎实的机器学习基础,出色的数据敏感性和分析能力。
熟悉Linux开发环境,具备大规模分布式训练或高性能推理优化经验者优先。
拥有处理海量时序数据(TB级以上)的实际经验,熟悉相关数据处理和特征工程流程。
优先条件
在时间序列分析,机器学习顶级会议(如 ICLR,NeurlPS,ICML,KDD)或期刊上有发表论文。
在金融风控,量化交易,能源预测,工业物联 网(预测性维护),智能运维(AlOps)等领域有成功的预测模型落地经验。
具备优秀的团队协作和沟通能力,对挑战性难题充满激情,具备强大的自我驱动和学习能力。 |
|
| |
|
|
| |
|