|
|
| |
| |
基于大语言模型和OpenAPI的云平台智能运维系统-A+Star 点击:3次
工作编号:1693800
|
50000-300000/月 |
|
深圳阿里云计算技术有限公司 查看企业资料及职位
|
2025-12-19 |
| 深圳市-南山区 无经验 | | 招5人 | 校招 |
|
| |
职位描述 用小程序查看更多 |
|
1、负责研发AIOps系统,通过LLM结合OpenAPI/MCP等技术,实现云客户的自动化运维,提升运维效率和稳定性; 2、设计与开发前沿AI智能体:构思、原型化并评估新颖的、基于LLM的自主智能体。这些智能体需要能够基于云平台产品和OpenAPI执行端到端的IT事件管理任务,包括智能日志分析、多模态异常检测、根本原因分析(RCA)以及自动化修复方案的生成与执行; 3、探索与实施尖端LLM技术:深入研究并应用最先进的LLM技术,包括但不限于: MCP为客户侧AIOps系统提供与云平台OpenAPI进行集成的标准化接口; 利用检索增强生成(RAG)为模型提供丰富的、上下文感知的运维数据(如日志、指标、追踪); 设计和实现多智能体协作框架,让多个专用智能体协同解决复杂的系统故障; 通过模型微调(Fine-tuning)和提示工程(PromptEngineering),提升模型在特定运维任务上的性能和可靠性; 4、解决核心研究挑战:专注于攻克将LLM应用于AIOps领域的关键难题,例如: 研究并提出创新方法以减轻模型的“幻觉”(Hallucination)问题,确保在生产环境中的决策可靠性, |
|
| |
|
|
| |
|