星外工多多 [切换] 客服微信  收藏  消息  免费找工作 | 企业免费招人 | 雇主免费招人   登陆/注册  
 
   
 请输入关键词:
 
所有操作  
   星外工多多:  交流群  
   我的工多多(企业招人) >
   企业信息页     >
   发布正规职位    >
   查找人才      >
   关注的人才     >
   企业认证      >
   充值财务      >
   切换角色      >
 
   
  分布式调度资深软件工程师  点击:8次
工作编号:1445041
30000-45000/月
深圳天顿数据科技有限公司 查看企业资料及职位 2025-10-10 
深圳市-福田区  1-3年经验 | | 招2人 | 全职
  工作地址
(深港科技创新合作区深方园区A栋17) 用小程序查   用百度查

  职位描述  用小程序查看更多
职责
1.负责跨地域大规模分布式AI平台的设计和开发,统筹优化跨地区的数据中心算力资源
2.多类型计算任务和异构资源的抽象和API设计,优化和适配分布式资源管理和调度系统包括kubernetes,slurm等
3.分析和解决分布式系统的可用性,性能,规模,容错以及安全挑战
任职要求
1.博士学历以上,计算机或电子信息相关专业
2.2年以上企业级软件研发经验包括软件项目的设计,开发,维护,能交付高质量可维护的软件
3.有丰富的Golang开发经验,熟悉存储,缓存,通信等常用中间件,能进行深度的性能优化
4.熟悉网络编程,TCP/IP协议以及HTTP协议,熟悉常用的数据结构与算法
5.理解AI分布式训练,包括业务场景,计算特点以及对平台的技术挑战
6.具有kubernetes,slurm,openstack等集群管理系统或者大规模云服务的开发经验
7.【加分项】熟悉AI分布式训练技术栈者优先,tensorflow,pytorch,MPI,CUDA,Horovod,NCCL,kubeflow
8.具备较强的学习能力和责任心,良好的沟通协作能力
 
 

  职位照片
尚未上传照片。

  联系办法
     联系电话: [请登陆后查看]  用小程序打开  
 

  马上投简历  收藏   复制网址  投诉下架

  深圳天顿数据科技有限公司 查看企业资料及职位**(已实名) 查看个人雇主资料及职位

  谁看过此职位
  只显示非匿名用户
 
 
欢迎您的到来!星外工多多,让天下没有难找的工作!
微信交流群 [星外工多多] 全功能服务号 [星外工多多] 客服
《用户服务协议》 《隐私政策》  投诉与举报  关于我们  更新历史  小程序/APP下载

广州市星外信息科技有限公司 保留所有权利 注册商标 人力资源许可证 增值电信经营许可证:粤B2-20251456 粤ICP备05000912号-2