岗位职责:
1、参与深度学习框架研发工作,落地深度学习领域新方法和新实现,了解相关领域的新技术;
2.参与深度学习框架的研发与优化;
3.适配深度学习最新算法与架构,对框架进行调整、改进和优化;
4.对框架的训练速度进行优化,包括计算和通信及其调度,以提高模型训练的效率;
5.扩充深度学习框架的功能和计算能力,完善工具体系。
任职要求:
1.具有良好的编程习惯,熟练使用Python/C++ 语言,有较强的debug能力;
2.扎实的计算机科学功底和编程能力,熟练使用常见的算法和数据结构,良好的编程习惯和代码风格;
3.对深度学习框架或者深度学习编译器有较深理解以及实践经验(包含不限于深度学习框架:Pytorch,TF,JAX;大模型推理框架:vllm、LMDeploy、lightllm等;深度学习编译方向:triton,XLA,MLIR,TVM,Mojo等等);
3.熟悉大模型的训练或者推理算法;
4.有良好的文档习惯,及时按照要求撰写技术文档和工作进展;
5.有较强的团队精神和沟通交流能力。
{"address":"上海市徐汇区龙文路129号国际传媒港L1栋","zone":["上海市","上海市","徐汇区"],"latitude":31.169267,"name":"上海人工智能实验室","longitude":121.466319}
上海人工智能实验室是我国人工智能领域的新型科研机构,开展战略性、原创性、前瞻性的科学研究与技术攻关,突破人工智能的重要基础理论和关键核心技术,打造“突破型、引领型、平台型”一体化的大型综合性研究基地,支撑我国人工智能产业实现跨越式发展,目标建成国际一流的人工智能实验室,成为享誉全球的人工智能原创理论和技术的策源地。