职位类型:机器学习平台
工作地点:北京市,上海市
项目:REDstar 顶尖人才计划
工作职责
模型压缩方向:
1、探索研发针对大语言模型、多模态大模型、StableDiffusion模型等模型的压缩技术,包括但不限于量化、蒸馏、剪枝、稀疏化等;
2、参与/负责多个业务场景中的模型压缩技术实现,对模型进行轻量化压缩,提高训练/推理效率,支持业务降本增效。
推理框架方向:
1、参与/负责研发面向CV/NLP/多模态/大语言模型等类型模型的推理服务框架;
2、通过并行计算优化、分布式架构优化、异构调度等多种框架技术,打造高效、易用、领先的AI推理框架。
高性能计算方向:
1、参与/负责AI推理/训练框架的底层性能优化工作,包括但不限于高性能算子、通信库开发与优化等工作;
2、参与/负责大模型计算引擎的研发工作,通过多种方式实现训推性能SOTA;
3、参与/负责前沿AI编译加速等技术的探索和业务落地。
模型训练方向:
1、负责调度公司所有模型训练与推理资源;
2、基于自建的训推引擎,构建公司统一的机器学习平台,为公司所有算法同学(稀疏 & 稠密,含 LLM) 模型迭代提供端到端的一站式服务;包括 数据生产,模型训练,模型上线,特征管理,模型测试,资源管控等一系列能力。
任职资格
1、本科及以上学历,计算机、软件、人工智能、电子信息、网络安全、数学等相关专业优先;
2、熟悉Linux/Unix平台上的C++编程,熟悉网络编程-多线程编程,有良好的编程习惯;
3、熟悉蒸馏、剪枝、量化等模型压缩常用方案者优先;
4、熟悉其中一种主流的深度学习训练或推理框架(TensorFlow / PyTorch / Onnx / TensorRT等)的原理和实现者优先;
5、有分布式系统开发、大数据处理开发经验者优先,有互联网企业实习经验优先;
6、有扎实的专业基础知识,熟悉常用的数据结构和算法,对计算机系统结构-网络-操作系统等专业知识有深刻认知;
7、具备优秀的逻辑思维能力,有良好的团队合作精神,较强的沟通能力和学习能力。

