职位描述
该职位还未进行加V认证,请仔细了解后再进行投递!
工作职责:
职位描述
Transformer、大模型算法、AI Agent、Python、C/C 、模型量化、CUDA、NPU推理加速
【工作职责】
1、参与大模型推理系统设计和研究,包括但不限于模型量化、推理加速,进行服务层、推理层和算法层的优化探索,实现整体效率提升;
2、进行推理性能分析和优化,实现对gpu,npu等异构硬件,边缘、云端等各种场景的高效推理技术;
3、研究实现各种模态混合的高效大模型推理技术;
4、熟练使用Python、C 、Rust和CUDA编写代码;
5、研究和应用Transformer架构以及相关领域的最新研究成果,探索应用各种能提升大模型推理效率和精度的高效架构;
6、研究从推理层面提升模型逻辑能力的各种方法。
任职资格:
岗位要求:
1、计算机科学、软件工程、人工智能等相关领域,计算机基础扎实;
2、掌握Python和C 编程语言,具备CUDA编程经验,理解GPU并行计算原理;
3、理解Transformer架构相关知识;
4、对深度学习模型的优化和高性能计算有浓厚兴趣;
5、具备良好的问题解决能力和团队合作精神;
6、在读硕士或博士。
薪资:硕士实习生正常6-8K,特别优秀者面议,博士面议。
职位描述
Transformer、大模型算法、AI Agent、Python、C/C 、模型量化、CUDA、NPU推理加速
【工作职责】
1、参与大模型推理系统设计和研究,包括但不限于模型量化、推理加速,进行服务层、推理层和算法层的优化探索,实现整体效率提升;
2、进行推理性能分析和优化,实现对gpu,npu等异构硬件,边缘、云端等各种场景的高效推理技术;
3、研究实现各种模态混合的高效大模型推理技术;
4、熟练使用Python、C 、Rust和CUDA编写代码;
5、研究和应用Transformer架构以及相关领域的最新研究成果,探索应用各种能提升大模型推理效率和精度的高效架构;
6、研究从推理层面提升模型逻辑能力的各种方法。
任职资格:
岗位要求:
1、计算机科学、软件工程、人工智能等相关领域,计算机基础扎实;
2、掌握Python和C 编程语言,具备CUDA编程经验,理解GPU并行计算原理;
3、理解Transformer架构相关知识;
4、对深度学习模型的优化和高性能计算有浓厚兴趣;
5、具备良好的问题解决能力和团队合作精神;
6、在读硕士或博士。
薪资:硕士实习生正常6-8K,特别优秀者面议,博士面议。
工作地点
地址:包头东河区新安街道海纳百川大厦
查看地
求职提示:用人单位发布虚假招聘信息,或以任何名义向求职者收取财物(如体检费、置装费、押金、服装费、培训费、身份证、毕业证等),均涉嫌违法,请求职者务必提高警惕。
职位发布者
HR
深圳市亿道控股有限公司
- 电子技术·半导体·集成电路
- 500-999人
- 公司性质未知
- 深圳市宝安区28区大宝路49-1号金富来大厦