选择语言
< 返回主菜单
发布时间:2024.11.27

【人工智能】多模态算法工程师(数据工程)——姚远团队(有效期至2025.6.30)

中国 上海

团队PI简介

姚远

上海期智研究院PI,同时将于2025年10月加入清华大学人工智能学院担任助理教授、博士生导师。他于清华大学计算机系获得学士和博士学位,随后在新加坡国立大学计算机学院担任博士后研究员。共发表顶会论文30余篇,论文入选 ICLR Spotlight、CVPR Highlights、ECCV Oral、Nature Communications Editors' Highlights 等亮点推荐专栏。相关成果 Google Scholar 总引用 6000 余次,GitHub开源项目星标 3.6 万余次,开源模型在国际开源平台下载量 900 万余次。主导构建高效多模态大模型 MiniCPM-V及MiniCPM-o系列(https://github.com/OpenBMB/MiniCPM-o),在 HuggingFace Trending、GitHub Trending 和 Papers With Code Trending Research 榜单排名第一,模型入选HuggingFace 2024年度最受欢迎和下载模型榜单、中关村论坛年会10项重大科技成果等。曾获吴文俊人工智能科学技术奖优秀博士学位论文奖、英特尔中国学术成就奖、世界人工智能大会云帆奖等荣誉。欢迎青年才俊加入团队共同打造有全球影响力的多模态大模型!


岗位详情


1. 负责多模态大模型预训练、SFT、强化学习等各阶段的模型研发、数据建设及训练工作,涉及模型高效结构、多模态 scaling law、数据构造及配比、性能优化等探索。

2. 参与多模态大模型的训练加速和高效部署,包括但不限于于系统调优、硬件适配等工作。

3. 参与前沿多模态算法的调研和研究创新工作,并将多模态大模型能力应用在具体场景中。


岗位要求


1. 具备扎实的编码能力,具有优秀的基础算法、代码能力,ACM/ICPC、NOI/IOI、Top Coder、Kaggle等比赛获奖者优先。

2. 熟悉多模态大模基本原理,至少熟悉一种深度学习编程框架,如PyTorch等,有模型开发、部署、微调经验;熟悉掌握分布式训练框架如 DeepSpeed/Megatron。

3. 对多模态大模型有深入理解和实践经验优先;在CVPR、NeurIPS、ACL等人工智能顶级会议上发表论文者优先。

4. 及时跟进前沿技术进展,有优秀的问题分析和解决能力。工作积极主动,能够与团队融洽合作,一起探索新技术,推进技术进步。


投递方式

投递个人简历至邮箱pr@sqz.ac.cn,邮件名称以“姓名-岗位名称-PI团队”命名。


薪资

面议