岗位职责:
1.参与实验室大模型的数据研究,包括高质量文档内容提取、数据清洗、模型训练以及模型评估。工作核心是基于数据研究构建高质量的大模型训练样本,为大模型训练提供坚实的数据支撑。
2.参与智能文档内容提取工作,包括但不限于公式检测、公式识别、布局分析以及OCR。可以针对具体问题设计优化策略,持续迭代更新算法,以保证内容提取的高质量。
3.构建Data-Centric数据闭环,探索在固定模型和评测情况下提高多模态数据质量的有效途径,这包括图文数据质量、研究数据和模型的Scaling Law、研究数据配比、数据混入策略以及混入时机。
- 在高质量会议及期刊上发表科研论文及自主创新性专利,以打造和提升行业技术影响力。
任职要求:
1.硕士及以上学历,计算机视觉、自然语言处理、多模态、机器学习等相关专业,博士优先。
2.较强的动手和编程能力,熟练掌握Python/C++等编程语言及Pytorch/Tensorflow等深度学习开发框架。
3.在计算机视觉、自然语言处理等相关方向顶会或者顶刊上以一作身份发表过学术论文,具备扎实的代码功底和工程能力。
4.在以下研究方向有深入研究或丰富工作经验:智能文档处理(OCR、公式识别/检测、Layout检测)、多模态大模型研究,Data-Centric研究、大模型数据质量研究。
5.具备良好的沟通表达能力、团队协作意识、针对关键技术难度的攻坚能力以及一定的抗压能力。
{"address":"上海市徐汇区龙文路129号国际传媒港L1栋","zone":["上海市","上海市","徐汇区"],"latitude":31.169267,"name":"上海人工智能实验室","longitude":121.466319}
上海人工智能实验室是我国人工智能领域的新型科研机构,开展战略性、原创性、前瞻性的科学研究与技术攻关,突破人工智能的重要基础理论和关键核心技术,打造“突破型、引领型、平台型”一体化的大型综合性研究基地,支撑我国人工智能产业实现跨越式发展,目标建成国际一流的人工智能实验室,成为享誉全球的人工智能原创理论和技术的策源地。