1、对模型进行推理加速优化,包括但不限于模型量化、剪枝、高性能解码、token压缩等,提升模型端侧运行效率,同时降低模型端侧存储需求;
2、与端侧芯片原厂合作,针对特定硬件架构和推理引擎进行模型算力需求压缩优化,以实现最佳性能;
3、跟踪最新的模型压缩、推理加速技术,评估在端侧部署中的可行性和效果,提升产品技术水平和竞争力。
1、计算机、自动化、计算数学、统计学等相关专业,博士以上学历,具备较好的计算机通用算法基础;
2、有大语言模型算力压缩、推理优化经验,或有其它深度学习模型算力压缩经验,如量化、剪枝等;
3、熟悉python/linux shell等工具及PyTorch等深度学习框架;
4、强烈的责任心和自我驱动能力及良好的沟通能力;
5、在量化、剪枝等模型压缩方向上发表过高水平论文、或获得过相关赛事奖项者优先。
{"address":"广州市黄埔区云埔四路","zone":["广东省","广州市","黄埔区"],"latitude":23.161268,"name":"广州视源电子科技股份有限公司","longitude":113.533801}
广州视源电子科技股份有限公司(以下简称视源股份)成立于2005年12月,注册资本为70123.9045万元,旗下拥有多家业务子公司。截至2022年12月31日,公司总人数超6000人,约60%为技术人员,员工平均年龄约为30岁。 目前公司的主营业务为液晶显示主控板卡和交互智能平板等显控产品的设计、研发与销售,产品已广泛应用于家电领域、 教育信息化领域、企业服务领域等,始终致力于通过产品创新、研发设计提升产品的用户体验,为客户和用户持续创造价值。公司自成立以来,依托在音视频技术、信号处理、电源管理、人机交互、应用开发、系统集成等电子产品领域的软硬件技术积累,面向多应用场景进行技术创新和产品开发,通过产品和资源整合等能力在细分市场逐步取得领先地位,并建立了教育数字化工具及服务提供商希沃(seewo)、智慧协同平台 MAXHUB 等多个业内知名品牌。