岗位职责:
负责大语言模型的训练、应用落地、与性能评估体系建设。
1、负责研发和优化大模型的高效训练方案,提升模型训练效率和性能,利用分布式训练框架训练百亿级大模型;2、结合业务研究大模型应用技术,如LangChain、检索增强、插件调用等;3、跟踪技术进展和趋势,并应用到产品;4、研究大模型评估方法,简历评估系统;负责大模型算法优化与前沿技术洞察。1、负责大模型算法优化与模型训练;2、研究和开发针对特定行业或场景的大模型,以满足不同业务需求;3、研究大模型指令微调和对齐策略等;4、负责跟踪大模型领域最新研究成果,进行技术的创新和优化。
岗位要求:
1、硕士、博士应届毕业生;2、计算机、人工智能、自然语言处理等相关专业;3、专业基础扎实,成绩优秀,无不及格科目;4、正直、诚信、有激情、专注,具备良好的额团队精神、沟通和表达能力,有快速学习的能力,分析能力,高水平论文撰写能力;5、有较好的英语能力(英语四级及以上);6、熟练掌握Python编程语言,熟悉PyTorch、TensorFlow等深度学习框架;熟悉Transformer、GPT4、PaLM-E等模型,熟悉预训练和微调流程,具有相关的工作经验;了解DeepSpeed等分布式训练工具库。
京东方科技集团股份有限公司(京东方A:000725;京东方B:200725)创立于1993年4月,是一家光电显示技术、产品与解决方案的提供商。 经过多年的技术积累与创新,京东方可使用专利数量逾9000项,2012年度新增专利申请数量达到2500项,居国内同业前列,成为中国大陆显示领域综合实力的高科技企业。目前,京东方拥有一条月产能为4.5万片玻璃基板的第4.5代TFT-LCD生产线(成都)、一条月产能为10万片玻璃基板的第5 代TFT-LCD生产线(北京)、一条月产能为10万片玻璃基板的第6代TFT-LCD生产线(合肥)、一条月产能为9万片玻璃基板的第8.5代TFT- LCD生产线(北京)、一条月产能为9万片玻璃基板的第8.5代TFT-LCD生产线(合肥,建设中)、一条月产能为5.4万片玻璃基板的第5.5代 AMOLED生产线(鄂尔多斯,建设中)。