职位描述
工作职责:
1.负责大模型(如LLM)的开发、优化与应用落地,包括但不限于RAG(Retrieval-Augmented Generation)架构的开发与优化,实现高质量的文本生成与知识检索能力。
2.深入参与大模型的微调(Fine-tuning)工作,根据具体业务需求,通过Prompt工程设计高效的Prompt模板,提升模型在特定任务上的性能。
3.构建与维护知识库,实现知识的高效存储、检索与更新,为大模型提供丰富的知识支持,提升模型的知识性和准确性。
4.使用Python或Java语言进行大模型相关项目的开发工作,包括但不限于模型训练、推理、部署等环节。
5.跟踪大模型领域的前沿技术,结合公司业务需求进行技术探索与创新,推动大模型技术在业务中的应用与发展。
6.与团队成员紧密合作,完成大模型项目的开发任务,确保项目按时交付并达到预期效果。
技能要求:
1. 熟练掌握Python或Java编程语言,具备扎实的编程基础和良好的代码规范。
2.理解大模型(如Transformer架构)的工作原理,具备大模型微调(Fine-tuning)的实际经验,能够根据业务需求对模型进行有效的优化。
3.熟悉RAG开发流程,包括检索模块(Retrieval)的设计与优化、生成模块(Generation)的训练与调优,以及两者之间的协同工作。
4. 精通Prompt工程,能够设计高效、精准的Prompt模板,提升大模型在特定任务(如文本分类、问答系统、文本生成等)上的性能。
5.具备知识库构建经验,熟悉知识图谱、文档数据库等知识存储技术,能够为大模型提供高质量的知识支持。
学习与沟通能力
1.对大模型领域的新技术、新方法有较强的学习能力,能够快速掌握并应用到实际工作中。
2.具备良好的团队协作精神和沟通能力,能够与不同背景的团队成员(如产品经理、业务人员等)进行有效沟通与协作。
涉及国内出差,有出差补贴!!!