职位描述
职位描述:
1、负责LLM、LMM的算法研究与应用,包括预训练、SFT、RLHF、检索增强、Tool使用等;
2、追踪AI最新技术和热点,优化、改进现有技术和系统,设计技术方案和路线,实现业务价值和效率提升。
职位要求:
1、计算机、数学、自动化等相关专业,硕士或以上学历;
2、熟练掌握深度学习、机器学习、自然语言处理、多模态的基础知识,熟悉常用模型的原理、特点及应用,能够根据实际问题设计合理的技术方案;
3、熟悉PyTorch、TensoFlow等深度学习框架,熟悉Transformer、BERT、GPT、LLaMA及其扩展等典型深度学习模型的原理和实现;
4、掌握各种类型大模型应用的架构方式,例如Chatbot、Copilot、RAG、Agent等,并有相关应用研发经验;
5、对LangChain、LlamaIndex、Semantic Kernel、AutoGPT、AutoGen等开源大模型应用编排框架有深入理解,并对大模型应用编排框架未来的发展有自己的洞见;
6、掌握Python、C 、Java等至少一门编程语言,熟悉Linux环境;
7、较强的coding能力;
8、优秀的沟通能力、组织能力、自我驱动能力和抗压能力。
[加分项]
1、在有影响力的开源项目中,做过核心贡献;
2、在核心期刊或会议上发表过论文;
3、在知名竞赛中获得优异名次;
4、编程竞赛(ACM等)获奖。