职位描述
工作职责
1. 分析金融大模型公开榜单badcase,定位模型能力短板
2. 针对缺陷设计金融难题,输出种子题并沉淀构建方法论
3. 指导团队批量构建评测题目,校验内容准确性
4. 制定金融AI数据评测流程,验证模型复杂问题推理逻辑
5. 构建并优化金融场景评测基准(Benchmark)
任职要求
1. 硕士及以上学历,教育经历含985/211院校背景
2. 一类本科金融(经济)、精算领域教授/副教授
3. 可独立输出金融难题,掌握批量出题方法论
4. 3年以上相关经验,有金融类国家级/国际级考试出题经验优先
5. 了解AI大模型,有大模型项目参与经验优先
补充说明
1. 工作形式:线上居家兼职