职位描述
岗位职责:
1.设计并维护教育大模型的数据管道,实现从原始数据采集到训练数据输出的自动化流程。
2.优化数据管道性能(如吞吐量、延迟),支持高并发教育数据(如考试期间的答题数据)的实时处理。
3.开发数据校验和异常处理机制,保障训练数据的一致性和完整性。
任职要求:
1.本科及以上学历,计算机 / 软件工程专业,3 年以上数据管道开发经验,熟悉 Kafka、Spark 等工具。
2.掌握 SQL 和 Python 数据处理脚本,有教育数据 ETL 案例优先。
3.了解教育数据的业务逻辑(如课程进度、学生档案),能设计针对性管道策略。