一、岗位要求
教育背景
学历:计算机科学、软件工程、人工智能、数据科学、统计学、数学等相关专业本科或硕士在读。
核心课程:需熟悉数据结构与算法、机器学习、数据库原理、概率统计等。
技术技能
编程语言:至少精通 Python,熟悉 SQL;加分项:Java/Scala/C++。
大数据工具:了解 Hadoop/Spark/Flink 等分布式计算框架,或至少熟悉一种(如 Spark)。
AI/ML 框架:掌握 TensorFlow/PyTorch 等深度学习框架,熟悉常见算法(如 CNN、RNN、强化学习)。
数据处理:熟悉数据清洗、特征工程、可视化工具(如 Pandas、Matplotlib、Tableau)。
数据库:熟悉 MySQL、HBase、Redis 等,了解 NoSQL 或时序数据库更佳。
加分项
有 Kaggle 竞赛、数学建模比赛经历,或 GitHub 开源项目(需提供代码链接)。
熟悉云计算平台(AWS/Azure/阿里云)或 Docker/Kubernetes 部署。
了解 NLP(如 Transformer、BERT)、CV(目标检测、图像分割)或推荐系统(协同过滤、排序模型)。
论文发表或科研项目经历(尤其是顶会/期刊)。
软技能
逻辑清晰,能独立解决问题,具备快速学习能力。
良好的沟通能力,能配合团队完成项目迭代。
二、职位描述(JD)
核心工作内容
参与 大数据平台 的构建与优化,支持海量数据(用户行为日志、业务数据)的采集、存储与处理。
开发或优化 AI 模型,应用于实际业务场景(如推荐系统、风险预测、图像识别、自然语言处理)。
配合团队完成数据挖掘、特征工程、模型训练与调优,撰写技术文档。
通过 A/B 测试验证模型效果,推动算法在业务中的落地。
具体任务示例
教育科技场景:
分析在线教育平台的用户学习行为数据,构建 个性化推荐模型(如课程推荐、学习路径规划)。
开发 AI 驱动的 智能答疑系统(基于 NLP 的问答匹配或知识图谱)。
通用场景:
使用 Spark 处理 TB 级数据,优化 ETL 流程性能。
基于 TensorFlow 实现时序预测模型(如销量预测、设备故障预警)。
学习与成长机会
接触真实业务场景,理解 AI 从研发到落地的全流程。
表现优异者可转正或获得内推机会。