一、项目名称:大数据综合应用
二、项目负责人:吴继兵、朱毓
三、竞赛目的:
本赛项旨在结合当前大数据行业中技术要求,通过大赛让参赛选手熟悉一个大数据项目中各个环节的实现过程。
通过竞赛来检验教学水平,引领和促进专业教育教学改革,营造崇尚技能的学习氛围。通过大赛培养参赛选手在企业真实项目环境下进行大数据平台部署管理、数据采集与处理、数据清洗与挖掘分析、数据可视化及综合分析的能力;同时培养选手的理解力、沟通力、抗压力等职业素质;激发学生自主学习能力和解决问题能力,以达到“以赛促学、以赛促教、以赛促改”目的。
赛项围绕大数据产业各个岗位的实际需求和要求进行设计,提升大数据技术专业学生的专业综合应用能力,为社会规划提供大数据领域高素质技能型人才。
四、竞赛班级及指导教师
2020级大数据技术专业学生
指导教师:吴继兵、朱毓、罗海峰。
五、竞赛时间
2021年6月25日8:00-12:00
六、竞赛地点及设备要求:
(一)地点:大师工作室
(二)设备要求:
自备笔记本电脑,性能相当于 i5 处理器,不小于 8GB 内存,不小于 500GB 硬盘,显示器分辨率要求 1024*768 以上。
操作系统:Windows7或 Windows10
开发环境: VMware虚拟机、Google Chrome 浏览器、Visual Studio Code 代码编辑器、Pycharm IDE
七、竞赛方式与内容:
(一)竞赛方式
1.竞赛采取个人比赛方式;
2.学生以结果答题卡文档的形式提交比赛结果。
(二)竞赛内容
赛项以大数据技术与应用为核心内容,重点考查参赛选手基于Hadoop 平台环境下,利用 Hadoop 技术生态组件,综合软件开发相关技术,解决实际问题的能力,具体包括:
1.掌握按照项目需求配置管理 Hadoop 大数据平台及相关生态组件,如 Hadoop、Spark、Flink 等;
2.掌握企业常用采集工具和网络爬虫的相关技术,完成指定数据的采集及处理能力;
3.综合利用 MapReduce、Spark 等技术、分布式存储系统、数据仓库 Hive 等工具,使用 Java、Python、Scala 等开发语言,完成数据清洗、存储、转化、分析及数据推送等一系列大数据操作;
4.综合运用 HTML、CSS、JavaScript、Python 等开发语言,对数据进行可视化呈现;
八、竞赛规则:
1.参赛选手应严格遵守赛场纪律,服从指挥,着装整洁,仪表端庄,讲文明礼貌。
2.在竞赛过程中,参赛选手如有疑问,应举手示意,考场裁判应按要求及时予以答疑。如遇设备或软件等故障,参赛选手应举手示意,考场裁判应及时予以解决。确因计算机软件或硬件故障,致使操作无法继续的,经考场裁判确认,予以启用备用设备。
3.参赛选手原则上不得因各种原因提前结束比赛。现场比赛结束,经裁判员确认后方可离开赛场。
九、评分标准:
根据参赛选手提交的比赛结果,严格按照项目指标体系进行评分,竞赛名次按照得分高低排序。
序号 | 比赛模块 | 考核内容 | 比例 |
1 | 大数据平台及组件的部署管理 | 选手对大数据平台及组件的部署、配置、管理。 | 15% |
2 | 数据采集与处理 | 选手多维度数据采集能力,包括对关系型数据库、非关系型数据库和网络爬虫技术的应用。 | 20% |
3 | 数据清洗与挖掘分析 | 选手对 Hadoop 系统、Spark系统等综合应用能力, 使用 Java、Python、Scala 等开发语言,完成数据清洗、数据存储、数据转化、数据分析、数据挖掘等操作。 | 25% |
4 | 数据可视化 | 选手通过常见的数据可视化方法,使用 Python 语言将数据分析结果以图表的形式进行呈现、统计。 | 20% |
5 | 综合分析 | 选手对大数据技术与分析的综合操作和业务分析报告撰写能力。 | 15% |
6 | 职业素养 | 操作规范、文明竞赛。 | 5% |
十、成果展示:
1、学院信息工程系网站
十一、评奖方式:
1.评委组成
黄玉春、巨峰、周跃、罗海峰、朱毓、吴继兵
2.奖项设定
一等奖10%,二等奖20%,三等奖30%。
撰稿:吴继兵 审稿:周跃