一、项目名称:大数据综合应用
二、项目负责人:吴继兵、罗海峰
三、竞赛目的:
本赛项旨在结合当前大数据行业中技术要求,通过大赛让参赛选手熟悉一个大数据项目中各个环节的实现过程。
通过竞赛来检验教学水平,引领和促进专业教育教学改革,营造崇尚技能的学习氛围。通过大赛培养参赛选手在企业真实项目环境下进行大数据平台部署管理、数据采集与处理、数据清洗与挖掘分析、数据可视化及综合分析的能力;同时培养选手的理解力、沟通力、抗压力等职业素质;激发学生自主学习能力和解决问题能力,以达到“以赛促学、以赛促教、以赛促改”目的。
赛项围绕大数据产业各个岗位的实际需求和要求进行设计,提升大数据技术专业学生的专业综合应用能力,为社会规划提供大数据领域高素质技能型人才。
四、竞赛班级及指导教师
2021级大数据技术专业学生
指导教师:罗海峰、吴继兵、朱毓。
五、竞赛时间
2023年6月16日8:00-11:00
六、竞赛地点及设备要求:
(一)地点:大师工作室
(二)设备要求:
自备笔记本电脑,性能相当于 i5 处理器,不小于 8GB 内存,不小于 500GB 硬盘,显示器分辨率要求 1024*768 以上。
操作系统:Windows7或 Windows10
开发环境: VMware虚拟机、jdk-8u212、CentOS-7、hadoop-3.1.3、MySQL-5.1.27、hive-3.1.2、DataGrip、FineBI
七、竞赛方式与内容:
(一)竞赛方式
1.竞赛采取个人比赛方式;
2.学生以结果答题卡文档的形式提交比赛结果。
(二)竞赛内容
赛项以大数据技术与应用为核心内容,重点考查参赛选手基于Hadoop 平台环境下,利用 Hadoop 技术生态组件,综合软件开发相关技术,解决实际问题的能力,具体包括:
1.掌握按照项目需求搭建、配置、管理 Hadoop 大数据平台;
2.掌握数仓工具Hive平台的搭建与配置;
3.分析解析案例背景、目标需求、原始数据内容;
4.掌握Hive数仓建库建表、ETL操作;
5.基于Hadoop和Hive实现数据统计分析,构建聊天数据分析报表;
6.利用合适的数据可视化工具可视化分析工具;
八、竞赛规则:
1.参赛选手应严格遵守赛场纪律,服从指挥,着装整洁,仪表端庄,讲文明礼貌。
2.在竞赛过程中,参赛选手如有疑问,应举手示意,考场裁判应按要求及时予以答疑。如遇设备或软件等故障,参赛选手应举手示意,考场裁判应及时予以解决。确因计算机软件或硬件故障,致使操作无法继续的,经考场裁判确认,予以启用备用设备。
3.参赛选手原则上不得因各种原因提前结束比赛。现场比赛结束,经裁判员确认后方可离开赛场。
九、评分标准:
根据参赛选手提交的比赛结果,严格按照项目指标体系进行评分,竞赛名次按照得分高低排序。
序号 | 比赛模块 | 考核内容 | 比例 |
1 | 大数据平台及组件的部署管理 | 选手对大数据平台及组件的部署、配置、管理。 | 30% |
2 | 数据预处理 | Hive数仓建库建表、ETL操作 | 20% |
3 | 数据统计与分析 | 基于Hadoop和Hive实现数据统计分析,构建聊天数据分析报表 | 25% |
4 | 数据可视化 | 选手通过常见的数据可视化方法,使用 FineBI将数据分析结果以图表的形式进行呈现、统计。 | 20% |
6 | 职业素养 | 操作规范、文明竞赛。 | 5% |
十、成果展示:
1、学院信息工程系网站
十一、评奖方式:
1.评委组成
罗海峰、朱毓、吴继兵
2.奖项设定
一等奖10%,二等奖20%,三等奖30%。