大数据管理与应用专业 李晓菲
大数据引领了数据分析时代的到来,“大数据分析师”应运而生,大数据分析师究竟做何工作?如何成为大数据分析师?需要什么技能?大家或多或少都面临学习方向的疑问和困惑。大数据分析相关专业是近些年设立的新专业,市场上现有大数据分析相关人才的供给非常有限,而市场需求方面则呈现另一番景象,对大数据分析方向的人才需求很旺盛,就业市场呈现人才供求关系的不平衡和供求匹配的不契合。无论是大数据方向择业就业的炙手可热,还是国家战略和大数据产业发展要求,大数据分析都可谓前景可观,既能够赋能个人的职业发展,又能驱动经济的高质发展。
大数据分析涉及广泛的学科交叉(计算机、数学、统计学等)、复杂的专业知识体系、快速的技术迭代,从事大数据分析工作既要具备数据素养和数理统计基础,又要掌握大数据分析技术和编程技能,更要熟知分析对象的业务领域知识以解决实际问题,所以说大数据分析师是对从业者知识、能力和素质的综合型复合性要求,并非一朝一夕的速成塑造,而是一场漫长的升级打怪之行,需要长期的知识学习和大量的实战积累。大数据分析学习者和从业者,始终都要抱有一种“在路上”的初学者心态(活到老,学到老),方能积跬步以至千里,积小流以成江海,在数据分析的海洋世界如鱼得水。
大数据分析学习之路,既要沉下去埋头苦学(掌握扎实的数理统计基础和计算机处理技能),又要浮出来抬头看路(培养业务领域知识的洞察力和解读力)。工欲善其事,必先利其器。小编也是学中用、用中学,仅就个人理解和学习体悟,结合专业开设课程和学生学习基础,谈谈关于大数据分析学习(偏大数据分析管理与应用方向)的一点理解和体会,希望精心梳理的学习路径,能够成为大数据学习者精进路上的有益参考。
第一阶段:入门学习阶段——“观其大略”而非“顾及细微”
- 适用对象:大数据专业低年级学生,大数据分析初级爱好者
- 专业开设课程:
数理基础——《概率论与数理统计》、《高等数学》、《线性代数》、《运筹学》
统计基础——《管理统计学》
编程基础——《数据结构(Python)》、《数据分析基础(Python)》
大数据基础 ——《大数据导论》《数据库与数据仓库》
经管基础——《管理学》《会计学基础》《经济学基础》
- 课外资源:
(1)推荐书目:《大数据导论》(林子雨著)
(2)视频课程:《大数据导论》MOOC视频(林子雨主讲)
(3)公众号:书圈、大数据文摘、计量经济学服务中心、数学中国、超级数学建模、菜鸟学Python、小象学院
- 学习路径
步骤1:前期知识基础决定后续学习高度,要重视基础阶段知识的积累学习和理解掌握,为后续大数据分析深入系统的学习奠定基础。充分利用课堂学习时间和学习资源,理清基本概念、了解领域概貌,通过课程学习形成自己对于大数据分析的认识和把握。
步骤2:在校内开设课程的基础上结合课外学习资源,培养数据素养和数据思维,基于大数据分析的全链路知识体系,建立对大数据分析学习的全局认识。
第二阶段:基础夯实阶段——不仅要见“森林”,更要见“树木”
- 适用对象:大数据专业中、中高年级学生,大数据分析学习者(具备一定的计算机编程知识)
- 专业开设课程:
大数据分析技术:《大数据采集与预处理技术》、《大数据分析与挖掘》、《多元统计分析与R建模》、《仿真建模与分析》等
分析业务背景:《电子商务概论》、《市场营销学》、《客户关系管理》
- 课外资源
- 推荐书目:大数据分析与挖掘(石胜飞著)、大数据挖掘与统计机器学习(吕晓玲等著)、《机器学习》(周志华著)、《Python大数据分析算法与实例》(邓立国著)
- 视频课程:Coursera、中国大学MOOC、腾讯课程、网易云课堂(数据挖掘、数据分析、机器学习相关课程)
- 电子资源链接:(下载书目对应电子书、课件、案例数据和程序等)
http://www.tup.com.cn清华大学出版社
http://www.crup.com.cn/ 中国人民大学出版社
http://download.dutpbook.com/,大连理工大学出版社资源下载中心
- 学习重点:
重点1:理解大数据的数据特征,比如非结构化、多源、异构等,常用的数据采集方法和网络爬虫,通过数据清洗转换获得高质量的输入数据。
重点2:结合专业课程及推荐书目的阅读,弄清搞懂各类统计模型、数据挖掘和机器学习算法,如回归、分类、预测、关联规则、推荐算法等,重点掌握各种模型算法的应用场景和实现解释。
重点3: 熟练掌握一两门数据分析工具,如SPSS(SPSS Statistics偏统计功能; SPSS Modeler偏数据挖掘)、R(开源软件)、Python、Matlab等
第三阶段:技术进阶阶段——乘风破浪会有时,直挂云帆济沧海
- 适用对象:大数据专业中、中高年级学生,大数据分析技术学习和从事者
- 专业开设课程内容:
大数据时代的数据存储与管理技术(SQL、NoSQL数据库、云数据库、分布式数据库MapReduce等)、大数据处理架构Hadoop、大数据处理与分析技术、数据可视化
- 课外资源:
(1)推荐书目:《大数据技术原理与应用(第2版)》(林子雨著)
《大数据基础编程、实验和案例教程》(林子雨著)
(2)视频课程:《大数据技术原理与应用》MOOC视频(林子雨主讲)
(3)分析工具:在单机分析工具(例如SPSS等)和单机编程语言(例如Python、R)基础上,掌握大数据处理与分析技术(例如MapReduce、Spark、Hive等)。
(4)数据可视化工具:入门级工具Excel、信息图表工具(Echarts、D3、 Tableau
等)、地图工具( Leaflet等)、 时间线工具( Xtimeline)、高级分析工具(R、Python)
- 学习路径
步骤1:参照推荐书目《大数据技术原理与应用(第2版)》,观看《大数据技术原理与应用》MOOC视频
步骤2:在学习过程中,可以参照与教材配套的实验指导书《大数据基础编程、实验和案例教程》,在自己电脑上搭建大数据实验环境,并完成相关上机实践操作。对所学知识进行体统“串联”,融会贯通。
第四阶段:综合实战阶段——海阔凭鱼跃,天空任鸟飞
- 适用对象:大数据专业高年级学生,大数据分析学习者
- 开设课程:
《商务数据分析》、《互联网营销分析》等
- 课外资源:
(1)纸质教材:《新媒体数据分析:概念、工具、方法》(秋叶著)、《大数据实训案例——电影推荐系统》(林子雨著)、 《大数据实训案例——互联网广告预测分析》(林子雨著)
(2)网站资源:https://wk.askci.com/前沿报告库、阿里研究院-阿里行业研究报告、 腾讯大数据-腾讯云数据分析行业报告、百度数据研究中心-百度数据中心报告
百度开放服务平台-百度云数据分析出来的行业报
(3)相关竞赛:阿里云天池大赛、SODA上海开放数据创新应用大赛 ;数据城堡、数据嗨客、数据火车、大数据研究中心等大数据竞赛平台
罗马不是一天建成的,大数据分析师也不是一天炼成的。初心易有,贵在坚持!最后希望大家通过努力和坚持能成为你想成为的自己!