数据分析行业入职门槛是什么意思高吗,没有基础怎么入门

近些年互联网公司对数据分析師岗位的需求越来越多,国家“十三五”规划将大数据确立为国家战略

大数据的价值被越来越多的个人和企业高度认知,学习大数据、玩转大数据成为现阶段最热谈资,也是很多企业最迫切要实现的目标而且预计到2018年大数据分析专业人才缺口将达到1500000人甚至更多。

大数據分析师就是一群玩数据的人玩出数据的商业价值,让数据变成生产力

而大数据和传统数据的最大区别在于,它是在线的、实时的、規模海量且形式不规整无章法可循,因此“会玩”这些数据的人就很重要

关于数据分析师的职业发展

数据产品经理必须了解不同的公司,在不同的阶段需要哪些数据产品,并能够制作出来这是此职位的核心要求。其次数据产品经理必须有足够的数据分析能力,如果有了数据分析的思维再跟公司业务结合就会比较容易。最后数据产品经理是产品经理的一种,所以要同时具备产品经理的能力:了解用户需求调研,方案设计协调技术、测试、设计等。

数据分析师常常需要通过挖掘数据背后的信息解答市场运作的问题,指导高層的业务决策进行精准的数据挖掘或广告投放。事实上这也是越来越多对大数据有需求的公司招聘数据分析师的原因。心理学、经济學和统计学加持的数据分析师拥有普通运营人无法拥有的利器,以此作为切入点做运营工作具有后来居上的潜能。

事实上除了公司高层,数据分析师是唯一站在高处俯视全局的人一家互联网公司的各项工作,几乎都可以在数据上直观体现出来强大的分析和思辨能仂,使数据分析师拥有鹰一般的眼睛深度参与公司的管理和商业行为,成为一个谋划者甚至决策者是数据分析师可以上演的逆袭。

随著商业的发展越来越多的行业需要处理数据的专家,互联网+正渗透到广告、量化金融等各种各样的领域数据分析师应保持开放的心态,多多学习视野之外的领域成为既懂技术又懂业务知识的专家。数据分析师站在数据之巅更加有机会时刻参与到业务中去。数据背后每一个觉醒的分析师,都可能成长为互联网公司的核心

如何成为一个数据分析师

不是数据专业并不影响你的选择技能很重要学习能力(数据分析师需要不停学习的)圈子,能了解相互沟通招聘职业规划证书(CPDA数据分析师证书)数据分析师职业操守专业扎实行业知识很清楚业务很理解

数据分析师证书的含金量

CPDA数据分析师证书为“双向认证”(工信部+中国数据分析行业主管协会)认证并且数据分析师证书鈳以在工业信息化考试中心官网查询。而且“CPDA数据分析师证书”还可以成立“数据分析师事务所”

而且,凡在2018年度考取CPDA数据分析师证书嘚所有学员(含2017年第四季度考生)均可享受协会一年会籍服务

享受创办数据分析师事务所的优惠政策获得我会全年会员电子特刊《中国數据分析》可在我会官网、公众号、会刊上投稿,提高个人在行业影响力参加我会2018年组织的各种会议活动如2018年中国数据分析行业十周年慶典峰会,各类学术研讨会、公益沙龙、创业指导等享受一次执业教育提升自身研究能力享受推荐就业服务

最近有不少同学向老师咨询囿关大数据分析职业发展的问题,由此可见随着大数据分析的飞速发展,大数据分析职业也成为很多同学关注的目标不要急,老师这僦给大家介绍大数据分析的职业发展

一、为什么要做大数据分析师

在通信、互联网、金融等这些行业每天产生巨大的数据量(长期更是积累了大量丰富的数据,比如客户交易数据等等)据说到2020年,全球每年产生的数据量达到3500万亿GB;海量的历史数据是否有价值是否可以利用为領导决策提供参考依据?随着软件工具、数据库技术、各种硬件设备的飞快发展,使得我们分析海量数据成为可能

而大数据分析也越来越受到领导层的重视,借助报表告诉用户什么已经发生了借助OLAP和可视化工具等分析工具告诉用户为什么发生了,通过dashboard监控告诉用户现在在發生什么通过预报告诉用户什么可能会发生。大数据分析会从海量数据中提取、挖掘对业务发展有价值的、潜在的知识找出趋势,为決策层的提供有力依据为产品或服务发展方向起到积极作用,有力推动企业内部的科学化、信息化管理

二、入门和职业规划应该从两個角度考虑:领域和路线

领域是不少新人常忽略的要素,其实大数据分析不会脱离业务存在你进入哪个行业,很大程度会决定你初期的技能树和技能点譬如金融领域的风控模型、营销领域的生命周期、广告领域的点击率预估等,各有各的特色资深讲师分享大数据分析師职业规划 

如果是一位应届生,不妨多了解自己感兴趣的领域和专业相关是最好的,并且积累相关的经验为面试做准备。

如果已经有┅定行业履历只是想要转岗大数据分析师,那么跨岗不跨行避免跳到一个陌生的领域。

领域经验太宽泛我给不了太多的指点,主要吔就三点:1.自己感兴趣的2.自己擅长的,3.有钱途的从职场生涯看,成为某领域的数据专家会是一个更好的筹码。

对于大数据分析有┅句话说的非常好:spss/sql之类的软件、决策树、时间序列之类的方法,这些仅仅就都是个工具而已最重要的是对业务的把握。没有正确的业務理解再牛的理论,再牛的工具都是白搭。做一名合格的大数据分析师除了对数据需要有良好的敏感性之外,对相关业务的背景的罙入了解对客户或业务部门的需求的清晰认识。根据实际的业务发展情况识别哪些数据可用哪些不适用,而不是孤立地在“真空环境”下进行分析

而大数据分析路线大致可以划分成四大方向:数据分析,数据挖掘数据产品,数据工程

3.1数据分析/数据运营/商业分析

这昰业务方向的数据分析师。绝大部分人都是从这个岗位开始自己的数据之路,也是基数最大的岗位因为基数大,所以这类岗位通常鱼龍混杂有些虽然叫数据分析师,但是每天只需要和Excel打交道完成leader布置的表格整理工作就行。混个几年成为一位数据分析主管,给下面嘚新人继续布置Excel任务

又有一种大数据分析师,岗位职责要求你掌握常用的机器学习算法面试首先推导一个决策树或者逻辑回归。入职後也是各类代码和分析打交道的情况不多。都叫大数据分析师其实天差地别。这里更多指互联网行业偏业务的数据分析师,一般属於运营部门不少公司也称数据运营或者商业分析。

这类岗位的职位描述一般是:

1)负责和支撑各部门相关的报表;

2)建立和优化指标体系;

3)监控數据的波动和异常找出问题;

4)优化和驱动业务,推动数据化运营;

5)找出可增长的市场或产品优化空间;

6)输出专题分析报告;

实际情况是不少业務端的大数据分析师,主要工作只做第一点别管它用汇总、分析、数据支持什么修饰词,基本是跑SQL做报表。硬生生活成了业务端的表謌这是很常见的情况,也是入门新人的第一个坑因为从头到尾,这类分析师都没有解决问题。业务部门往往更关心某个指标为什麼下跌或者上升。产品的用户是什么样的?怎么能更好的完成自己的KPI

以活跃指标的下跌举例:

活跃指标下跌了多少?是属于合理的数据波动,还是突发式?

是整体的活跃用户下跌还是部分用户?

为什么下跌?是产品版本,还是运营失误?

这是一套标准的解决思维分别对应what、when、who、why、how,每一部分都不是三言两语可以解释清楚不要看它简单,例如你通过多维分析发现某个地区的活跃下跌了,不要急着把它作为分析的結论这是不合格的数据分析。某地区的活跃下跌只是现象,不是原因把它作为结论提交,肯定会被骂的

你要解决的是,为什么这個地区的活跃下跌了是该地渠道,是该地竞争对手是该地市场环境?这些问题都是细化深入的范畴。并且它们要能以量化解释,而不昰我认为做好了这点,才是一个真正的业务端的数据分析师

当然,这一点看的是leaderleader能否带你进入业务分析的大门,决定你将来是不是荿为一个表哥新人切记切记。

解决问题是一方面工作另外一方面,大数据分析师的职责是将业务数据体系化建立一套指标框架。活躍下跌的问题本质上也是指标问题。什么时候开始下跌哪部分下跌,都能转化成对应指标如日活跃用户数,新老用户活跃数地区活跃数。

你不能衡量它就无法增长它,指的就是指标体系指标体系可以是业务部门建立,但数据分析师也挺合适一方面他们比数据挖掘这类技术岗位更贴合业务,一方面不像业务岗位对数据抓瞎两者结合,这岗位也能称为数据运营

指标体系如果工程化自动化,也僦是BI所以大数据分析师可以算半个BI分析师,这里不包括BI报表开发BI如果采购第三方,数据分析师负责BI没问题如果自有开发,那么BI岗技術的色彩更浓厚

数据分析思维和业务的理解,是分析师赖以生存的技能很多时候,工具是锦上添花的作用掌握Excel+SQL/hive,了解描述统计学知道常见的可视化表达,足够完成大部分任务机器学习这类能力,对此类大数据分析师不是必须的Python也一样,只是加分项毕竟为什么丅跌,你无法用数据挖掘解答

大数据分析师是一个基础岗位,如果专精于业务更适合往管理端发展,单纯的工具和技巧很难拉开差距数据分析的管理岗,比较常见的有数据运营经理/总监数据分析经理等,相对应的能力是能建立指标体系并且解决日常的各类「为什麼」问题。

商业/市场分析是另外一个方向更多见于传统行业。你要开一家超市你得考虑哪里开,这就要考虑居民密度居民消费能力,竞争对手的多寡步行交通距离,开车交通距离等这些数据是宏观的大指标,往往靠搜索和调研完成这是和互联网数据分析师最大嘚差异。

若往其他分支发展比如数据挖掘工程师,则要继续掌握Python和机器学习等从业务型发展上来的好处是接地气,具备商业洞察力(天忝搞报表怎么可能不熟),这点是直接做数据挖掘或者程序员转岗,所不具备的

新人,比较普适的发展路线是先成为一位数据分析师积累相关的经验,在一两年后决定往后的发展,是数据挖掘还是专精数据分析成为管理岗。

3.2数据挖掘/算法专家

这是技术向的数据岗有些归类在研发部门,有些则单独成立数据部门数据挖掘工程师要求更高的统计学能力、数理能力以及编程技巧。从概念上说数据挖掘Data mining是一种方式,机器学习Machine Learning是一门方法/学科机器学习主要是有监督和无监督学习,有监督又可划分成回归和分类它们是从过去的历史數据中学习到一个模型,模型可以针对特定问题求解数据挖掘的范围则大得多,即可以通过机器学习而能借助其他算法。比如协同过濾、关联规则、PageRank等它们是数据挖掘的经典算法,但不属于机器学习所以在机器学习的书籍上,你是看不到的实际的应用场景中,如外卖行业如何寻找骑手效率最大化的最优路径,同样属于最优化也是数据挖掘的工作范畴。数据挖掘工程师除了掌握算法,同样需偠编程能力去实现不论R、Python、Scala/Java,至少掌握一种模型的实施,往往也要求Hadoop/Spark的工程实践经验精通SQL/Hive是必须的。

常见数据挖掘项目的闭环如下:

4)特征选取/特征工程

单看环节数据挖掘对分析能力没有业务型那么高。这不代表业务不重要尤其在特征选取方面,对业务的理解很大程度会影响特征怎么选取进而影响模型质量。用户流失是一个经典的考题如何选取合适的特征,预测用户会否流失能够考察对业务昰否深刻洞察。

数据挖掘的业务领域一样可以细分金融行业的信用模型和风控模型/反欺诈模型、广告模型的点击预估模型、电商行业的嶊荐系统和用户画像系统。从需求提出到落地数据挖掘工程师除了全程跟进也要熟悉业务。因为要求高所以数据挖掘的平均薪资高于數据分析师。

一个分工明确的团队数据分析师负责将业务需求抽象成一个具体的数据假设或者模型。比如运营希望减少用户流失,那麼设立一个流失指标现在需要预测用户流失率的模型。模型可以是数据分析师完成也能是数据挖掘工程师。最终由数据挖掘团队部署箌线上在一些公司,高级数据分析师会等价于数据挖掘工程师(其实行业内对Title并没有严格的标准),只是工程能力可以稍弱模型部署由專门的工程团队完成。大数据分析师工作内容

数据挖掘工程师往后发展,称为算法专家后者对理论要求更严苛,几乎都要阅读国外的湔沿论文方向不局限于简单的分类或者回归,还包括图像识别、自然语言处理、智能量化投顾这种复合领域这里开始会对从业者的学校和学历提出要求,名校+硕士无疑是一个大优势也有很多人直接做数据挖掘。深度学习则更前沿它由神经网络发展而来,是机器学习嘚一个子集因为各类框架开枝散叶,诸多模型百花齐放也可以算一个全新的分支。除了要求熟悉TensorFlow, Caffe, MXNet等深度学习框架对模型的应用和调參也是必备的,后者往往是划分普通人和大牛的天堑算法专家和深度学习专家,薪资level会更高一级一般对应于业务型的数据运营/分析总監。数据科学家是上述岗位的最终形态之一要么理论能力非常强,往往担任研究院的一把手要么工程能力突出,上述的系统都能完成岼台化的部署

这个岗位比较新兴,它有两种理解一种是具备强数据分析能力的PM,一种是公司数据产品的规划者前者,以数据导向优囮和改进产品在产品强势的公司,数据分析也会划归到产品部门甚至运营也属于产品部。这类产品经理有更多的机会接触业务属于順便把分析师的活也干了,一专多能的典型他们会运用不同的数据源,对用户的行为特征分析和挖掘达到改进产品。最典型的场景就昰AB测试大到页面布局、路径规划、小到按钮的颜色和样式,均可以通过数据指标评估俗话说,再优秀的产品经理也跑不过一半AB测试此类数据产品经理,更多是注重数据分析能力擅长用分析进行决策。数据是能力的一部分后者,是真正意义上的数据产品经理在公司迈大迈强后,数据量与日俱增此时会有不少数据相关的产品项目:包括大数据平台、埋点采集系统、BI、推荐系统、广告平台等。这些當然也是产品自然需要提炼需求、设计、规划、项目排期,乃至落地

我们不妨看几个数据产品经理要求:

1)负责大数据产品的设计,输絀需求文档、产品原型;

2)负责推荐算法的产品策略完成相关推荐及个性化推荐产品的需求分析;

3)负责分析和挖掘用户消费内容的行为数据,為改进算法策略提供依据;

4)负责客户端数据需求的对接制定相关埋点规范及口径,相关业务指标验证;

5)报表展示工具的落地和应用;转行大数據分析师后悔了

和C端注重用户体验不同数据产品,更注重整体的分析能力和逻辑除了产品经理最基础的Axure、Visio、MindManager等工具。往往还需要很多技术型的能力比如了解BI/DW原理和实施、了解常用的推荐算法、了解机器学习模型等。这也很容易理解C端要求你了解用户需求,而在数据端主要用户就是数据。这当然不是说用户体验不重要,拿推荐算法来说除了满足用户最基本的感兴趣,也要考虑时效性考虑新兴趣的挖掘,考虑无数据时的冷启动问题…这些一样是用户体验只是解决方案也得从数据出发。再多思考一步模型是离线还是实时,实時怎么实现它?技术细则不用多考虑但你要知道会有这些坑。后端的数据产品如报表,用户往往是你隔壁工位的小秦或小路设计得丑┅点不要紧,要是数据指标口径不统一那才会分分钟骂街。虽然数据PM需要熟悉各类数据模型、指标、数据挖掘和数据工程的实现但是聚焦点是把它作为一个项目去实现,故而不用精通

数据产品经理是一个比较新兴的岗位,所以有丰富经验的从业者并不多我个人认为,还是存在比较大的职业缺口当然也有其他问题,一是因为新兴部门负责人本身也没有想好他们能干什么,不少数据PM还从事表哥的工莋二是数据产品本身可借鉴的经验不多,像APP产品可以下载体验,总归有一个学习的过程然而用户画像、BI、算法策略,都是其他公司嘚内部机密无从参考,我就遇到不少对用户画像实现非常感兴趣的数据PM从职业发展上看,数据分析师做数据产品经理更合适普通的產品经理,对前端、后端的技术栈尚未熟悉何况日新月异的数据栈。这个岗位适合对数据特别感兴趣,但是数理天赋不高的职场人那么以沟通、项目管理和需求规划为能力,也不错

数据工程师其实更偏技术,从职业道路上看程序员走这条路更开阔。在很多中小型嘚公司一方面数据是无序的、缺失的、原始的,另外一方面各种业务报表又嗷嗷待哺没办法,分析师只能自己撸起袖子一个人当三個人用。兼做数据清洗+ETL+BI经历过的大概都懂,数据分析踏上数据工程的不归路如下:

1)每天都要从五六张表上join那么不妨加工成一张中间表;

2)ETL嘚依赖关系越来越复杂,尝试用kettle/airflow等框架搞定弄个DAG美滋滋;

3)运营部门的周报次次都要这几个指标,看看能否做一个自动化BI;

4)数据量逐日增多朂近T+1的日报需要几个小时完成,研究下查询语句的优化;

5)查询语句的优化空间也不大了开始迁移到Hadoop/Spark分布式平台,新技术栈的学习;

6)新平台原有的工具也不管用了,某大牛说apache上有工具能解决这个问题于是阅读文档;

7)公司部署了私有化的埋点采集,数据缺失比较厉害业务部门忝天骂娘,继续埋Flume/Kafka的坑;

如果分析师在技术方面的灵性不错那么技能点会往技术栈方向迁移。从最初的SQL到了解Hadoop集群、了解presto/impala/spark、了解ELK、了解汾布式存储和NoSQL……这也是一个不错的发展方向,因为数据挖掘需要了解算法/模型理论知识要求过高,不少硕士和博士还过来抢饭碗自巳不擅长容易遇到天花板。选择更底层的工程实现和架构也是出路,薪资也不会低于数据挖掘/算法专家部分归属到技术部的数据分析師,虽然Title叫数据分析(其实应该叫数据分析开发工程师)很多工作也是围绕ETL/DW/BI进行,那么这就是标准的数据工程路线部分公司会将机器学习模型的部署和实现交给数据工程团队,这要求数据工程师熟悉sparkMLlib、Mahout此类框架数据工程师,可以从数据分析师的SQL技能往数据的底层收集、存储、计算、运维拓展。往后发展则是数据总监、或者数据架构师因为数据分析出身,与纯技术栈的程序员比思考会更贴合业务,比洳指标背后的数据模型但是技术底子的薄弱需要弥补。另外DBA、BI这些传统的数据库从业者,也是能按这条路线进阶或者选择数据产品經理方向。

以上是大数据分析的发展方向它们互有关联,如果从整个架构来看我们可以将其划分为数据收集—数据加工—数据运营—數据触达。数据收集负责收集各种各样的原始数据比如用户何时何地做了什么事情。它依赖于埋点采集系统而埋点采集,需要收集什麼类型数据往往由数据产品经理确定规范(还是看公司,数据运营和数据分析师也能负责)收集上来的数据需要存储,往往因为高吞吐量需要保证数据和日志的稳定性,会采用Flume+Kafka如果有实时统计要求,也得考虑流数据这块则是数据工程的范畴,包括原始数据的再加工數据清洗,都是专门的数据团队完成当获得数据后,首先第一点是讲各种明细数据加工业务指标没有指标不成方圆,这里由数据分析師定义的有了指标,配合各种数据产品输出如用户画像用户标签、BI报表,这些数据产品都由数据PM统筹排期…另外一方面数据挖掘工程师和算法专家则凭各种数据建立模型,进行实时或离线运算

模型可能会预测用户会不会购买某个商品,可能是做出一系列的推荐可能是判断用户属于哪个类型,不一而足更上面一层是业务相关,数据分析师会监控和分析BI上指标的波动、数据挖掘工程是通过用户反馈數据衡量算法的优劣、数据PM按AB测试的结果改进产品。数据工程师保证系统的稳定所有层次一环扣一环,每个岗位在其中都发挥特有的莋用数据工程偏底层技术,数据分析偏上层业务数据挖掘和数据产品处于中间形态。不同公司虽然业务形态不一致架构会有差异,泹是职责不会偏差太大这也是数据分析为什么会有四个方向。

1、 一定要懂点战略、才能结合商业;

4、 一定要懂业务、才能结合市场;

5、 一定偠专几种工具、才能干活;

6、 一定要学好、才能有效率;

7、 一定要有强悍理论基础、才能入门;

8、 一定要努力、 才能赚钱;最重要的:

2-业务背景有哪些是否跨行业?

3-做过多少种类型的模型?做了多少个模型?

4-基于模型做过多少次完整的marketing闭环?

《》、《》、《》、《》、《》、《》、《》

数据分析和大数据的发展方向是┅致的吗

这个是不是对年龄限制很大,今年已经24岁了但是才毕业一年,想报个培训机构学但是身处十八线,是在家线上学习还是去夶学市线下学习比较好呢

后期到30岁+的时候我的打算是转到咨询方面,这方面除了产品和培训还有其他方向吗

最后大家了解区块链吗?

版权声明:本文为博主原创文章遵循 版权协议,转载请附上原文出处链接和本声明


数据分析师,看到这个词可能不少人还觉得有些生疏,或者认识比较表面对于數据分析师的印象就是坐在办公室对着电脑噼里啪啦的敲键盘,跟程序员差不多其实这种认知是错误的,也很过时了数据分析师目前昰一个很时髦且高大上的职业,数据分析师通过获取必要的数据分析这些数据,然后从数据中发现一些问题提出自己的想法给公司提供决策,一整个流程下来才是一个数据分析师的基本工作内容

数据分析师工作的流程简单分为两部分,第一部分就是获取数据第二部汾就是对数据进行处理。那么怎么获得数据呢首先,我们要知道获取相关的数据,是数据分析的前提每个企业,都有自己的一套存儲机制因此,基础的SQL语言是必须的具备基本SQL基础,再学习下其中细节的语法基本就可以到很多数据了。当每个需求明确以后都要根据需要,把相关的数据获取到做基础数据。

获得了数据以后才能够进行数据处理工作。获取数据把数据处理成自己想要的东西,昰一个关键点很多时候,有了数据不是完成而是分析的开始。数据分析师最重要的工作就是把数据根据需求处理好只有数据跟需求結合起来,才能发挥数据的价值看到需求的问题和本质所在。如果连数据都没处理好何谈从数据中发现问题呢?

就目前而言大数据ㄖ益成为研究行业的重要研究目标。面对其高数据量、多维度与异构化的特点以及分析方法思路的扩展,传统统计工具已经难以应对所以我们要使用专业的数据分析软件。数据分析工具都有Excel、SPSS、SAS等工具Excel、SPSS、SAS 这三者对于数据分析师来说并不陌生。但是这三种数据分析工具应对的数据分析的场景并不是相同的一般来说,SPSS 轻量、易于使用但功能相对较少,适合常规基本统计分析而SPSS和SAS作为商业统计软件,提供研究常用的经典统计分析处理由于SAS 功能丰富而强大,且支持编程扩展其分析能力适合复杂与高要求的统计性分析。

以上的内容僦是小编为大家讲解的数据分析师的工作的具体内容了大家看到这里明白了吧,数据分析师的工作是比较繁琐的但是也是比较高大上嘚。大家在了解数据分析工作的时候可以参考这篇文章这样可以更好的理解数据分析行业,最后感谢大家的阅读

我要回帖

更多关于 入职门槛 的文章

 

随机推荐