公开课总结|如何入门数据分析的世界?



  • 公开课梗概:

    在本节太阁Data Analytics公开课中,导师Iris根据自身的经历和经验,分享了Analytics行业的现况、工作内容、职业发展、求职备战,和如何通过自学走上Analytics的职业方向。

    主讲人:Iris
    Manager @ Walmart
    毕业于西北大学Master
    of Science in Analytics. 曾在Walmart担任Customer Insights and Analytics, Manager职位。 工作内容主要是应用客户数据分析来帮助公司更好的做出商业决定。

    (一)Analytics职业

    • 市场需求不断攀升

    根据http://Indeed.com的数据统计,市场对于Big Data Analytics类工作的需求整体呈现大幅上升的趋势。行业就业形势较好。

    0_1476126997274_屏幕快照 2016-10-10 下午12.16.01.png
    Chart from: http://www.edureka.co/blog/10-reasons-why-big-data-analytics-is-the-best-career-move
    Source: http://Indeed.com

    • 较高的薪资和回报

    行业内不同岗位的薪资报酬都比较优厚。

    0_1476127033706_屏幕快照 2016-10-10 下午12.16.57.png

    Chart from: http://www.edureka.co/blog/10-reasons-why-big-data-analytics-is-the-best-career-move

    • 工作特点:跨学科的技能和经验

    锻炼的不是一方面的能力,而是多方面的特长。就DataAnalyst 而言,更应注重Math,Stats, Algorithms 和Data Communication方面能力的发展。不需要有很强的Development能力,而更多的需要理解和应用Algorithm进行分析,进而帮助公司决策。

    0_1476127071428_屏幕快照 2016-10-10 下午12.17.39.png

    Chart from: Data Science Career Paths: Different Roles in the Industry

    • 不同Analytics细分

    Iris通过个人的经历,对Analytics行业内部不同的分类进行了总结,方便大家对行业和工作内容有一个了解。但是需要注意的是,Analytics行业内不仅是这四个方面,而且工作内容有一定的交叉。

    Business Analytics: 最广泛的定义。支持不同的Business Units,可能和finance方面合作。可能常和高层合作,所作出的分析将会被用于帮助决策。

    Customer/User Analytics: 和Business Analytics很像,用到的Data比较特殊,专注于Customer和User,所以有一定的限制。

    Product Analytics: 更专注于product management方面,主要目的就是为了让产品取得更大的成功。合作伙伴主要是与产品相关的部门。

    Operation Analytics: 限制于operation方面。比如现在很多Legal department和HR department方面,应用到很多数据分析。主要目的是让整个operation更有效率。

    0_1476127128702_屏幕快照 2016-10-10 下午12.18.20.png

    Chart from: Iris Wang

    • 工作项目示例

    Iris用下图类比自己之前在沃尔玛工作的项目内容。
    本图用于Customer Segmentation,帮助marketing部门更好的找到自己的目标客户群体,做出更好的决策。

    0_1476127184016_屏幕快照 2016-10-10 下午12.19.26.png
    Picture from: https://select-statistics.co.uk/wp-content/uploads/2015/11/market_segmentation_clustering_example.png

    • 如何选择Analytics团队

    首先考虑自己是否有非常想去的行业。如果有非常想去的行业,可以选择直接进入corporate;如果没有确定的目标行业,可以考虑进入Consulting Company。

    另外从TeamStructure来看,如果公司有一个专门的Analytics Team,可以有更多和相关背景的人交流学习的机会;如果没有专门的Analytics Team,而是直接进入部门,可能会成为部门里最Technical的人,相关的交流学习机会会较少。

    0_1476127276259_屏幕快照 2016-10-10 下午12.20.57.png

    • 职业发展

    Analytics Professional是一个很好的开始,有非常多样化的职业发展。后期可以根据自身的职业兴趣进行转型。

    最为传统的发展途径是,可以一直在公司里做相关工作,并最终成为公司Chief Analytics Officer。

    0_1476127298424_屏幕快照 2016-10-10 下午12.21.27.png

    同时,根据自己不同的skillset,Analytics Professional也有转向其他行业的职业机会。
    最常见的有以下几种:

    如果想最终成为Data Scientist,需要培养更加高端的Technical Skill,对算法也需要有深刻的理解,甚至能够自己编写算法,software development方面的能力也需要得到提升。

    如果想要运营方面的工作,(比如Business Manager, Supply Chain)因为在作为Analyst的过程中,对公司的运营已经有了很多了解,很多人会通过读一个MBA来实现这个职业转型。

    0_1476127317135_屏幕快照 2016-10-10 下午12.21.48.png

    如果想最终成为Product Manager,在工作中应该侧重积累product和engineering的基础和经验,以帮助自己实现职业转型。

    (二)Analytics工作内容

    • 工作常用工具

    整体来说,行业内常用的工具如下图所示,但具体的要求根据具体的行业而定。

    0_1476127357975_屏幕快照 2016-10-10 下午12.22.18.png

    Chart from: R leads RapidMiner, Python catches up, Big Data tools grow, Spark ignites

    • 项目运营步骤

    • 典型的项目进展步骤

    Problem Definition: 了解项目,定义问题。需要对公司和行业有深刻的理解。
    Data Processing: 根据定义选择所需要的数据。Time frame, 变量,目的,提取数据,数据处理。漫长,占整个项目进展70%- 80% 的时间。
    Exploratory Data Analysis: 对数据进行初步分析。与上一个步骤互相影响。常用到SQL和统计知识。
    Models & Algorithms: 建模
    Presentation and Production: 转化成商业语言分享数据。

    0_1476127391776_屏幕快照 2016-10-10 下午12.22.43.png

    • 常用模型

    模型在不断的发展和更新,但这里简单列举几个常用模型供大家有个初步理解。

    -Supervised learning:有resource variable
    -Regression
    -Decision tree
    -Black box
    -Unsupervised learning:没有resource variable,主要找pattern
    -Clustering
    -Principal component analysis

    0_1476127431449_屏幕快照 2016-10-10 下午12.23.20.png

    (三)Analytics求职

    • 面试分类及示例

    0_1476127457338_屏幕快照 2016-10-10 下午12.24.00.png

    Technical Questionnaire:
    通常是固定时间内,对某些话题进行测试。考察思维模式。

    0_1476127475572_屏幕快照 2016-10-10 下午12.24.22.png

    Data Exercise: 小型Analytics project

    0_1476127492583_屏幕快照 2016-10-10 下午12.24.44.png

    SQL Coding Test:考察candidate 的SQL技能

    0_1476127611206_屏幕快照 2016-10-10 下午12.26.45.png
    Behavior Questions:通过访问candidate的经验,来考察leadership, team work等soft skills。有时也会侧重Analytics。在组织回答时,建议使用STAR结构来组织自己的语言,能够让描述更有效更有逻辑性。

    0_1476127639218_屏幕快照 2016-10-10 下午12.27.10.png

    • 如何备战面试

    在备战面试方面,Iris建议大家要非常熟悉SQL,有较好的统计背景知识,总结一下自己用过的模型,并应用STAR结构来组织自己的每段经历。

    0_1476127674078_屏幕快照 2016-10-10 下午12.27.46.png

    • 我作为面试官如何选择candidate

    首先会非常注重SQL能力,同时也要有很好的统计基础。Modeling experience根据岗位要求会有所不同。Communication能力也非常重要,所以这里强调使用STAR结构。最后最重要的是,这个candidate要诚实,因为我作为面试官,遇到很感兴趣的经历会问很多深入问题,会看到底是不是自己的经历。

    0_1476127692994_屏幕快照 2016-10-10 下午12.28.04.png

    (四)如何自学Analytics

    关于Analytics的入门、更好的学习和准备面试,我认为Learn,
    Summarize和Practice。最好通过project的形式,把三者结合起来。

    0_1476127716997_屏幕快照 2016-10-10 下午12.28.28.png



  • 再学习一遍,很清楚的讲解的Analytics的日常和内核 :)


登录后回复
 

与 BitTiger Community 的连接断开,我们正在尝试重连,请耐心等待