新闻中心 / News

联系我们

010-87162167

010-87162166

www.zjstyhzzx.com

北京经济技术开发区景园北街3号63-3栋

数据分析4要素轻松掌握小“套路”!

发表时间:2019-06-27 12:17

  做一名优秀数据分析师,首先要对数据分析岗位有基本的概念,其次,要明白数据分析中有哪些套路和方法,如此,才能举一反三,在不同场景数据分析中切换自如。下面我们高屋建瓴,抽茧剥丝般讲讲数据分析的四大要素。

  任何数据分析过程都包括四大要素:场景+数据+工具+方法,数据分析起点必须来源于某个场景下的需求,根据需求目标(场景),搭建分析框架(方法),提取需要的数据指标(数据),用适合的工具实现,最后提炼结论,给出建议或策略。

  首先,移动互联网化+传统企业转型触网使数据获取难度大大降低,其次,云存储和云计算使存储和计算成本降低,最后,人工智能和商业智能使数据价值凸显,越来越多企业愿意花大钱于数据基础建设,那么数据分析场景也越来越丰富,从行业来看,主要有互联网、移动互联网、金融、汽车、房地产和供应链等。

  每个行业具体业务场景也会不同,比如同样是互联网,可以分为游戏、社交、电商、安全、新零售、娱乐、外卖、航旅、共享经济、搜索、人工智能..... 应用场景和边界不断扩展,不同场景分析套路和重点也不完全相同,但有一点,场景越丰富,数据分析岗越有必要和价值,思路和想象也可无限扩展。

  数据指对客观事件进行记录并可以鉴别的符号,是对客观事物的性质、状态以及相互关系等进行记载的物理符号或这些物理符号的组合。它是可识别的、抽象的符号。它不仅指狭义上的数字,还可以是具有一定意义的文字、字母、数字符号的组合、图形、图像、视频、音频等,也是客观事物的属性、数量、位置及其相互关系的抽象表示。

  变异性和规律性,变异性是指不同事件量化的数据不同,具有差异性,正是因为数据变异性,数据分析才有必要;规律性是指包罗万象的数据中,数据是有规律可寻的,从而得出有价值的结论,正是因为规律性数据分析才有价值。

  数据可分为结构性和非结构性数据。结构化数据是指可以用数字量化的,相对规整的数据,比如生产、业务、交易和客户信息等的结构化数据,数据分析和方法很长时期都集中在这类数据上,这块的方法和工具也相对成熟;但相比结构化数据,非结构化数据存储量更大,也蕴含着非常丰富的价值,比如合约、发票、书信与采购记录等营运内容;如文书处理、电子表格、简报档案与电子邮件等部门内容;如HTML与XML等格式信息的Web内容;以及如声音、影片、图形等媒体内容。非结构数据处理算法和方法在近几年有很大的进步,比如在图像、语音、翻译等有广泛应用。

  数据规模和存储方式在1991年之前,增长是缓慢的,之后在互联网的推动下,数据量开始爆发,2005年hadoop诞生,标志着人类对海量数据处理有了解决方案,近几年在很多学者和企业的推波助澜下,数据价值越来越受到企业重视。

  工欲善其事必先利其器,工具在数据分析过程中也是非常重要的一环,下面列举些常用的工具类型:

  数据分析中最常用的数据汇总和展示工具是excel和ppt,excel是最常用的数据分析工具,哪怕是在大的数据公司,比如阿里巴巴、美团、腾讯、百度,通常会先在云上把需要的指标进行初步汇总,取出放到excel中分析,excel功能很强大,除了透视汇总,图表、分类外,还有简单模型、规划求解等功能。

  因此,excel是最基础也最常用的分析工具,数据分析师必须要好好掌握;数据分析完成后,通常要把成果展示给听众,ppt是非常好的选择,数据分析报告ppt不像营销同学做的花哨,形式为辅,核心是结论、信息传达,数据作为论据,如果能将数据分析报告类ppt做的很美观,也很厉害,可以参考咨询公司的报告,比如麦肯锡、埃森哲等,网上可以找到很多。

  数据提取如果数据量比较小,很多公司会有直接下载的功能,但如果数据量比较大,就需要自己加工了,常用的数据查询工具有SQL、hive,很多大的互联网公司都是用hive,hive和sql语法有点类似,也是很多数据仓库同学必须掌握的语言,作为一名大公司的数据分析同学,hive是必须要掌握的,hive最早是谷歌搞出来的,不少公司在此基础上封装成自己的语言,加些自己的函数等,但总体语法和架构是一样的。

  ppt中有些可视化的功能,但在可视分析上还不是特别专业,市场上认可度比较高的可视化分析工具有tableau、spotfire等,前者市场推广做的更好,知名度更高,后者功能更强大,可视化组件更丰富。当然,大的互联网公司也会有自己的数据产品,相对外部工具,数据接入更容易。

  如果你想用一些算法、模型解决日常的工作,可以学习R软件、Python,还有传统的一些spss、matlab、spss modler等,除了这些工具外,大公司也会有自己的模型或算法平台,可以通过java、python等语言直接调取已有算法包,也可以用这些语言重新封装新的算法再使用。

  市面上工具很多,但要做一名合格的数据分析师,掌握工具就可以解决80%的商业分析问题,另外,20%需要高阶的工具。

  数据分析方法包括两个层面,一个是数据分析思维层面,另一个是套路层面,常用的数据分析思维有:

  1. MEMC(Mutually Exclusive Collectively Exhaustive)——“相互独立、完全穷尽”,这个是金字塔原理中非常经典的复杂问题拆解方法,尤其是针对比较大的研究课题,可能开始无从下手,这个时候通过这种方法,可以把整体分解成很多局部模块,再针对每个模块进行可能性假设和论证,最终得出满意的答案。

  2. 归纳:指从许多个别的事物中概括出一般性概念、原则或结论的思维方法,每次数据分析探索可能很多维度、视角都会尝试,最终要写成分析报告的时候需要提炼核心观点,这就是一个信息归纳的过程。

  3. 演绎:演绎推理是由普通性的前提推出特殊性结论的推理,我们在数据分析中经常会沿用原有的经验,很多都是采用演绎的方式进行,比如28法则是人类收入分配中有这种倾向,电商卖家收入也会有这种倾向。

  4. 对比思维:数据分析中很多时候要回答某个结果是好还是坏,需要有具体的参考系,常用的参考系有四类,去年同期对比如何,上期环比如何,和目标比如何,和竞争对手比如何,只有通过对比才有实际的意义,否则只是陈列数据。

  5. 抽茧剥丝:数据分析要像剥洋葱一样,一层层往下分解,直接不能再分解,或者可落地解决为止,如果只停留在表象,会发现不接地气,数据无法线H

  常用的套路层面,需要结合具体的业务场景,比如电商流量、安全、市场营销、会员运营、销售管理等不同场景的数据分析套路是不完全一样的,下面大概讲下,后续会退出更详细的

      和记娱乐,和记娱乐官网
 网站地图