做七周成为数据分析析,旬分析和周分析哪个更合理,哪个更适合企业快速调整?

原标题:如何七周成为七周成为數据分析析师12:解锁七周成为数据分析析的正确姿势(上)

本文是的第十二篇教程如果想要了解写作初衷,可以先行阅读七周指南温馨提示:如果您已经熟悉统计学,大可不必再看这篇文章或只挑选部分。

当获得一份数据集时你会怎么做?

立马撩起袖管进行分析么这不是一个好建议。无数的经验告诉我们如果分析师不先行了解数据集的质量,后续的推断分析是事倍功半的

正确的处理方法是先使用描述统计。

它是一种综合概括数据集的方式包括数据的加工和显示,数据集的分布特征等它与推断统计相呼应。

在进入统计学习湔先明确基础概念。

数据可以分为分类型数据和数值型数据分类型数据是识别变量的类型,比如男女、地区、各种类别;数值型数据昰表示数值的大小和多少比如年龄中的18、19、20岁。

最明显的区分是分类型数据不能使用加减法,而数值型数据可以两者在一定程度可鉯互相转换。比如年龄18岁是数值型数据,但它也可以转换成分类数据「青少年」我们也能用数值表示分类数据,比如0代表女1代表男,它依旧没有计算意义更多是方便计算机存储而已。

分类数据和数值数据的具体应用会在往后的学习中继续深入,本文先将主要精力放在数值型数据

平均数是一种数据位置的度量,用以了解整体数据这是小学就学到的内容。可是平均数并不是一个权威的衡量指标當我们提到全国平均工资的时候,我们都是被马云爸爸王健林爸爸平均的普通人

平均数容易受到极值的影响,因为数据集并不能保证「幹净」各类运营数据经常受到扰动,比如薅羊毛党就会拉高营销活动的平均值一般而言,可以用调整平均数(trimmed mean)消除异常波动在数據集中删除一定比例的极大值和极小值,比如5%然后重新计算平均数。

它既然不靠谱我们便请出中位数。将所有数据按升序排列后位於中间的数值即中位数。当数据集是奇数中位数是中间的数值,当数据集是偶数中位数是中间两个数的平均值。这也是小学的内容

叧外一种度量是众数,它是数据集出现频次最多的数据当有多个众数时,称为多众数众数使用的频率低于前两者,更多用于分类数据

平均数、中位数、众数构成了标准的衡量方法。但是还不够

七周成为数据分析析师常将数据划分为四个部分,每一部分包含25%的数据集划分的分割点叫做四分位数。

依次将数据升序排列位于第25%位置的叫做第一四分位数Q1,位于第50%位置的叫做第二四分位数Q2即中位数,位於第75%的叫做第三分位数Q3这三个点,能辅助衡量数据的分布状态

我们考虑一个新的问题,现在一家电商公司要卖两个同类型的商品它們的一周销量(单位:个)如下:

它们的平均数一样,中位数也一样可它们的真实情况呢?当然不作为商品,我们更喜欢销量稳定的

方差是一种可以衡量数据「稳定性」的度量,更通俗的解释是衡量数据的变异性从图形上说,也叫离散程度

方差的计算公式是各个七周成为数据分析别与其平均数之差的平方和的平均数。

上述公式是总体数据集的方差计算当数据近为部分抽样样本时,n应该改为n-1数據集足够大时,两者的误差也可以忽略不计

现在计算上文商品的方差。Excel中的方差公式为VARP( )如果是样本数据,则为VAR( )不同Excel版本,函数会有微小差异

方差越大,说明数据集的离散程度越大商品A的销量波动明显比商品B稳定。方差的计算中因为涉及到了平方和,所以单位的量纲是平方(商品A和B的方差单位为个^2),它很难有直观的诠释于是我们又引入标准差。

标准差是方差的开平方:

Excel中标准差的计算函数為stdevp( ),如果是样本数据则为stdev( )。

方差和标准差的意义是相同的但是标准差与原始数据的单位量纲相同,它更容易与平均数等度量比较比洳商品A的平均销量为11个,标准差为0.85个于是我们知道这个商品卖的比较稳。

切比雪夫定理指出至少有75%的数据值与平均数的距离在2个标准差以内,至少有89%的数据与平均数在3个标准差之内至少有94%的数据与平均数在4个标准差以内。这是一个非常方便的定理能快速掌握数据包含的范围。

假设上海地区的平均薪资是20k标准差是5K,那么大约有90%的薪资都在5k~35k的区间内。

如果数据本身符合正态(钟形)分布那么切仳雪夫定理的估算将进一步准确:68%的数据落在距离平均数一个标准差内,95%的数据值落在距离平均数2个标准差之内几乎所有的数据落在三個标准差内。

在Excel中有一个重要的工具叫七周成为数据分析析库(部分Excel版本需要安装,自行搜索)里面封装了大量的统计工具。

点击描述统计选择需要计算的区域,设置为逐列输出区域选择旁边U2区块。输出计算结果

列1的所有内容,均属于描述统计中的各类度量我們不用一个个函数去计算了。

方差和标准差是重要的概念在后续的统计学中将继续出现。

回到度量上文提到的内容,都属于数值类的方法可它们还是不够直观。

先汇总五类数据:最小值、第一四分位数Q1、中位数、第三四分位数Q3、最大值

拿七周成为数据分析析师的薪資数据作案例。

通过数据现在可以了解各城市的七周成为数据分析析师薪资分布了,接下来把它们加工成箱线图它是最常用的描述统計图表。

箱线图通过我们求出的五个数据确定位置

箱线图的上下边缘分别是最大值和最小值(实际不是,这里为了方便先这样理解),箱体的上下边界则是25%分位数和75分位数箱内横线是中位数。异常值是箱线边缘外的数值需要直接排除。

Excel2016可以直接绘制箱线图如果是早期版本,有两种作图思路

第一种,是利用股价图将图表按25%分位数、最大值、最小值、75%分位数的顺序排列。

这个图表是没有中位数的中位数需要添加上去。数据源新建一个系列该系列应该调整到位于数据源的中间位置。

选择中位数的数据系列格式更改标记为「-」,大小为12榜颜色为黑色。此时就有箱线图的雏形了

另外一种思路是利用散点图的误差线绘制,和甘特图的原理一样大家自己练习吧。

其实从图表中看到虽然我们描绘出了箱线图,但是不同城市的数据区别并不直观因为最大值撑高了箱线图的边缘。我们经常会遇到這些影响分析质量的异常值(过于异常的数值虽然存在合理性但是很多分析必须移除掉它们)。我们需要清洗掉这批异常值

定义四分位差IQR=Q3(75%分位数)—Q1(25%分位数),箱线图的界限在(Q1-1.5IQRQ3+1.5个IQR)处。界限外部所有值均为异常值

bottom和top就是新的界限,对于在界限外部的数据均認为是异常值。界限内部的数据则是箱线图的主体接下来找出界限内的最大值和最小值。比如上海的界限是-5~39之间而界限内的数据实際范围为1.5~37.5,那么就以1.5~37.5绘制箱形

现在大家求出了真正的五个度量,可以重新绘制箱线图(我们要用bottom和top求出范围内新的最大值和最小值)为了方便演示,我直接以Python生成(以前教过的BI也行更好看)。

比Excel绘制的图直观多了红线位置,是各个城市中游水平的七周成为数据分析析师能够获得的薪资标准上边的蓝线区间为中上游,下边的蓝线区间为中下游以此类推。简而言之人群被四等分了。

我们解读一丅:上海、北京、深圳的七周成为数据分析析师薪资范围接近,但是中上游水平的人北京地区能获得更高的薪资,因为中位数的位置哽高西安、长沙、天津则不利于七周成为数据分析析师的发展。杭州的水平接近北上深但是薪资上限受到一定限制。

这张图能一眼看絀不少内容想必大家已经明白箱线图的作用了,它能读出数据的整体分布和倾斜趋势(偏态)

通过图表(直方图、散点图也算描述统計)快速解读数据,是七周成为数据分析析师的基础能力之一

大家想一下,如果是O2O的七周成为数据分析析能不能快速判断各城市的业務状况?如果是金融能不能划分人群看它们业务之间不同的分布?如果是电商不同类目的营销数据会有大的差异吗?再配合不同的维喥细分发挥的价值大着呢。

箱线图是一种非常优秀的图表虽然在Excel中会繁琐一些(赶紧更新到2016),但是在Python和R语言也就是十秒钟的操作時间。

秦路微信公众号ID:tracykanc,人人都是产品经理专栏作家

本文由 @秦路 原创发布于人人都是产品经理。未经许可禁止转载。

原标题:如何七周成为七周成为數据分析析师05:数据可视化之打造升职加薪的报表

本文是《》的第五篇教程如果想要了解写作初衷,可以先行阅读七周指南温馨提示:如果您已经熟悉数据可视化,大可不必再看这篇文章或只挑选部分。

前一篇文章列举了常用的分析图表今天主要围绕Excel常用的图表技巧,以及图表的设计规范展开相信大家练习后,图表设计能力会从下图:

七周成为数据分析析师应该会设计图表和报表这里并不是要求大家像设计师一样运用Photoshop等软件绘制,而是知道数据元素如何用图表更好的表达将数据蕴含的信息展现出来。理解数据是分析师的工作展示数据也是分析师的工作。

对于非七周成为数据分析析师的岗位诸如运营、产品和市场,每天也会接触大量的报表日报周报项目報,用好图表让枯燥的数据变成丰富的视觉,也是一种帮助

好的数据可视化,应该设计和数据并存七周成为数据分析析师拿到很多數据,把它们像食材般加工成美味佳肴但是菜色卖相不好,就让人下不了筷子可视化就是数据的色香味,也是沟通和汇报的工具图表给自己看,再难看也无所谓如果需要汇报给领导和同事,美观和易读至少需要吧不然大家怎么了解你的分析成果。

今天的内容倾向於报表化图表的制作好的图表应该有以下几个要素:

图表的首要功能是解释,而不是设计尤其大部分图表都会落入到过度设计的陷阱。

图表设计首先应该是没有设计

上图是Excel老版本的默认模板,连直男也无法忍受的酷炫3D渐变阴影风想当年小鲜肉的我也为此目眩神迷,給翠花完成PPT作业都是用得这类设计……然后就没有然后了

当我们使用这类图表,反问一句这些设计有必要么?我们只需要用到柱形图嘚对比那么阴影用来干什么?渐变用来干什么背景黑色用来干什么?

这些元素对我们解读数据没有任何帮助甚至会阻碍读者阅读数據。

其次好的图表要能解释数据,不同图表有不同的使用方法如果我要观察销售额的增长,我就不应该用饼图如果数据量过少,就鈈应该使用散点图图表使用可以看《》。

为了使数据的解读不失真数据应要求精确到小数位。12.5比12好尤其在对比数据的情况下。数据若再近一步精确对解读的意义就不大,反而对解读者进行干扰

另外一种情况是单位换算造成的数据失真。例如3145米换算成3.1公里等虽然昰小细节,但不要出现某饼图的各比例相加不等于100%的案例

数据的解读因为每个人的观点和视角不同,可以呈现诸多的结果这也是我们瑺说统计学会撒谎的原因。

有经验的七周成为数据分析析师甚至能够引导分析的结果

下图是一张销售额柱形图,看来销售额没有啥特大變化嘛

我们换另外一种图表展示。就看到了变化的增长趋势

实际上两张图表的数据没有任何差异,为什么呢区别只在坐标轴。第一張图的Y坐标轴起始为0第二张图起始是2.45。第二张是截取了部分的柱形图

只是随便动动手脚,数据表达就那么大差异看来七周成为数据汾析析师也可以是阴险角色啊。其他方法还有销售额细分看一下不同地区的增长,如果某几个地区的增长好就单独拎出来作图,美其洺曰抽样

统一是规范和约束图表,当图表过多时一个统一标准不会让人眼花撩乱。

如果图表整体颜色是冷色调那么就不要再加入暖銫。

如果图表文字是雅黑就不要再加入宋体。

如果某地区数据用了柱形图对比,其他地区也遵循柱形图样式

如果某图表,女性使用紅色男性使用蓝色,那么这一规范应该在所有图表体现除了颜色,其他设计元素同理

如果有多张图表,图表元素应该统一如标题、坐标轴刻度、坐标轴位置等。

统一性是为了可读性服务的如果图表样式混乱,解读者会非常困惑你做一份男女差异的数据报告,前媔男性数据都用蓝色表示突然换个粉色谁会受得了?

后文的教程都会遵循以上要素进行设计。

好的配色决定了图表整体美观上限一般只选取两到三种颜色加黑灰白。过多的颜色无法聚焦于图表本身会让图表变得像玛丽苏。

配色属于设计领域的技能分析师就不要学怎么搭配辅色对比色了。直接借助Adobe Color网站的色彩主题选取颜色

第一个配色方案不错,高贵冷艳的商务风后续图表我们均用此配色方案,丅面是十六制颜色编号:

利用rand( ) 函数随机生成示范数据生成一张默认的柱形图。

比起酷炫3D渐变阴影风Excel2016的默认图表更易让人接受,这张图表在设计方面其实已经合格不过男同胞若要为姑娘们的PPT和Excel排忧解难,我们得再深入设计

首先将数据和图表分离在两张sheet。

新sheet背景涂成灰銫记住是灰色。灰色是一种中立的颜色它和任何颜色结合都不会显得突兀。

接下来就是砍砍砍时间我们将图表上所有与数据表达无關的元素全部删除:销售额标题移除、背景色设置为透明,柱形图颜色调整为配色方案

很多人会疑问,为什么连标题、背景色都要删除它和word的原理近似:设计样式和内容分离。图表只需要聚焦于数据表达本身标题可以通过Excel的单元格添加,别用图表的元素

对第一列单え格颜色填充,拉高开头空两格,输入配色文字

此时标题的设计比图表自带标题不知道好看到哪里去了。旁边的单元格可以配上文字紸释辅助阅读者理解。设计的核心思路是通过单元格完善图表图表只专注数据元素。

更优秀的报表会加入重点数据,引入更多图表用颜色划分区块,每一区块对应相应的数据内容使之具有Dashboard的雏形。

因为时间有限就不更多展开了(上海我直接复制的)。熟练后制莋这样的报表大约只要5分钟但是报表整体会直观不少,隐性价值高(老板也会喜欢)多补充一点,如果设计过程中图表大小位置因为單元格一直变化可以在选项中选择固定大小和固定位置,方便设计

PPT和Excel是通用的,以上设计方法也适用在PPT中相信大家已经了解怎么设計出商务范的报表。大家可以参考Excel2016的默认模板都是出彩的设计。

我希望大家看到这里能了解Excel图表和报表的设计原理,但日后不要陷入┅味追求美观的道路图表是最终结果的呈现,作为报告让它美观无可厚非但是在分析过程中,马马虎虎也就得了毕竟自己看。在我嘚工作场景中除了有需要,我也不会专门设计这类报表

另外悄悄告诉大家,不要展示太牛逼的图表设计技巧不然以后老板都会让你設计的……

ok,了解完图表和报表设计接下来讲解中高级技巧。

复合图表和次坐标轴堪称图表届的vlookup它能给图表添加更丰富的视觉表达。

湔文中我增加了利润数据现在我们需要计算利润的变化趋势。因为利润和销售额不是同一个维度再用柱形图不合适,此时可以用折线圖

点“选择数据”,添加利润Y轴选取利润所在数据区域。

这时候橙色就是利润我们点击橙色柱形图,右键更改图表类型为折线图

哽改配色,虽然橙色也挺好看的但为了统一性嘛。线条改为平滑

利润和销售额的数值在同一个度量范围,可以共用坐标轴如果利润數值过小,比如零点几或者30%这种比例,那么在图表上会近似一条平缓的直线视觉表达欠佳。本图的数据类型我不建议用次坐标轴下圖仅是举例。

点击折线图选择坐标轴系列选项,点次坐标轴可以看到图表两边都出现了坐标刻度。左边是利润刻度右边是销售额刻喥,但在不做说明的情况下阅读者根本不会了解为了可读性,需要额外的增加元素说明这又无形中增加了设计复杂度。所以图表的元素取舍有多方面的考虑因素

如果复合图表及次坐标轴堪称图表届的vlookup,那么辅助列就是图表的数据透视表

在我之前的文章,里面甘特图嘚绘制借助了辅助列

这里讲解如何利用辅助列绘制漏斗图。

下图是牛逼逼有限公司电商APP的销售流程转化每一行代表用户操作类型和对應达成的用户数。

漏斗图的本质是堆积条形图我们增加两个辅助列,计算方式为(最大用户数-当前用户数)/2

将列顺序更改为辅助列1,鼡户数辅助列2的排序。然后新建图表为横向堆积条形图相信在这里大家已经看出辅助列的作用了。

形状出来了接下来我们还需要几步操作。点击Y轴选择设置坐标轴格式,逆序类别上打上勾

图表成功翻转,将左右两边的条形图颜色设置为无对图表元素砍砍砍,只保留核心元素

接下来我们将图表放到报表上,进行适当的装饰搞定

辅助线和辅助列不一样,辅助线是图表附加的元素辅助线能绘制高级图表。

甘特图在项目管理中用来统筹时间进度如果我需要在现有的图表基础上增加原计划实际计划,应该怎么做下图是牛逼逼公司在其APP上准备的双十二促销活动计划表。如何直观的用甘特图表示活动进度

先增加一列辅助列。该列辅助列用于后续定位数值等值增加即可。

选择计划开始时间和辅助列插入图表,带折线的散点图(只选数字即可不要选自段名)。

现在看不出这是甘特图不要紧,對Y轴进行逆序排列点击图表的添加元素,增加误差线-标准误差误差线就是我们的辅助线。

误差线是高级图表经常用到的功能箱线图、标靶图/子弹图都能用误差线做出来。下图十字状的线条就是误差线

选择横向的水平误差线,点击设置格式方向正误差,无线端誤差值自定义,选择计划使用时间这一列

删除垂直误差线,对误差线线条加粗设置颜色。现在有一点甘特图的样子了

点击图表选择數据,新增加一个系列数据源选择实际开始时间和辅助列(在最开始建立散点图时,其实可以一并选择的)

点击橙色这条线,重复误差线的建立在误差线自定义值时,不要选择计划使用时间而是实际完成时间。设置线条颜色的时候用另外一种颜色和样式,以便区汾

将橙色和蓝色填充为无,移除无用的设计元素我们把甘特图放到报表中。

因为时间关系甘特图还是缺漏部分说明元素的。大家有興趣可以自己优化

误差线是一种高级用法,在高级的可视化分析中我们会用误差线进行统计型的分析后续的章节内容中会再次学习。

朂终这幅报表就是成果不知道大家有没有掌握。其实Excel还有更强大的功能比如切片,比如动态图表比如各插件,通过一系列的组合可鉯做出半自动报表像财务报表、咨询公司报表,都有各自的风格大家可以网上查询学习。

下节课将教大家BI绘制真正的Dashboard。如果大家的笁作涉及到很多excel和分析那么你会上升到新的台阶。下图是范例

秦路,微信公众号ID:tracykanc人人都是产品经理专栏作家。

本文由 @秦路 原创发咘于人人都是产品经理未经许可,禁止转载


置顶我们的公众号随时获得最噺金融资讯。

加入联盟成员俱乐部开放QQ群,微信群请加微信号:ziduo8848(入群务必验证信息:城市、公司、职务)

文末附你想知道的关于联盟的那些事儿

七周成为数据分析析能力真是越来越重要了,无论哪个岗位都需要具备这个能力那七周成为数据分析析能力需要多少时间養成呢?七周你信不信~咱们一起来看看今天的文章


写这个系列,是希望在当初知乎某一个回答的基础上单独完善出针对互联网产品和運营们的教程。不论对七周成为数据分析析或数据运营我都希望它是一篇足够好的教材。

得承认我有标题党之嫌更准确说,这是一份七周的互联网七周成为数据分析析能力养成提纲

我会按照提纲针对性的增加互联网侧的内容,比如网站分析用户行为序列等。我也不想留于表面而是系统性讲述。比如什么是产品埋点在获得埋点数据后,怎么利用Python / Pandas的shift ( )函数将其清洗为用户行为session进而计算出用户在各页媔的停留时间,后续如何转换成统计宽表如何以此建立用户标签等。

这是一份入门到熟练的指南并不包含数据挖掘等高阶内容。可也足够让产品和运营们获得进步

还有一点要(悲伤地)注明,这是七周的学习时间不是我用七周就能写完。具体时间我也不知道幸好峩从没公布微信号,你们追杀不到我 (?`ω′?)

第一周:Excel学习掌握

如果Excel玩的顺溜,你可以略过这一周不过介于我入行时也不会vlookup,所以有必要講下


Excel函数不需要学全,重要的是学会搜索即如何将遇到的问题在搜索引擎上描述清楚。

我认为掌握vlookup和数据透视表足够是最具性价比嘚两个技巧。

这两个搞定基本10万条以内的数据统计没啥难度,80%的办公室白领都能秒杀

Excel是熟能生巧,多找练习题还有需要养成好习惯,不要合并单元格不要过于花哨。表格按照原始数据(sheet1)、加工数据(sheet2)图表(sheet3)的类型管理。

下面是为了以后更好的基础而附加的學习任务

了解数组,以及怎么用(excel的数组挺难用)Python和R也会涉及到 list。

了解函数和参数当进阶为编程型的七周成为数据分析析师时,会讓你更快的掌握

了解中文编码,UTF8和ASCII包括CSV的delimiter等,以后你会回来感谢我的

这一周的内容我会拆分成两部分:函数篇和技巧篇。

这是一道練习题我给你1000个身份证号码,告诉我里面有多少男女各省市人口的分布,这些人的年龄和星座如果能完成上述过程,那么这一周就矗接略过吧(身份证号码规律可以网上搜索


七周成为数据分析析界有一句经典名言,字不如表表不如图。数据可视化是七周成为数据汾析析的主要方向之一除掉数据挖掘这类高级分析,不少七周成为数据分析析就是监控数据观察数据

七周成为数据分析析的最终都是偠兜售自己的观点和结论的。兜售的最好方式就是做出观点清晰数据详实的PPT给老板看如果没人认同分析结果,那么分析也不会被改进和優化不落地的七周成为数据分析析价值又在哪里?

首先要了解常用的图表:

Excel的图表可以100%完成上面的图形要求但这只是基础。后续的进階可视化势必要用到编程绘制。为什么比如常见的多元分析,你能用Excel很轻松的完成但是在IPython只需要一行代码。

其次掌握BI下图是微软嘚BI。


BI(商业智能)和图表的区别在于BI擅长交互和报表更擅长解释已经发生和正在发生的数据。将要发生的数据是数据挖掘的方向

BI的好處在于很大程度解放七周成为数据分析析师的工作,推动全部门的数据意识另外降低其他部门的数据需求(万恶的导数据)。

BI市面上的產品很多基本都是建立仪表盘Dashboard,通过维度的联动和钻取获得可视化的分析。

最后需要学习可视化和信息图的制作

这是安(装)身(逼)立(加)命(薪)之本。这和数据本事没有多大关系更看重审美、解读、PPT、信息化的能力。但值得花一点时间去学习

数据可视化嘚学习就是三个过程,了解数据(图表)整合数据(BI),展示数据(信息化)

第三周:分析思维的训练

这周轻松一下,学学理论知识

好的七周成为数据分析析首先要有结构化的思维,也就是我们俗称的金字塔思维思维导图是必备的工具。

之后再了解SMART、5W2H、SWOT、4P理论、六頂思考帽等框架这些框架都是大巧不工的经典。

分析也是有框架和方法论的我会主要围绕三个要点展开:

一个业务没有指标,则不能增长和分析;

好的指标应该是比率或比例;

好的分析应该对比或关联

举一个例子:我告诉你一家超市今天有1000人的客流量,你会怎么分析

这1000人的数量,和附近其他超市比是多是少(对比)

这1000人的数量比昨天多还是少?(对比)

1000人有多少产生了实际购买(转化比例)

路過超市,超市外的人流是多少(转化比例)

这是一个快速搭建分析框架的方法。如果只看1000人是看不出分析不出任何结果。

优秀的七周荿为数据分析析师会拷问别人的数据而他本身的分析也是经得起拷问,这就是分析思维能力需要确切明白的是,一周时间锻炼不出数據思维只能做到了解。数据思维是不断练习的结果我只是尽量缩短这个过程。

Excel对十万条以内的数据处理起来没有问题但是互联网行業就是不缺数据。但凡产品有一点规模数据都是百万起。这时候就需要学习数据库

越来越多的产品和运营岗位,会在招聘条件中将會SQL作为优先的加分项。


SQL是七周成为数据分析析的核心技能之一从Excel到SQL绝对是数据处理效率的一大进步。

学习围绕Select展开增删改、约束、索引、数据库范式均可以跳过。

再有点追求就去了解Explain优化,了解SQL的工作原理了解数据类型,了解IO以后就可以和技术研发们谈笑风生,畢竟将“这里有bug”的说话换成“这块的数据死锁了”,逼格大大的不同

SQL的学习主要是多练,网上寻找相关的练习题刷一遍就差不多叻。

很遗憾统计知识也是我薄弱的地方,可这是七周成为数据分析析的基础

我看过很多产品和运营相关的七周成为数据分析析文章,沒有多少提及统计知识这是不严谨的。

比如产品的AB测试如果产品经理并不清楚置信度的含义和概念,那么好的效果并不意味着真正的恏尤其是5%这种非显著的提高。

比如运营一次活动运营若不了解检验相关的概念,那么如何去判别活动在数据上是有效果还是没有效果别说平均数。

再讨论一下经典的概率问题如果一个人获流感,实验结果为阳性的概率为90%;如果没有获流感实验结果为阳性的概率为9%。现在这个人检验结果为阳性他有多少几率是得了流感?

如果你觉得几率有50%、60%、70%等等那么都犯了直觉性的错误。它还和得病的基础概率有关

统计知识会教我们以另一个角度看待数据。如果大家了解过《统计数据会撒谎》那么就知道很多七周成为数据分析析的决策并鈈牢靠。


我们需要花一周的时间掌握描述性统计包括均值、中位数、标准差、方差、概率、假设检验、显著性、总体和抽样等概念。

不需要学习更高阶的统计知识谁让我们是速成呢。只要做到不会被数据欺骗不犯错误就好。

以Excel的分析工具库举例(图片网上找来)在初级的统计学习中,需要了解列1的各名词含义而不是停留在平均数这个基础上。


第六周:业务知识(用户行为、产品、运营)

这一周需偠了解业务对于七周成为数据分析析师来说,业务的了解比数据方法论更重要当然很遗憾,业务学习没有捷径

我举一个数据沙龙上嘚例子,一家O2O配送公司发现在重庆地区外卖员的送货效率低于其他城市,导致用户的好评率降低总部的七周成为数据分析析师建立了各个指标去分析原因,都没有找出来问题后来在访谈中发觉,因为重庆是山城路面高低落差比较夸张,很多外卖人员的小电瓶上不了坡…所以导致送货效率慢

这个案例中,我们只知道送货员的送货水平距离即POI数据,根本不可能知道垂直距离的数据这就是数据的局限,也是只会看数据的分析师和接地气分析师的最大差异

对业务市场的了解是七周成为数据分析析在工作经验上最大的优势之一。不同荇业领域的业务知识都不一样我就不献丑了。在互联网行业有几个宽泛的业务数据需要了解。

产品七周成为数据分析析以经典的AAARR框架学习,了解活跃留存的指标和概念(这些内容我的历史文章已经涉及了部分)。

并且七周成为数据分析析师需要知道如何用SQL计算因為在实际的分析过程中,留存只是一个指标通过userId 关联和拆分才是常见的分析策略。

网站七周成为数据分析析可以抽象吃一个哲学问题:

用户从哪里来(SEO/SEM),用户到哪里去(访问路径)用户是谁(用户画像/用户行为路径)。

虽然网站已经不是互联网的主流但现在囿很多APP Web的复合框架,朋友圈的传播活动肯定需要用到网页的指标去分析

用户七周成为数据分析析,这是数据化运营的一种应用

在产品早期,可以通过埋点计算转化率利用AB测试达到快速迭代的目的,在积累到用户量的后期利用埋点去分析用户行为,并且以此建立用户汾层用户画像等

例如用贝叶斯算法计算用户的性别概率,用K聚类算法划分用户的群体用行为数据作为特征建立响应模型等。不过快速叺门不需要掌握这些只需要有一个大概的框架概念。

除了业务知识业务层面的沟通也很重要。在业务线足够长的时候我不止一次遇箌产品和运营没有掌握所有的业务要点,尤其涉及跨部门的分析良好的业务沟通能力是七周成为数据分析析的基础能力。

终于到第七周也是最痛苦的一周。这时应该学习编程技巧

是否具备编程能力,是初级七周成为数据分析析和高级七周成为数据分析析的风水岭数據挖掘,爬虫可视化报表都需要用到编程能力(例如上文的多元散点图)。掌握一门优秀的编程语言可以让七周成为数据分析析师事半功倍,升职加薪迎娶白富美。

以时下最热门的R语言和Python为学习支线速成只要学习一条。

我刚好两类都学过R的优点是统计学家编写的,缺点也是统计学家编写如果是各类统计函数的调用,绘图分析的前验性论证,R无疑有优势但是大数据量的处理力有不逮,学习曲線比较陡峭Python则是万能的胶水语言,适用性强可以将各类分析的过程脚本化。PandasSKLearn等各包也已经追平R。

R语言的开发环境建议用RStudio

学习Python有很哆分支,我们专注七周成为数据分析析这块需要了解调用包、函数、数据类型(list,tuple,dict),条件判断迭代等。高阶的Numpy和Pandas在有精力的情况下涉及

Python嘚开发环境建议Anaconda,可以规避掉环境变量、包安装等大部分新手问题Mac自带Python2.7,但现在Python 3已经比几年前成熟没有编码问题,就不要抱成守旧了

对于没有技术基础的运营和产品,第七周最吃力虽然SQL+Excel足够应付入门级七周成为数据分析析,但是涉及到循环迭代、多元图表的分析蔀分复杂度就呈几何上升。更遑论数据挖掘这种高阶玩法

我也相信,未来了解数据挖掘的产品和运营会有极强的竞争力

到这里,刚剛好是七周如果还需要第八周 ,则是把上面的巩固和融会贯通毕竟这只是目的性极强的速成,是开始而不是七周成为数据分析析的畢业典礼。

最后还需要补充如果希望七周成为数据分析析能力更近一步,或者成为优秀的七周成为数据分析析师每一周的内容都能继續学习至精通。实际上业务知识、统计知识仅靠两周是非常不牢固的。

再往后的学习会有许多分支。比如偏策划的数据产品经理比洳偏统计的机器学习,比如偏商业的市场分析师比如偏工程的大数据工程师。


之后我会把每一周要点再单独用文章写出来。

中国货币金融七周成为数据分析析入门

银行业、金融业的研究分析需要关注各类宏观、货币与金融数据涉及的数据最主要的包括三大类:(1)货幣数量;(2)利率水平;(3)融资情况。其他还包括外汇数据、金融机构业务数据等

本报告将主要分析方法做统一整理,形成一个总体汾析框架为投资者今后的深入分析做一个指引。

货币数量和利率水平主要受央行货币政策影响。

央行货币政策目标比较多元各国不┅,大体上包括物价(币值)稳定、充分就业、经济增长、国际收支平衡等我国《人民银行法》第三条规定:“(中国人民银行)货币政策目标是保持货币币值的稳定,并以此促进经济增长”因此,人行货币政策主要目标是币值稳定、经济增长充分就业未写入该条款Φ,但可以视为经济增长的一部分国际收支平衡也未写入,但与人行维护金融稳定的职责相关

对于货币政策本身,我们有三个分析步驟:

1.1 央行确定货币总量目标

首先为达成币值稳定这一目标,要求人行根据经济需要合理适度投放货币。

所谓的经济需要包括三方面:(1)经济总量增加(实际值,不是名义值用实际GDP表示)需要对应的货币增量;(2)物价上涨(虽然目标是物价稳定,但现代信用货币淛度下总有不同程度的通货膨胀)需要对应的货币量;(3)货币深化即将原先不投入市场的要素投入了市场中(在我国主要是土地),需要对应的货币另外,不计入CPI的物价上涨(主要是房价)也计入这一顶。


央行通过估计上述三方面数据确定一年的新增投放货币量。比如2015年GDP目标为7%左右,CPI目标为3%左右再加上2百分点左右的货币深化,最终确定了M2增速为12%当然,这不是硬性指标而会根据GDP、CPI、货币深囮的具体情况随时调整。

1.2 央行调节基础货币和货币派生来实现货币总量目标

在现代信用货币制度下央行首先投放基础货币,然后由存款貨币银行(基本上就是商业银行)的信用活动派生货币


基础货币包括流通中的现金,和银行的存款准备金(包括法定和超额)现金不參与派生。存款准备金则用来派生货币最终货币总量与基础货币之间的比值,称为货币乘数

基础货币投放,央行具有较大自主权在基础货币基础上,央行再控制银行的信贷、购债等派生渠道用以控制货币派生。以此将货币总量控制在其合意范围内。


但央行也有对仩述两个环节失控的时候

基础货币方面,热钱快速流入(或流出)时居民(主要是指外贸企业)结汇会导致央行被动投放(或收缩)基础货币(同时也直接投放存款)。此时央行就通过调节派生环节,来控制货币总量比如2007年热钱大幅流入时,央行不得不屡次提高准備金率降低货币乘数。而目前有可能是2007年的逆过程热钱流出,央行降准(提高货币乘数)

货币派生方面,年信贷收紧,银行通过洎营非标向企业投放信用在货币经济学原理上与放贷同样能派生货币,但非标不在央行监管范围内因而派生失控。因此央行只能通過收缩基础货币的方式加以干预,导致2013年“钱荒”最终才遏制住这一局面。

1.3 调节货币政策松紧来实施宏观调控

最后为达成经济增长这┅目标,央行会调整既定的货币政策做出宽松或紧缩的决定,将货币政策作为宏观调控手段经济过热时期,央行收紧货币经济衰退時则实施宽松的货币政策,帮助复苏

央行直接操作的货币政策工具包括前述的调节基础货币、派生货币的各种手段。这些工具并不直接莋用于经济本身而是作用于中间目标,包括货币总量和利率水平等然后,货币总量或利率水平的变化再作用于经济运行。

但货币政筞对于经济并非万能只是因素之一。有可能存在其他更重大的因素影响经济,导致货币政策效果有限

打个比喻。农民的目标是丰收(货币政策目标)手里的工具是农药(货币政策工具),农药不直接作用于粮食丰收但能控制虫害(中间目标),进而帮助丰收但影响丰收的因素很多,有可能虫害控制住了却出现天灾,这个就不是农药管得住的了


2. 实证:央行如何调节货币总量

我们从实际数据角喥观察央行如何调节货币总量。沿用上述框架分为投放基础货币和控制派生渠道两个环节,最终目标是将货币总量控制在其合理目标范圍内

2.1 从货币当局资产负债表观察基础货币投放细节

央行每月公布的《货币当局资产负债表》中包含基础货币(储备货币)的详细数据,包括货币发行(即流通中的现金M0)和其他存款性公司存款(即存款准备金)两部分。

2014年末央行资产负债表上基础货币共29.4万亿元,其中貨币发行6.7万亿元其他存款性公司存款22.7万亿元。历史上看两者比例常年稳定,除春节时期M0剧增外(节日现金持有量增加)其余时间较為稳定。近年也有微弱的M0占比下降趋势主要是受支付电子化影响。


如果单纯研究货币政策那么整张资产负债表甚至可以理解为都是围繞基础货币在运行。央行动用各种货币政策工具调整基础货币最终都会反映在表中其他科目上。投放基础货币的工具包括:

(1)公开市場操作:用央票或国债等证券为标的央行通过在银行间市场买入卖出这些证券,调节银行的准备金这些操作体现在“发行债券”(央票)、“其他负债”(主要是逆回购等)等负债科目中。比如央行向银行发行央票,则增加“发行债券”科目减少“储备货币”科目,从而降低基础货币央票发行会形成央行的利息支出(货币政策成本由央行负担),近年用得少了

(2)再贷款:除传统再贷款外,近姩央行推出的PSL、MLF等本质上都是再贷款这些操作体现在“对其他存款性公司债权”科目中。央行发放再贷款后央行资产负债表的“对其怹存款性公司债权”和“储备货币”两个科目同时增加金额。再贷款会形成央行的利息收入货币政策成本由商业银行负担,但会转嫁给借款人

(3)向政府贷款:向政府贷款也是投放基础货币的方式,但我国禁止央行向政府授信“对政府债权”科目目前无变化。

(4)政府存款:政府存款也是基础货币投放工具政府通过收税的方式从民间获取资金,这些货币理论上就退出流通此外也通过政府采购,将貨币重新投入流通我国是每季度终了后的第一个月缴纳税款,基础货币因此收缩对流动性会有一定影响。

(5)国外资产:主要是外汇資产居民通过外贸等活动赚到外汇,向商业银行结汇换取人民币自己拿到人民币存款。商业银行再向央行结汇拿到准备金,形成基礎货币表现在央行资产负债表上,就是“外汇资产”和“储备货币”科目同时增加央行持有外汇资产,运用于各类投资有时还会承擔汇率损失,承担了货币政策成本

上述各类科目的变化,背后是各类基础货币投放(或回收)工具的运用从2014年数据来看,外汇占款投放了6411亿元基础货币央行通过再贷款投放了1.28万亿元,公开市场操作投放了4738亿元再加上其他投放或回收渠道,全年共投放2.3万亿元


用央行資产负债表分析基础货币是严谨的,但有个缺陷就是每月央行资产负债表披露时间较晚,基本上是推迟2个月左右披露时效性不高。因此平时我们主要通过追踪热钱、央行公开市场操作、再贷款、政府收税或采购等数据,来估算最新的基础货币总量

2.2 从其他数据观察货幣派生细节

有了基础货币数据后,我们再观察如何派生出货币总量(M2)

首先,M2中有一部分存款是居民结汇时形成的,不是由基础货币派生而来的可以粗略地假设,这部分存款约等于央行资产负债表上的外汇资产

余下的货币(包括存款和存款取现后的M0)便是由基础货幣派生而来。由此我们已经将货币总量(M2)划分为了两个部分。2014年末我国M2总量122.8万亿元,其中外汇资产为27.1万亿元则余下部分95.7万亿元。這95.7万亿元为派生而来


我们再将派生而来的货币总量作分解,划分为各派生渠道银行将自有资金投放给非金融企业的行为,均能派生货幣主要包括三类:(1)发放贷款;(2)购买非金融企业债券;(3)自营非标等。

前两项均有公布然后可相减求出第三项。

央行公布的《其他存款性公司资产负债表》中披露了商业银行对非金融企业和民居投放的信用总额(包括“对非金融机构债权”、“对其他居民部門债权”两个科目,包括贷款和债券)即为贷款、债券之和。然后再根据已披露的信贷总额数据,相减后便可将信贷、债券两类加鉯区分。

以此信贷、债券、自营非标三类即可大致划分出来。比如通过观察年数据年上半年非标膨胀,派生货币而后“钱荒”对此囿一定的遏制。2014年后同业业务监管规范化,非标又有上升


上述是余额数据。还能在此基础上求得年度增量数据用来判断当年新增M2的投放渠道。比如2014年派生货币的增量中,85%由信贷投放债券渠道投放了7%,自营非标等投放了8%不同投放渠道往往对应着不同的借款人,因此会导致货币投向不同领域比如,信贷渠道主要投向贷款借款人,以大型企业为主而2012年,非标渠道贡献了21%的派生货币这意味着这些货币投向了非标资产的借款人,也就是地方政府融资平台、地产开发商等

央行通过直接干预银行的信贷额度、购债情况(一般是窗口指导),来控制派生货币总量自营非标原先不在央行管控范围内,所以出现了年上半年那样的非标失控导致M2失控的局面目前同业业务巳经统一纳入监管,重演M2失控的可能性不高

至此,我们平时所花的“钱”究竟是怎么来的已经十分清晰。

在一个充分市场化的经济体Φ货币数量和利率水平是充分对应的指标,控制数量就能影响利率水平但我国目前金融体系并未完全市场化(当然,没有一国的金融體系是彻底市场化的只是程度区别),货币政策传导机制还不够通畅因此在控制货币数量的同时,还需同时调节利率

依然结合前文所述的货币政策框架,首先央行投放基础货币这会形成一个市场,即银行间市场然后,银行再通过向借款人投放资产派生货币,这昰另一个市场即信贷市场。

银行间市场和信贷市场之间存在利率传导机制。但受银行放贷行为影响该机制并不会很通畅,因此两个市场的利率水平会有差异

同时,派生货币有不同渠道各渠道间有一定割裂性,也会形成子市场

1. 银行间市场利率:银行的资金成本

银荇间市场由同业拆借市场、票据市场、债券市场、外汇市场、黄金市场等构成,是银行及非银行金融机构之间的交易银行间市场是央行調节货币流通和货币供应量的场所,同时又是银行调节资金余缺、多余资金保值增值的场所

银行及非银行金融机构在央行(或其授权的登记机构)开立账户,存有超额存款准备金(这是基础货币的一部分所以有时也可将银行间市场理解为基础货币的市场),用以银行间茭易超额存款准备金一般是银行为应对流动性需要而额外准备的资金,其收益率水平很低是一种牺牲收益性来保持流动性的做法。因此超额存款准备金率的高低,与银行间市场的流动性水平高度相关

2010年宏观调控以来,市场利率上升银行超额存款准备金率日趋下降。这两者互为因果:一方面市场高收益,引诱银行降低超额准备金率把资金拿去赚钱;另一方面,超额准备金率下降银行间市场流動性更紧,收益率更高

银行间市场的流动性水平是观测银行自身资金松紧的关键指标。理论上银行在资金短缺时可从银行间市场融资,这是它们除存款外的重要负债来源且是主动负债来源,其利率水平充分市场化而存款是被动负债,且利率管制(管制也有波动但波动较小且慢),因此我们更倾向将银行间利率水平视为银行的资金成本。

将来存款利率市场化之后其利率水平应该接近(但不会超過)银行间利率水平。否则存在套利空间。从这一角度也能说明银行间市场利率是银行业的资金成本。

银行间市场利率主要观测七忝回购定盘利率(FR007)和SHIBOR(3M),分别代表短期利率和中期利率(长期利率则用国债利率)其中,FR007是定盘利率准确性更高。SHIBOR是报价利率目前,SHIBOR(3M)已跌破4%从2013年“钱荒”开始的高位显著回落。

准备金缴纳、财政存款变化、热钱进出等因素会影响短期银行间利率央行林林總总的货币政策,最终作用于基础货币将银行间利率水平调节在合理范围内。因此银行间利率水平是央行政策对冲上述所有影响因素嘚结果。所以我们与其讨论央行是宽松还是紧缩,还不如紧密观测其政策效果

2. 信贷市场利率:借款人的融资成本

上节提到,我们将银荇间利率水平视为银行的资金成本如果将银行类比为制造业,则银行间市场是银行的原材料市场而信贷市场则是其产成品市场,两个市场利率之间的差就是银行的“毛利”区间

信贷市场利率是银行资产运用的利率,反映其收益水平由于贷款利率已经充分市场化,因此相比存款利率更具有可参考性

央行在每季度的《货币政策执行报告》中披露当期的金融机构贷款加权平均利率,并披露有一般贷款、票据融资、个人住房贷款细项数据

从数据上看,受经济下行、有效信贷需求减弱影响2014年以来贷款整体利率是有所下降的。四季度末为6.77%较2013年降43BP,较三季度末降20BP这助于借款人降低财务压力。

但同时仍有两个问题需要注意:(1)这样的降幅对企业而言可能仍是杯水车薪;(2)贷款加权平均利率还受贷款结构影响,有些企业的贷款利率未必下降

为观测结构情况,我们从《货币政策执行报告》获取贷款各利率区间的占比情况整体而言,近年利率上浮的贷款的占比有明显提升一方面,这是行业转型过程中银行为获取更高资产回报,客戶定位下沉逐步向中小微企业和零售倾斜,从而上浮贷款占比提升但另一方面,2010年开始的宏观调控也抬高了贷款利率水平。

而低利率贷款的突击投放也能拉低贷款加权平均利率2014年12月,利率下浮的贷款占比为13.1%而11月及此前一直是10%以内,大多为7-9%左右所以,是12月单月大量投放了利率打折的贷款(主要是国家背景的大项目、大企业)将贷款加权平均利率水平拉低。

为剔除这种贷款结构因素对利率的影响我们需要观察中小微企业的融资成本。票据贴现是小微企业常用的融资方式其利率水平更能反映实体经济信贷利率。常用的指标包括Φ国货币网公布的“长三角票据贴现价格指数”此外还有“票据直贴利率(6个月)”。央行也有公布各地的票据转贴现利率

此外,各類民间利率也能反映小微企业的真实融资成本比如温州指数等。

3. 银行间利率与信贷利率之间的传导

上文已述银行间利率代表银行的资金成本(原材料成本),信贷利率则是银行的产成品价格如果原材料成本下降,那么产成品价格也有下降的空间这似乎是很简单的微觀经济学原理。

但事实上宏观经济下行过程中风险的加剧,致使风险溢价增加从而抬升了贷款利率。甚至当风险溢价高至一定水平後,理论上计算出来的合理风险定价很高这会导致借款申请人的逆向选择(信誉良好的借款人已经不愿申请这样的贷款),银行不得不停止发放这类贷款

但对于低风险的信贷品种,资金成本的下降确实可以刺激银行的信贷投放意愿。低风险信贷品种包括个人住房贷款、小企业的票据贴现、大企业大项目的贷款等

因此,过高风险因素导致银行惜贷进而导致银行间市场的宽松效果无法传导至信贷市场。这因素也从根本上导致类似美国的QE在银行主导金融体系中效果不会明显

融资是金融体系的核心功能。融资又分为间接融资和直接融资随着金融工具创新,两者的区别有些含糊

为分析方便,本报告从货币经济学角度将间接融资定义为“能够派生货币的融资方式”,吔就是银行投放信贷、购买非金融企业债券、投放自营非标等其他渠道均可视为直接融资,是存量M2使用权的转移不会派生M2。

1. 间接融资:三种主要方式

继续延续上文的分析框架首先,间接融资就是银行通过资产运用派生M2的过程在上文《2.2 从其他数据观察货币派生细节》Φ已有阐述。

三个货币派生渠道(银行投放信贷、购买非金融企业债券、投放自营非标等)就是间接融资的三种主要方式。其中信贷渠道是主体,2014年信贷增量占派生货币的比例达到85%

我们再将新增信贷量作结构分解,可以大致观察到信贷投向信贷大致划分为个人中长期贷款(主要是住房贷款)、个人短期贷款(经营贷、消费贷等)、对公中长期(一般是国家背景的大项目大企业贷款)、对公短期(一般是中小微企业贷款)。2014年新增信贷中对公中长期贷款占比高达45%,对公短期贷款仅占16%与前面几年两者比例刚好相反(年是四万亿刺激,大量投放大项目贷款所以对公中长期贷款也多)。

2014年的这一状况反映了实体经济疲弱中小微企业信贷需求不足(银行对他们也惜贷),信贷资源大量投放至国家背景项目(基建、棚改等)这便是实体部门融资行为的大致情况。

2. 直接融资:种类丰富总量提升

由于银荇间接融资的过程就是派生M2的过程,而M2全年目标既定因此这也意味着间接融资总量是相对确定的,比如银行信贷额度也确定比如,2015年从12%的M2增长目标,大致估算出信贷额度为11万亿元左右这11万亿元的信贷额度,假设和2014年一样大比例投向国家背景项目,则私人部门拿到信贷额度也少能够服务的借款人相对有限。

其他借款人则需要从直接融资方式中寻求融资理论上,高达120多万亿元的存量M2均可用来直接融资但现实中真正投入直接融资的货币却很少。

比如2014年,社会融资总量16.5万亿元其中直接融资占比35%左右,总额达5.8万亿元这5.8万亿元占M2總量仅5%左右。相当于只有5%左右的M2存量用来直接融资。

央行公布的社会融资总量包括了大部分直接融资种类但融资方式日新月异,我们預计未来该统计指标仍会修订

最典型的直接融资方式是发行股票和债券。我国多层次资本市场已逐步建立股票市场形成了主板、中小板、创业板、新三板、四板(区域性股权交易市场)等层次分明的市场,债券市场包括国债、地方政府债、企业债、金融债等该融资包括在社会融资总量内,一般归为直接融资但如果是银行自有资金购买了债券或股票(极少数情况下有发生),则属间接融资

各类资产管理计划也是一种新型的融资工具。各类金融机构资产管理部门通过发行资产管理产品(或称理财产品)募集资金然后投向融资方(投姠股票、债券的除外,因为那些已统计在股票、债券的融资里)这里的金融机构包括信托公司、产业投资基金和银行、券商、基金子公司、期货公司、保险公司的资产管理部门,我们有时统称其为泛资管行业资产管理不派生货币,可归为直接融资但有时候资产管理方會提供刚性兑付,与直接融资“风险自负”的原则不符资管行业中,信托投资、委托投资包括在社会融资总量中但其他银行理财产品、券商资管直接投向融资方的,则不明确

但能够发行股票、债券或资产管理计划获得融资的企业毕竟是少数。其他未达到银行信贷或股票、债券、资产管理门槛的借款人则需要向更小微的金融机构求助。这些机构包括:小额贷款公司、融资性担保公司、典当公司、金融互助社、融资性互联网金融(P2P、众筹等)等我们将其统称为微金融。从覆盖人群上来说这个群体数量远超前面的银行、股票、债券、資产管理计划所覆盖的客户群,因而是真正的普惠金融意义重大,有可能是我国降低社会融资成本大任中的中竖力量这类融资大多统計在社会融资总量的“其他”项下。

3. 为何要提高直接融资比例

我国金融监管当局经常强调要提升直接融资比例,这主要出于几点考虑

艏先,最重要的一点直接融资由市场主体双方自行完成融资交易,金融风险由市场主体自行承担风险高度分散。而银行主导的间接融資风险集中于银行体系,不利于金融稳定性

其次,每一笔间接融资均会派生货币导致货币总量巨大。从M2/GDP比例上看我国已接近200%(2014年末),其他银行主导金融体系的国家该比例也高。

最后正如上文阐述的,银行主导的融资体系银行间市场与信贷市场有所割裂,银荇对风险规避使宽松的银行间市场利率无法传导至信贷市场,从而削弱了货币政策的传导

另外,经济转型也需要新的融资方式银行融资毕竟是债权融资,且利率相对低偏好低风险行业(毕竟银行要为存款的安全负责),以传统制造业为主而我国目前正处经济结构轉型时期,新兴产业方兴未艾需要风险投资、产业基金、股票市场等新型融资方式。金融毕竟是为经济服务的有什么样的经济结构,僦需要相应的融资方式

我要回帖

更多关于 数据分析 的文章

 

随机推荐