关于中国实体经济及未来发展趋势求解

   1、资管行业规模快速增长业务體量拾级而上

   近几年,我国资产管理行业呈现加速发展的态势规模快速增长,业务体量拾级而上截至2017 年6 月末,
银行理财、基金公司、證券公司、保险公司、信托公司、期货公司以及私募基金七大资管板块管理资产规模合
计达98.06 万亿元(剔除交叉因素合计规模60 多万亿),哃比增长23.76 万亿元增速达31.98%,而同期银
行各项存款增加14.41 万亿元增速仅为10.90%。从细分行业来看银行理财资管规模占比最高,将近30%左
右其中股份行占比最高,其次是大行两者合计占银行理财市场的74.2%。

2016资产管理行业规模(单位:万亿)

资料来源:公开资料整理

   相关报告:智研咨询网发布的《》

2017不同类型银行理财规模(单位:万亿)

资料来源:公开资料整理

2017 年银行理财产品期限结构分布

资料来源:公开资料整理

   峩国资管行业的大发展有其特定的历史背景在宏观层面,由于经济多年的快速发展社会财富迅速膨胀,居民理财投资意识也逐渐提高衍生了对资产保值增值的需要,进而促进大量资金涌入资管行业

 在政策层面,国内的监管制度促进资管行业的发展一是利率管制,茬利率市场化进程中由于利率定价并未完全市场化,存款利率偏低银行理财得以制度套利吸收居民资金,使存款“脱媒化”二是信貸管制,央行对银行的信贷额度管控促进了“非标”债权的发展使银行有内生动力助推理财发展。三是出于对部分监管制度的规避投資必须借助通道绕开监管,从而加速信托、基金子公司通道业务的发展扩大了整体资管规模。

大业务:通道业务、理财业务和委托投资業务其中通道业务主要包括银信、银证、银基和银保通道合作业务,主要是银行受到监管指标约束和政策限制没有相应的存款和资本莋支撑发放贷款,或不得向受限行业、政府融资平台等直接发放贷款为此转而通过理财产品的形式“吸储”,之后用理财产品募集的资金认购信托公司、证券公司等发行的资产管理类金融产品而这个金融产品的投向正是那些受限的融资对象。

   委托投资业务是指委托人在受托行开设同业存款账户存入同业资金,签订同业存款协议和委托投资协议(抽屉协议)另外再签订一份委托行的投资指令,受托行按照委托行的指令以受托行的名义投资于委托行指定的金融资产,包括直接投资信托计划和定向资管计划等也可以投资于间接金融资產,如信托收益权、存单益权、票据资产等

   理财业务是银行资管业务的核心,然而在现阶段实际操作中理财业务普遍背离“受人之托,代客理财卖者有责,买者自负”的资管本质体现在以下几个方面:

   (1)预期收益型产品为主力军,净值型产品冷清2016 年全年共有59 家銀行发行了829 只净值型理财产品,市场占比非常低仅有0.58%。2017 年全年发行的净值型理财产品有1183 只虽然有所增加,但无论是发行银行数量还是產品发行量净值型产品和预期收益型产品都存在巨大差距。然而从资产管理的角度讲净值型产品由于不需要银行信用兜底,更符合资管的本质

 (2)“通道为王”,影子银行盛行随着银监会对商业银行信贷规模监管的严格化,商业银行为寻求规模继续扩张逐渐形成叻借助“通道”实现放贷出表的挪腾模式。具体来讲银行利用理财资金,通过券商、信托等机构间接将资金贷款给需要资金的企业,於是券商、信托等机构就成为了影子银行也是银行成功放贷,实现资产出表进行监管套利的通道。这种模式体现的是带有浓厚银行烙茚的信贷文化而不是理财作为资管主要组成部分的资管文化。

 (3)产品设计能力有限大规模进行委外投资。虽然在形势上银行理财种類繁多但本质上同质化十分严重,这也反映出银行在资产管理能力上的薄弱许多发行理财的银行,尤其是规模较小的城商行缺少出銫的投研团队,在产品设计、风险梯度设计等方面能力欠缺不能满足客户多样化的需要。因此很多银行将大量理财资金委托给券商、基金等投资能力较强的机构甚至从项目调查、风险审查再到投后检查都全权交出,严重背离了资管本质

   从2017 年11 月,央行发布《关于规范金融机构资产管理业务的指导意见(征求意见稿)》(以下简称“资
管新规”或《指导意见》)开始资管新规就引起了市场的广泛关注。

   資管新规旨在规范金融机构资管业务统一同类资管业务监管标准,有效和防范和控制金融风险以更好的服务实体经济。在今年2 月份市场已经流出资管新规的内审稿,因此新规并没有太多超市场预期的内容,主要囊括了资管产品分类、杠杆规定、信息披露、投资者管悝、监管分工、违规行为处罚等等近30 项可谓“全而细”,尤其是强调控制杠杆和打破刚性兑付

禁止资金池操作核心在降低期限错配风險

打破刚性兑付,强调“卖者尽责、买者自负”明确了刚性兑付的行为,并规定了对刚性兑付行为的分类惩处规定鼓励投诉举报。该條足以反映监管层对打破资产产品刚性兑付的决心

限制集中度。单只产品投资同一标的不超过净值10%;同一机构发行的全部产品投资同一標的不超过标的市值的30%其中全部开放式公募投资股票的不超过15%。

明确了四类资管产品分类以80%为界。

采用“新老划断”的方式基本符匼市场预期,同时设置了至2019年6月30日的过渡期案安排

过渡期内,商业银行可以设置独立账户托管本行理财产品但在过渡期后需要设立具囿独立法人地位的子公司开展资管业务。

消除多层嵌套和通道业务除FOF\MOM之外,不允许资管产品投资其他资管产品

统一杠杆要求对公募产品、私募产品分别设定了140%、200%的总资产\净资产限制;净值资管产品持有人进行质押融资,放大杠杆;明确限制了不得进行分级的产品;对于結构化产品优先劣后杠杆倍数为固收类3倍、权益类1倍、混合类2倍;明确界定了分级资管产品的定义。

明确资管业务为金融机构表外业务并且需要按照管理费收入10%计提风险准备金,或者按照规定计提操作风险资本或相应风险资本准备金风险准备金余额达产品余额1%时可以提取。该条规定可能会加大商业银行资本补充压力

资料来源:公开资料整理

    同时,资管新规也包含一些超市场预期的规定包括:

    (1)哃一金融机构发行的多只资管产品投资同一标的的资金合计不超过300 亿。

    (2)对合法个人投资者的资产和收入要求有所提高并规定了法人投资者的净资产门槛

    (3)限制集中度。此前市场预期为“双十”规定资管新规比预期有所放松。

    (4)首次提到对智能投顾的监管需取嘚相应资质;要求对不同产品设置不同算法,意在减少算法同质性带来的顺周期性;禁止借助智能投顾夸大宣传

    (5)规定商业银行在过渡期后需要设立独立子公司来开展资管业务。

    (6)突出了金融机构职责和投资者保护全文对资管产品的理念从“受人之脱、代人理财”轉变为“卖者尽责、买者自负”,突出了资管发行人勤勉尽责的职责;明确提出金融机构未勤勉尽责时需对投资者损失负责。

    (7)对非標投资的规定仅仅限制投资于银行信贷产品并未如市场预期那样提出“控制并缩减规模”,但强调对非标产投资的监管规定

    此外,资管新规重点支持银行实施债转股项目相关规定包括:

    (1)公募产品不得投资未上市股权,但银行可以发行权益类产品投资支持市场化、法制化的债转股

    (2)除鼓励金融机构发行产品支持国家重点领域和“一带一路”等领域之外,还鼓励发行资产产品支持经济结构转型和降低企业杠杆率

    (3)过渡期后要求银行设立独立子公司开展资管业务,该点暗合《商业银行新设债转股实施机构管理办法》的规定有助于引导商业银行开展债转股。

总的来说“大资管”监管新规的推出时间窗口和内容基本符合预期。正如之前所预期的:随着“一委一荇三会”混业监管框架的确立针对监管空白区域和交叉区域的金融监管政策将陆续出台,而“大资管”监管新规就是针对交叉性金融业務提出的统一监管规则但是也需要注意的是,资管新规仅仅是指央行对资管行业的统一规定随后针对各自行业的资管产品,“三会”還会提供相应的监管规定预计随后银监会将出台银行业理财产品的新规。

    4、资管新规对银行表内外业务的影响

    (一)资管新规对银行理財业务影响分析

    1、同业理财将会显著压缩看好零售理财优势

    严格监管和套利空间收窄延续,同业理财占比或将进一步压缩同业理财是銀行同业资金空转的重要途径,在“同业存单—同业理财—委外”的模式下尤为严重今年以来监管部门对于资金空转以及本次资管新规對于消除多层嵌套的规定,将进一步压缩同业理财的规模截止2017 年底,银行理财中金融同业类理财存续规模3.25 万亿元产品余额较去年末减尐3.40 万亿元,降幅达51.13%;同业类理财产品占全部理财的比重为11.00%较去年末下降了11.88 个百分点。

    在资管行业统一监管标准下银行个人理财和私人銀行产品的比较优势将凸显。(1)能够获得较高的利润率;(2)有利于银行零售业务转型;(3)有利于形成稳定客户资源;(4)业务风险楿对分散监管压力较小。在美国及香港地区贴身的个人理财服务已经成为银行业竞争的主要焦点。截至2017 年底银行理财产品余额中,零售理财(包括个人类产品、高资产净值类产品、私人银行类产品)余额达19.79 万亿较去年末增加了4.25 万亿,占比全部理财的66.99%较去年末提高叻13.50 个百分点。资管新规正式版本发布之后银行同业理财类产品仍将继续下降,而零售理财将逐渐成为各家银行竞争的焦点

17Q4银行理财投資者类型结构变化

资料来源:公开资料整理

16Q4银行理财投资者类型结构变化

资料来源:公开资料整理

    5、规范资金池业务乱象,银行理财的非標投资将受到较大冲击

    新规规定:“资产管理产品直接或者间接投资于非标准化债权类资产的非标准化债权类资产的终止日不得晚于封閉式资产管理产品的到期日或者开放式资产管理产品的最近一次开放日”。考虑到目前银行理财的期限普遍在1 年以内而非标资产往往是跨年度的“类信贷”业务,短的期限为3-5 年长的可以达10 年。因此预计未来银行理财投资非标资产的规模也会大幅下降

    从理财产品资金配置規模来看截至2017 年底,银行理财的非标准化债权类资产配置比例为16.22%规模在4.79 万亿左右,仅次于债权的配置比例(42.19%)但是从纵向比较来看,2016 年末非标配置比例为17.49%规模在5.08 万亿。可见今年以来银行理财非标配置有明显的下降

    从理财产品投向各类品种的数量分布来看,从2017 年8 月開始投向债券的理财产品数量呈现上升,而投向其他类(非标类债权资产是其主要构成)的理财产品数量明显下降占比从45.92%减少到32.76%。

    此外考虑到目前银行理财投资非标的规模与同业理财规模相当,无法投资非标后银行理财资金对其他类型资产投向的流出效应较弱

银行悝财产品配置各类基础资产的数量分布(%)

资料来源:公开资料整理

    6、90 天内封闭式产品不再,理财投资周期或拉长

    资管新规对银行理财期限结构会产生重大影响资管新规要求:“为降低期限错配风险,金融机构应当强化资产管理产品久期管理封闭式资产管理产品最短期限不得低于90 天。”据悉在2017 年发行的封闭式银行理财产品中,53%左右为90 天以内的封闭式预期收益型产品占一半以上。此外在期限错配限淛和理财产品不再刚性兑付的情况下,为提高银行理财的吸引力银行也将倾向于发行久期较长的产品。投资周期的拉长改变的可能不僅是理财产品的平均期限,还有其发行的安排、产品的设计和未来投资的结构

    (二)资管新规对银行表内业务的影响

    1、保本理财不在新規限定范围内,但或将“改头换面”

保本理财与理财产品的“刚兑”概念有所区别保本理财实际上属于表内业务。根据《中国银行业理財市场报告》的表述“保本理财在法律关系、业务实质、管理模式、会计处理、风险隔离等方面与非保本理财产品‘代客理财’的资产管理属性存在本质差异”,而且目前保本理财也已纳入银行表内核算视同存款管理,相应纳存款准备金和存款保险基金的缴纳范围同時,资管新规也明确规定资产管理产品包括银行非保证券公司等发行的资管产品等银行本理财产品不在其列。因此资管新规中“金融機构不得开展表内资产管理业务”的规定实际并不会影响到保本理财的发行。

打破非保本理财的刚兑反而可能会增加保本理财规模。由於银行理财出现的背景是作为存款的替代品增强收益投资者的特性决定了其最认可的是背后存在的银行信用背书,打破非保本理财刚兑後对其需求部分将会转向保本理财产品,且银行在较大的存款压力下也有动力提供这种产品但为了与非保本理财相区别,避免误导消費者可能会以结构性存款等名义继续存在,但其保本的基本特性不会改变且预计其在银行理财中的占比将会显著提升,而非保本理财規模可能会出现下降

    近年来,由于普遍的“刚性兑付”以及较高的收益率非保本理财占比持续上升,2016 年末达到79.56%但2017 年底非保本理财占仳下降至75.05%,且绝对值也减少了0.94 万亿而保本理财则增加了1.43 万亿元。

17Q4银行理财收益类型变化(万亿)

资料来源:公开资料整理

17Q4银行理财收益類型结构变化(万亿)

资料来源:公开资料整理

16Q4银行理财收益类型结构(%)

资料来源:公开资料整理

16Q4银行理财收益类型结构变化(万亿)

資料来源:公开资料整理

    2、表外理财规模下降带来存款结构变化负债端成本有望降低

    由于商业银行是除央行外唯一的信用创造机构和唯┅的存款机构,其贷款和在一级市场上购买债券的行为创造出来的存款无论经过何种链条传导最终仍将存入银行因此新规下理财规模的減少不会影响银行体系总的存款量。例如个人购买银行非保本理财虽然会减少个人在银行的存款,相应会形成等量的非银行金融机构存款;理财资金在购买企业债券后非银行金融机构存款减少但又会等量增加企业存款。

    但是理财规模下降带来的存款结构变化将会降低銀行的负债端成本,主要通过以下两种渠道:一是部分银行理财将转化为活期存款相对于非银行金融机构存款而言,付息成本会下降甴于同业理财监管和整个理财产品在资产端收益率的下降,未来银行理财规模将保持低速增长尤其是同业理财将继续下降,其减少的部汾将重回银行表内成为成本率较低的负债。

    二是打破刚兑后银行不再承担可能的损失其信用成本将会下降。打破刚性兑付后银行需偠计提的信用成本也将下降。银行体系存款规模大致160 万亿理财规模30 万亿,占比约20%如果理财成本率下降100 个bp,将降低银行负债端成本率20 个bp如果综合负债成本率3%,其也将降低银行负债端成本率大致7%左右

    (三)来自“信托降杠杆”的间接影响分析

    从金融去杠杆开始,对于证券资管、基金子公司等配资权益的杠杆已经下降至1:1仅信托资管仍执行58号文规定的“优先受益人和劣后受益人投资资金配置比例原则上不超过1:1,最高不超过2:1”各家信托机构具体配资比例不一。根据资管新规同一资管行业标准的精神最终信托的权益配置杠杆也将从2:1 下降至1:1,从而可能间接影响到银行理财资金认购结构化产品的规模

    最多挤出银行资金780 亿,影响较小截至2017 年三季末,68 家信托公司资产总规模24.41 万亿银信合作类资产规模5.43 万亿,占比22.27%;实际资金信托规模20.6 万亿其中投向股票市场的规模为8858亿,占比4.29%;假定银信合作类资产中同样有4.29%投向股票市场即规模2331 亿。按照优先劣后比例从2:1 降到1:1 来看最多将挤出银行优先级资金780 亿左右。无论是相对银行20 万亿以上的表外理财规模还是表内约22 万亿的非标投资来说,规模较小因此对银行业绩影响非常小。

股市场个股表现异常跌幅较大,有业绩预告不及预期的因素也有信托等资管资金抛售的原因。但信托资金占比较高的股票通常是小市值股票因此相对而言,银行股受冲击较小同时在银行基夲面向上的情况下,板块整体优势凸显详细研究了上市银行前十大流通股股东背景,目前只有杭州银行、南京银行分别有一家信托公司股东杭州银行有股东“光大兴陇信托有限责任公司-光大信托-高览2 号证券投资集合资金信托计划”,持股0.41%;南京银行有股东“东方基金-民生银行-中融信托-瞰金63 号单一资金信托”持股1.37%。两者持股比例均不高因此即便将信托杠杆也不会给公司股价带来较大影响。

    綜上所述“大资管”监管新规对商业银行的影响集中体现在理财业务中,尤其是在理财产品类型、业务模式、资产配置、风险结构等方媔包括:

    (1)保本类理财产品并不属于“央行界定的资管产品”,其不在大资管监管新规的监管范围以内银行仍
将发行,而且在理财產品中的占比也将稳步提高

    (2)未来银行发行的资管产品只包括非保本的理财产品,以便“打破刚性兑付”银行借助发行结构化的
存款产品或者CDs 来弥补存款绝对额的减少;同时非保本类产品也只能是“净值型”产品,目前国内银行发行
的净值型产品占比不到10%未来将稳步提高;

    (3)“资产端”配置方式将继续受到限制,理财产品收益率将逐步回落;

    (4)非标资产配置规模将逐步下降资金池业务模式、通道业务都将被叫停,表外业务规模下降非标资
产配置受限后,资金流出端受限同时资金的流入端也将规模下降,而且按照分析测算这两类的规模
大致都在4.6 万亿左右,不会出现市场认为的理财资金流出效应

    (5)此外,银行也将逐步通过成立的“银行系资管子公司”嘚模式来开展资管业务充分实现风险隔离,

    2018 年2 月4 日银行业理财登记托管中心发布《中国银行业理财市场年度报告(2017 年)》。截至2017年末全国银行业理财产品存续余额为29.54 万亿元,同比增长1.69%增速同比下降21.94%,增长速度放缓债券、非标和现金及银行存款是理财资金配置的主偠对象。在金融严监管的背景下同业理财规模下降、保本理财规模上升,理财产品更多的投向权益类资产减少了对非标资产和债券的配置比例。

2017 年下半年非标资产配置并未延续上半年的下降趋势反而略微上升,主要原因有以下两点:其一对非标配置影响最大的资管噺规正式文件并未落地,因此对非标配置的影响相对有限;其二非标资产的持续期较长,调整需要较长的时间

年,监管重心将从“同業”逐步转移至“非标”非标配置比例和规模将逐步减少。2018年出台的《商业银行委托贷款管理办法》、《关于规范银信类业务的通知》兩大文件很大程度上是针对银行表内外非标资产配置问题。在资管新规落地之后限制期限错配将确定,理财产品中存量、期限不匹配嘚非标配置将逐步退出因此非标配置比例和规模将会缩减。但是考虑到非标资产期限较长,平均为2 年左右所以非标资产下降过程是楿对缓慢的。

    (二)债券配置减少权益类资产应有明显提升

年末达到9.47%,提升幅度为3%左右权益类资产的提升有以下两个原因:一是,金融强监管下限制了银行理财对非标资产的配置;二是市场期望高收益的理财产品,因此在成本压力下增加对权益类资产的投资减少对蔀分现金、固收类品种的配置;三是,理财资金对权益市场有乐观的预期看好其收益率。债券类资产占比整体下滑一方面和理财整体投资多元化倾向提升有关;另一方面和理财产品追求高收益有关。从债券持有结构来看理财配债仍以信用债为主,占比仍然维持在80%左右利率债占比较2017 年中有所提升,仍低于2016 年末这应该源于利率债上行至高位后,理财资金看好其收益率增加持有利率债。

    (三)未来银荇理财资产配置前瞻

    综上所述金融严监管对银行理财资金配置有重要的影响:权益类资产配置比例提高、非标资产和债券配置比例降低。2018 年监管重心将从“同业”转向“非标”,随着对非标配置影响最大的“资管新规”正式落地非标配置比例和规模将会继续缩减,但甴于非标资产期限较长因此非标资产将缓慢下降。

    在资管新规正式落地之后针对银行理财的新规也将出炉。在限制银行理财刚兑、以期限错配的方式投资非标的情况下未来银行理财产品的基础资产配置可能表现出以下变化:

    1、对ABS 产品的配置比例或将增加。主要原因在於按照新规的说法,“标准化债权类资产是指在银行间市场、证券交易所市场等国务院和金融监督管理部门批准的交易市场交易的具有匼理公允价值和较高流动性的债权性资产”由于交易所挂牌的ABS 资产,明显要属于标准化债权资产但与此同时,ABS 资产的成交并不活跃使得大部分缺乏明确的市场公允价值,这样的情况下未来ABS 资产究竟属于标准化资产还是非标准化资产,以及ABS 资产的核算是用成本法还是淨值法将有待进一步确认。不排除未来ABS 资产有望成为既属于标准化资产又能够采用成本化计价的情况,从而成为新型净值型理财产品嘚“新宠”

2、加大标准化资产,尤其是权益资产的配置比例在非标受限的情况下,标准化资产的优势凸显一方面,标准化资产估值楿对容易符合资管新规提出的公允价值原则;另一方面,标准化资产流动性强、安全性较高符合居民偏好短周期理财产品的特征,也能够便利商业银行应对居民随时“赎回”的可能性这些标准化资产可能是标准化债权资产,也可能是权益资产相对而言,权益类资产收益要高于债权类资产尤其是2018 年在权益资产收益向好的预期下,商业银行很可能会加大对权益类资产的配置力度此外,在打破理财产品刚性兑付之后居民购买理财的风险提高,因此也要求有更高的收益进行覆盖

    (一)理财非标配置受限可能带来的影响

    银行理财一般凊况下不超过1 年的期限,而非标资产的期限往往要超过1 年这意味着,未来新增的非标准化债券类资产将没有对接的银行理财资金同时,由于当前存量的非标准化债权类资产期限较长过渡期之后久期仍要超过银行理财的期限,存量的非标资产缺少新增资金进行对接这將使得非标资产面临较大的抛售压力。

    2、理财产品对债券市场的冲击将加大

    银行继续大力发行新型净值型理财产品在银行理财产品不能投资非标的情况下,银行有可能进一步加大银行理财对债券市场的配置规模如果在债券牛市的情况下,这种配置需求将会更为旺盛但昰,如果遭遇了债券熊市那么大幅亏损的银行理财将面临大面积的赎回压力,从而导致了债券市场下跌“波浪壮阔”因此,如果新规の下银行继续发行新型理财产品,将大幅推高债券市场的波动性

    非标融资已经成为实体经济融资的重要手段在限制非标期限错配下,戓者是难以寻找到合适的长期资金投入或者是融资成本率抬升。无论怎么样融资主体的融资渠道将收窄,在转移到表内或债券市场融資难以实现的情况下可能对实体经济带来一定的冲击,局部资金链断裂、信用风险上升的概率会加大

    在无法刚兑的情况下,银行发行悝财产品只能获取管理费而无法获取任何超额收益。对银行来说决定理财收益的只能是资产规模,而非资产收益率

    对银行来说,是否继续投资非标将面临选择非标投资对银行来说具有高收益的特征,这也是提高自身理财产品吸引力的重要手段若不做非标投资,理財规模将下降带来银行手续费及佣金收入的下降。但是即便选择发行投资非标的理财产品一方面需要承受长久期负债成本抬高的压力,另一方面还需要考虑如何才能获取长期的投资资金后者将决定着银行未来能否可持续地发行非标投向的理财产品。

    因此在新规落地の后,银行理财产品市场的竞争将加大尤其是对长期资金的竞争。零售实力较强客户资源较多,零售品牌认可度高的银行将占据优势 

十三届全国人大常委会专题讲座苐十四讲

来源:中国人大网 时间: 15:31:53 作者:梅宏

  中国特色社会主义进入新时代实现中华民族伟大复兴的中国梦开启新征程。党中央决萣实施国家大数据战略吹响了加快发展数字经济、建设数字中国的号角。习近平总书记在十九届中共中央政治局第二次集体学习时的重偠讲话中指出:“大数据是信息化发展的新阶段”并做出了“推动大数据技术产业创新发展、构建以数据为关键要素的数字经济、运用夶数据提升国家治理现代化水平、运用大数据促进保障和改善民生、切实保障国家数据安全”的战略部署,为我国构筑大数据时代国家综匼竞争新优势指明了方向!

  今天我拟回顾大数据的发端、发展和现状,研判大数据的未来趋势简述我国大数据发展的态势,并汇報我对信息化新阶段和数字经济的认识以及对我国发展大数据的若干思考和建议。

  一、大数据的发端与发展

  从文明之初的“结繩记事”到文字发明后的“文以载道”,再到近现代科学的“数据建模”数据一直伴随着人类社会的发展变迁,承载了人类基于数据囷信息认识世界的努力和取得的巨大进步然而,直到以电子计算机为代表的现代信息技术出现后为数据处理提供了自动的方法和手段,人类掌握数据、处理数据的能力才实现了质的跃升信息技术及其在经济社会发展方方面面的应用(即信息化),推动数据(信息)成為继物质、能源之后的又一种重要战略资源

  “大数据”作为一种概念和思潮由计算领域发端,之后逐渐延伸到科学和商业领域大哆数学者认为,“大数据”这一概念最早公开出现于1998年美国高性能计算公司SGI的首席科学家约翰·马西(John Mashey)在一个国际会议报告中指出:隨着数据量的快速增长,必将出现数据难理解、难获取、难处理和难组织等四个难题并用“Big Data(大数据)”来描述这一挑战,在计算领域引发思考2007年,数据库领域的先驱人物吉姆·格雷(Jim Gray)指出大数据将成为人类触摸、理解和逼近现实复杂系统的有效途径并认为在实验觀测、理论推导和计算仿真等三种科学研究范式后,将迎来第四范式——“数据探索”后来同行学者将其总结为“数据密集型科学发现”,开启了从科研视角审视大数据的热潮2012年,牛津大学教授维克托·迈尔-舍恩伯格(Viktor Mayer-Schnberger)在其畅销著作《大数据时代(Big Data: A Revolution That Will Transform How We LiveWork,and Think)》中指出数据分析将从“随机采样”、“精确求解”和“强调因果”的传统模式演变为大数据时代的“全体数据”、“近似求解”和“只看关联鈈问因果”的新模式,从而引发商业应用领域对大数据方法的广泛思考与探讨

  大数据于2012、2013年达到其宣传高潮,2014年后概念体系逐渐成形对其认知亦趋于理性。大数据相关技术、产品、应用和标准不断发展逐渐形成了包括数据资源与API、开源平台与工具、数据基础设施、数据分析、数据应用等板块构成的大数据生态系统,并持续发展和不断完善其发展热点呈现了从技术向应用、再向治理的逐渐迁移。經过多年来的发展和沉淀人们对大数据已经形成基本共识:大数据现象源于互联网及其延伸所带来的无处不在的信息技术应用以及信息技术的不断低成本化。大数据泛指无法在可容忍的时间内用传统信息技术和软硬件工具对其进行获取、管理和处理的巨量数据集合具有海量性、多样性、时效性及可变性等特征,需要可伸缩的计算体系结构以支持其存储、处理和分析

  大数据的价值本质上体现为:提供了一种人类认识复杂系统的新思维和新手段。就理论上而言在足够小的时间和空间尺度上,对现实世界数字化可以构造一个现实世堺的数字虚拟映像,这个映像承载了现实世界的运行规律在拥有充足的计算能力和高效的数据分析方法的前提下,对这个数字虚拟映像嘚深度分析将有可能理解和发现现实复杂系统的运行行为、状态和规律。应该说大数据为人类提供了全新的思维方式和探知客观规律、妀造自然和社会的新手段这也是大数据引发经济社会变革最根本性的原因。

  二、大数据的现状与趋势

  全球范围内研究发展大數据技术、运用大数据推动经济发展、完善社会治理、提升政府服务和监管能力正成为趋势。下面将从应用、治理和技术三个方面对当前夶数据的现状与趋势进行梳理

  一是已有众多成功的大数据应用,但就其效果和深度而言当前大数据应用尚处于初级阶段,根据大數据分析预测未来、指导实践的深层次应用将成为发展重点

  按照数据开发应用深入程度的不同,可将众多的大数据应用分为三个层佽第一层,描述性分析应用是指从大数据中总结、抽取相关的信息和知识,帮助人们分析发生了什么并呈现事物的发展历程。如美國的DOMO公司从其企业客户的各个信息系统中抽取、整合数据再以统计图表等可视化形式,将数据蕴含的信息推送给不同岗位的业务人员和管理者帮助其更好地了解企业现状,进而做出判断和决策第二层,预测性分析应用是指从大数据中分析事物之间的关联关系、发展模式等,并据此对事物发展的趋势进行预测如微软公司纽约研究院研究员David Rothschild通过收集和分析赌博市场、好莱坞证券交易所、社交媒体用户發布的帖子等大量公开数据,建立预测模型对多届奥斯卡奖项的归属进行预测。2014和2015年均准确预测了奥斯卡共24个奖项中的21个,准确率达87.5%第三层,指导性分析应用是指在前两个层次的基础上,分析不同决策将导致的后果并对决策进行指导和优化。如无人驾驶汽车分析高精度地图数据和海量的激光雷达、摄像头等传感器的实时感知数据对车辆不同驾驶行为的后果进行预判,并据此指导车辆的自动驾驶

  当前,在大数据应用的实践中描述性、预测性分析应用多,决策指导性等更深层次分析应用偏少一般而言,人们做出决策的流程通常包括:认知现状、预测未来和选择策略这三个基本步骤这些步骤也对应了上述大数据分析应用的三个不同类型。不同类型的应用意味着人类和计算机在决策流程中不同的分工和协作例如:第一层次的描述性分析中,计算机仅负责将与现状相关的信息和知识展现给囚类专家而对未来态势的判断及对最优策略的选择仍然由人类专家完成。应用层次越深计算机承担的任务越多、越复杂,效率提升也樾大价值也越大。然而随着研究应用的不断深入,人们逐渐意识到前期在大数据分析应用中大放异彩的深度神经网络尚存在基础理论鈈完善、模型不具可解释性、鲁棒性较差等问题因此,虽然应用层次最深的决策指导性应用当前已在人机博弈等非关键性领域取得较恏应用效果,但是在自动驾驶、政府决策、军事指挥、医疗健康等应用价值更高,且与人类生命、财产、发展和安全紧密关联的领域偠真正获得有效应用,仍面临一系列待解决的重大基础理论和核心技术挑战在此之前,人们还不敢、也不能放手将更多的任务交由计算機大数据分析系统来完成这也意味着,虽然已有很多成功的大数据应用案例但还远未达到我们的预期,大数据应用仍处于初级阶段未来,随着应用领域的拓展、技术的提升、数据共享开放机制的完善以及产业生态的成熟,具有更大潜在价值的预测性和指导性应用将昰发展的重点

  二是大数据治理体系远未形成,特别是隐私保护、数据安全与数据共享利用效率之间尚存在明显矛盾成为制约大数據发展的重要短板,各界已经意识到构建大数据治理体系的重要意义相关的研究与实践将持续加强。

  随着大数据作为战略资源的地位日益凸显人们越来越强烈地意识到制约大数据发展最大的短板之一就是:数据治理体系远未形成,如数据资产地位的确立尚未达成共識数据的确权、流通和管控面临多重挑战;数据壁垒广泛存在,阻碍了数据的共享和开放;法律法规发展滞后导致大数据应用存在安铨与隐私风险;等等。如此种种因素制约了数据资源中所蕴含价值的挖掘与转化。

  其中隐私、安全与共享利用之间的矛盾问题尤為凸显。一方面数据共享开放的需求十分迫切。近年来人工智能应用取得的重要进展主要源于对海量、高质量数据资源的分析和挖掘。而对于单一组织机构而言往往靠自身的积累难以聚集足够的高质量数据。另外大数据应用的威力,在很多情况下源于对多源数据的綜合融合和深度分析从而获得从不同角度观察、认知事物的全方位视图。而单个系统、组织的数据往往仅包含事物某个片面、局部的信息因此,只有通过共享开放和数据跨域流通才能建立信息完整的数据集

  然而,另一方面数据的无序流通与共享,又可能导致隐私保护和数据安全方面的重大风险必须对其加以规范和限制。例如鉴于互联网公司频发的、由于对个人数据的不正当使用而导致的隐私安全问题,欧盟制定了“史上最严格的”数据安全管理法规《通用数据保护条例》(General Data Protection RegulationGDPR),并于2018年5月25日正式生效《条例》生效后,Facebook和穀歌等互联网企业即被指控强迫用户同意共享个人数据而面临巨额罚款并被推上舆论的风口浪尖。2020年1月1日被称为美国“最严厉、最全媔的个人隐私保护法案”——《加利福利亚消费者隐私法案》(CCPA)将正式生效。CCPA规定了新的消费者权利旨在加强消费者隐私权和数据安铨保护,涉及企业收集的个人信息的访问、删除和共享企业负有保护个人信息的责任,消费者控制并拥有其个人信息这是美国目前最具典型意义的州隐私立法,提高了美国保护隐私的标准在这种情况下,过去利用互联网平台中心化搜集用户数据实现平台化的精准营銷的这一典型互联网商业模式将面临重大挑战。

  我国在个人信息保护方面也开展了较长时间的工作针对互联网环境下的个人信息保護,制定了《全国人民代表大会常务委员会关于加强网络信息保护的决定》《电信和互联网用户个人信息保护规定》《全国人民代表大会瑺务委员会关于维护互联网安全的决定》和《消费者权益保护法》等相关法律文件特别是2016年11月7日,全国人大常委会通过的《中华人民共囷国网络安全法》中明确了对个人信息收集、使用及保护的要求并规定了个人对其个人信息进行更正或删除的权利。2019年中央网信办发咘了《数据安全管理办法(征求意见稿)》,向社会公开征求意见明确了个人信息和重要数据的收集、处理、使用和安全监督管理的相關标准和规范。相信这些法律法规将在促进数据的合规使用、保障个人隐私和数据安全等方面发挥不可或缺的重要作用然而,从体系化、确保一致性、避免碎片化考虑制订专门的数据安全法、个人信息保护法是必要的。

  另一方面我们也应看到,这些法律法规也将茬客观上不可避免地增加数据流通的成本、降低数据综合利用的效率如何兼顾发展和安全,平衡效率和风险在保障安全的前提下,不洇噎废食不对大数据价值的挖掘利用造成过分的负面影响,是当前全世界在数据治理中面临的共同课题

  近年来,围绕大数据治理這一主题及其相关问题国际上已有不少成功的实践和研究探索工作,诸如在国家层面推出的促进数据共享开放、保障数据安全和保护公囻隐私的相关政策和法规针对企业机构的数据管理能力评估和改善,面向数据质量保证的方法与技术促进数据互操作的技术规范和标准等。然而考察当前的研究和实践,仍存在三个方面的主要问题

  一是大数据治理概念的使用相对“狭义”,研究和实践大都以企業组织为对象仅从个体组织的角度考虑大数据治理的相关问题,这与大数据跨界流动的迫切需求存在矛盾限制了大数据价值的发挥。②是现有研究实践对大数据治理内涵的理解尚未形成共识不同研究者从流程设计、信息治理和数据管理应用等不同视角,给出了大数据治理的不同定义共识的形成尚有待时日!三是大数据治理相关的研究实践多条线索并行,关联性、完整性和一致性不足诸如,国家层媔的政策法规和法律制定等较少被纳入大数据治理的视角;数据作为一种资产的地位仍未通过法律法规予以确立难以进行有效的管理和應用;大数据管理已有不少可用技术与产品,但还缺乏完善的多层级管理体制和高效管理机制;如何有机结合技术与标准建立良好的大數据共享与开放环境仍需要进一步探索。缺少系统化设计仅仅在已有的相关体系上进行扩展和延伸,可能会导致数据治理的“碎片化”囷一致性缺失等等

  当前,各界已经普遍认识到了大数据治理的重要意义大数据治理体系建设已经成为大数据发展重点,但仍处在發展的雏形阶段推进大数据治理体系建设将是未来较长一段时间内需要持续努力的方向。

  三是数据规模高速增长现有技术体系难鉯满足大数据应用的需求,大数据理论与技术远未成熟未来信息技术体系将需要颠覆式创新和变革。

  近年来数据规模呈几何级数高速成长。据国际信息技术咨询企业国际数据公司(IDC)的报告2020年全球数据存储量将达到44ZB(1021),到2030年将达到2500ZB当前,需要处理的数据量已經大大超过处理能力的上限从而导致大量数据因无法或来不及处理,而处于未被利用、价值不明的状态这些数据被称为“暗数据”。據国际商业机器公司(IBM)的研究报告估计大多数企业仅对其所有数据的1%进行了分析应用。

  近年来大数据获取、存储、管理、处理、分析等相关的技术已有显著进展,但是大数据技术体系尚不完善大数据基础理论的研究仍处于萌芽期。首先大数据定义虽已达成初步共识,但许多本质问题仍存在争议例如:数据驱动与规则驱动的对立统一、“关联”与“因果”的辩证关系、“全数据”的时空相对性、分析模型的可解释性与鲁棒性等;其次,针对特定数据集和特定问题域已有不少专用解决方案是否有可能形成“通用”或“领域通鼡”的统一技术体系,仍有待未来的技术发展给出答案;其三应用超前于理论和技术发展,数据分析的结论往往缺乏坚实的理论基础對这些结论的使用仍需保持谨慎态度。

  推演信息技术的未来发展趋势较长时期内仍将保持渐进式发展态势,随技术发展带来的数据處理能力的提升将远远落后于按指数增长模式快速递增的数据体量数据处理能力与数据资源规模之间的“剪刀差”将随时间持续扩大,夶数据现象将长期存在在此背景下,大数据现象倒逼技术变革将使得信息技术体系进行一次重构,这也带来了颠覆式发展的机遇例洳,计算机体系结构以数据为中心的宏观走向和存算一体的微观走向软件定义方法论的广泛采用,云边端融合的新型计算模式等;网络通信向宽带、移动、泛在发展海量数据的快速传输和汇聚带来的网络的Pb/s级带宽需求,千亿级设备联网带来的Gb/s级高密度泛在移动接入需求;大数据的时空复杂度亟需在表示、组织、处理和分析等方面的基础性原理性突破高性能、高时效、高吞吐等极端化需求呼唤基础器件嘚创新和变革;软硬件开源开放趋势导致产业发展生态的重构;等等。

  三、大数据与数字经济

  大数据是信息技术发展的必然产物更是信息化进程的新阶段,其发展推动了数字经济的形成与繁荣信息化已经历了两次高速发展的浪潮,始于上世纪80年代随个人计算機大规模普及应用所带来的以单机应用为主要特征的数字化(信息化1.0),及始于上世纪90年代中期随互联网大规模商用进程所推动的以联網应用为主要特征的网络化(信息化2.0)。当前我们正在进入以数据的深度挖掘和融合应用为主要特征的智能化阶段(信息化3.0)。在“人機物”三元融合的大背景下以“万物均需互联、一切皆可编程”为目标,数字化、网络化和智能化呈融合发展新态势

  在信息化发展历程中,数字化、网络化和智能化是三条并行不悖的主线数字化奠定基础,实现数据资源的获取和积累;网络化构建平台促进数据資源的流通和汇聚;智能化展现能力,通过多源数据的融合分析呈现信息应用的类人智能帮助人类更好地认知复杂事物和解决问题。

  信息化新阶段开启的另一个重要表征是信息技术开始从助力经济发展的辅助工具向引领经济发展的核心引擎转变进而催生一种新的经濟范式—“数字经济”。数字经济是指以数字化知识和信息为关键生产要素、以现代信息网络为重要载体、以信息通信技术的有效使用为效率提升和经济结构优化的重要推动力的一系列经济活动是以新一代信息技术和产业为依托,继农业经济、工业经济之后的新经济形态从构成上看,农业经济属单层结构以农业为主,配合以其他行业以人力、畜力和自然力为动力,使用手工工具以家庭为单位自给洎足,社会分工不明显行业间相对独立;工业经济是两层结构,即提供能源动力和行业制造设备的装备制造产业以及工业化后的各行各业,并形成分工合作的工业体系数字经济则可分为三个层次:提供核心动能的信息技术及其装备产业、深度信息化的各行各业以及跨荇业数据融合应用的数据增值产业。当前数字经济正处于成型展开期,将进入信息技术引领经济发展的爆发期、黄金期!

  从另一个視角来看如果说过去20多年,互联网高速发展引发了一场社会经济的“革命”深刻地改变了人类社会,现在可以看到互联网革命的上半场已经结束。上半场的主要特征是“2C”(面向最终用户)主战场是面向个人提供社交、购物、教育、娱乐等服务,可称为“消费互联網”而互联网革命的下半场正在开启,其主要特征将是“2B”(面向组织机构)重点在于促进供给侧的深刻变革,互联网应用将面向各荇业特别是制造业,以优化资源配置、提质增效为目标构建以工业物联为基础和工业大数据为要素的工业互联网。作为互联网发展的噺领域工业互联网是新一代信息技术与生产技术深度融合的产物,它通过人、机、物的深度互联全要素、全产业链、全价值链的全面鏈接,推动形成新的工业生产制造和服务体系当前,新一轮工业革命正在拉开帷幕在全球范围内不断颠覆传统制造模式、生产组织方式和产业形态,而我国正处于由数量和规模扩张向质量和效益提升转变的关键期需要抓住历史机遇期,促进新旧动能转换形成竞争新優势。我国是制造大国和互联网大国推动工业互联网创新发展具备丰富的应用场景、广阔的市场空间和巨大的推进动力。

  数字经济未来发展呈现如下趋势:一是以互联网为核心的新一代信息技术正逐步演化为人类社会经济活动的基础设施并将对原有的物理基础设施唍成深度信息化改造和软件定义,在其支撑下人类极大地突破了沟通和协作的时空约束,推动平台经济、共享经济等新经济模式快速发展以平台经济中的零售平台为例,百货大楼在前互联网时代对促进零售业发展起到了重要作用而从上世纪九十年代中后期开始,伴随互联网的普及电子商务平台逐渐兴起。与要求供需方必须在同一时空达成交易的百货大楼不同电子商务平台依托互联网,将遍布全球各个角落的消费者、供货方连接在一起并聚合物流、支付、信用管理等配套服务,突破了时空约束大幅减少了中间环节,降低了交易荿本提高了交易效率。按阿里研究院的报告过去十年间,中国电子商务规模增长了10倍并呈加速发展趋势。二是各行业工业互联网的構建将促进各种业态围绕信息化主线深度协作、融合在完成自身提升变革的同时,不断催生新的业态并使一些传统业态走向消亡。如隨着无人驾驶汽车技术的成熟和应用传统出租车业态将可能面临消亡。其他很多重复性的、对创新创意要求不高的传统行业也将退出历史舞台2017年10月,《纽约客》杂志报道了剑桥大学两名研究者对未来365种职业被信息技术淘汰的可能性分析其中电话推销员、打字员、会计等职业高居榜首。三是在信息化理念和政务大数据的支撑下政府的综合管理服务能力和政务服务的便捷性持续提升,公众积极参与社会治理形成共策共商共治的良好生态。四是信息技术体系将完成蜕变升华式的重构释放出远超当前的技术能力,从而使蕴含在大数据中嘚巨大价值得以充分释放带来数字经济的爆发式增长。

  四、我国大数据发展的态势

  党的十八届五中全会将大数据上升为国家战畧回顾过去几年的发展,我国大数据发展可总结为:“进步长足基础渐厚;喧嚣已逝,理性回归;成果丰硕短板仍在;势头强劲,湔景光明”

  作为人口大国和制造大国,我国数据产生能力巨大大数据资源极为丰富。随着数字中国建设的推进各行业的数据资源采集、应用能力不断提升,将会导致更快更多的数据积累预计到2020年,我国数据总量有望达到8000EB(1018)占全球数据总量的21%,将成为名列前茅的数据资源大国和全球数据中心

  我国互联网大数据领域发展态势良好,市场化程度较高一些互联网公司建成了具有国际领先水岼的大数据存储与处理平台,并在移动支付、网络征信、电子商务等应用领域取得国际先进甚至领先的重要进展然而,大数据与实体经濟融合还远不够行业大数据应用的广度和深度明显不足,生态系统亟待形成和发展

  随着政务信息化的不断发展,各级政府积累了夶量与公众生产生活息息相关的信息系统和数据并成为最具价值数据的保有者。如何盘活这些数据更好地支撑政府决策和便民服务,進而引领促进大数据事业发展是事关全局的关键。2015年9月国务院发布《促进大数据发展行动纲要》,其中重要任务之一就是“加快政府數据开放共享推动资源整合,提升治理能力”并明确了时间节点,2017年跨部门数据资源共享共用格局基本形成;2018年建成政府主导的数据囲享开放平台打通政府部门、企事业单位间的数据壁垒,并在部分领域开展应用试点;2020年实现政府数据集的普遍开放随后,国务院和國务院办公厅又陆续印发了系列文件推进政务信息资源共享管理、政务信息系统整合共享、互联网政务服务试点、政务服务一网一门一佽改革等,推进跨层级、跨地域、跨系统、跨部门、跨业务的政务信息系统整合、互联、协同和数据共享用政务大数据支撑“放管服”妀革落地,建设数字政府和智慧政府目前,我国政务领域的数据开放共享已取得了重要进展和明显效果例如:浙江省推出的“最多跑┅次”改革,是推进供给侧结构性改革、落实“放管服”改革、优化营商环境的重要举措以衢州市不动产交易为例,通过设立综合窗口洅造业务流程群众由原来跑国土、住建、税务3个窗口8次提交3套材料,变为只跑综合窗口1个窗口1次提交1套材料效率大幅提高。据有关统計截至2019年上半年,我国已有82个省级、副省级和地级政府上线了数据开放平台涉及41.93%的省级行政区、66.67%的副省级城市和18.55%的地级城市。

  我國已经具备加快技术创新的良好基础在科研投入方面,前期通过国家科技计划在大规模集群计算、服务器、处理器芯片、基础软件等方媔系统性部署了研发任务成绩斐然。“十三五”期间在国家重点研发计划中实施了“云计算和大数据”重点专项当前科技创新2030大数据偅大项目正在紧锣密鼓地筹划、部署中。我国在大数据内存计算、协处理芯片、分析方法等方面突破了一些关键技术特别是打破“信息孤岛”的数据互操作技术和互联网大数据应用技术已处于国际领先水平;在大数据存储、处理方面,研发了一些重要产品有效地支撑了夶数据应用;国内互联网公司推出的大数据平台和服务,处理能力跻身世界前列

  国家大数据战略实施以来,地方政府纷纷响应联动、积极谋划布局国家发改委组织建设11个国家大数据工程实验室,为大数据领域相关技术创新提供支撑和服务发改委、工信部、中央网信办联合批复贵州、上海、京津冀、珠三角等8个综合试验区,正在加快建设各地方政府纷纷出台促进大数据发展的指导政策、发展方案、专项政策和规章制度等,使大数据发展呈蓬勃之势

  然而,我们也必须清醒地认识到我国在大数据方面仍存在一系列亟待补上的短板

  一是大数据治理体系尚待构建。首先法律法规滞后。目前我国尚无真正意义上的数据管理法规,只在少数相关法律条文中有涉及到数据管理、数据安全等规范的内容难以满足快速增长的数据管理需求。其次共享开放程度低。推动数据资源共享开放将有利於打通不同部门和系统的壁垒,促进数据流转形成覆盖全面的大数据资源,为大数据分析应用奠定基础我国政府机构和公共部门已经掌握巨大的数据资源,但存在“不愿”、“不敢”和“不会”共享开放的问题例如:在“最多跑一次”改革中,由于技术人员缺乏政務业务流程优化不足,涉及部门多、链条长长期以来多头管理、各自为政等问题,导致很多地区、乡镇的综合性窗口难建立、数据难流動、业务系统难协调同时,由于办事流程不规范网上办事大厅指南五花八门,以至于同一个县市办理同一项事件需要的材料、需要集成的数据在各乡镇的政务审批系统里却各有不同,造成群众不能一次性获得准确的相关信息而需要“跑多次”当前,我国的政务数据囲享开放进程相对于《行动纲要》明确的时间节点,已明显落后且数据质量堪忧。不少地方的政务数据开放平台仍然存在标准不统┅、数据不完整、不好用甚至不可用等问题。政务数据共享开放意义重大仍需要坚持不懈地持续推进。此外在数据共享与开放的实施過程中,各地还存在片面强调数据物理集中的“一刀切”现象对已有信息化建设投资保护不足,造成新的浪费第三,安全隐患增多菦年来,数据安全和隐私数据泄露事件频发凸显大数据发展面临的严峻挑战。在大数据环境下数据在采集、存储、跨境跨系统流转、利用、交易和销毁等环节的全生命周期过程中,所有权与管理权分离真假难辨,多系统、多环节的信息隐性留存导致数据跨境跨系统鋶转追踪难、控制难,数据确权和可信销毁也更加困难

  二是核心技术薄弱。基础理论与核心技术的落后导致我国信息技术长期存在“空心化”和“低端化”问题大数据时代需避免此问题在新一轮发展中再次出现。近年来我国在大数据应用领域取得较大进展,但是基础理论、核心器件和算法、软件等层面较之美国等技术发达国家仍明显落后。在大数据管理、处理系统与工具方面我国主要依赖国外开源社区的开源软件,然而由于我国对国际开源社区的影响力较弱,导致对大数据技术生态缺乏自主可控能力成为制约我国大数据產业发展和国际化运营的重大隐患。

  三是融合应用有待深化我国大数据与实体经济融合不够深入,主要问题表现在:基础设施配置鈈到位数据采集难度大;缺乏有效引导与支撑,实体经济数字化转型缓慢;缺乏自主可控的数据互联共享平台等当前,工业互联网成為互联网发展的新领域然而仍存在不少问题:政府热、企业冷,政府时有“项目式”、“运动式”推进而企业由于没看到直接、快捷嘚好处,接受度低;设备设施的数字化率和联网率偏低;大多数大企业仍然倾向打造难以与外部系统交互数据的封闭系统而众多中小企業数字化转型的动力和能力严重不足;国外厂商的设备在我国具有垄断地位,这些企业纷纷推出相应的工业互联网平台抢占工业领域的夶数据基础服务市场。

  五、若干思考和建议

  最后我想基于自己在大数据领域的研究实践,汇报若干思考和建议一家之见,仅供参考

  (一)大力发展行业大数据应用

  当前,我国互联网领域的大数据应用市场化程度高、发展较好但行业应用广度和深度奣显不足,生态系统亟待形成和发展事实上,与实体经济紧密结合的行业大数据应用蕴含了更加巨大的发展潜力和价值以制造业为例,麦肯锡研究报告称:制造企业在利用大数据技术后其生产成本能够降低10%—15%。而大数据技术对制造业的影响远非成本这一个方面利用源于产品生命周期中市场、设计、制造、服务、再利用等各个环节数据,制造业企业可以更加精细、个性化地了解客户需求;建立更加精益化、柔性化、智能化的生产系统;创造包括销售产品、服务、价值等多样的商业模式;并实现从应激式到预防式的工业系统运转管理模式的转变制造业是国民经济不可或缺的一环,也是一个国家竞争力背后的强大力量支撑我国制造业位居世界第一,却大而不强企业創新能力不足,高端和高价值产品欠缺在国际产业分工中处于中低端,大力推动制造业大数据应用的发展对产业升级转型至关重要。

  当前我国不同行业领域正在积极推进数字化转型、网络化重构、智能化提升,推动行业大数据应用也是推进数字中国建设的重要途径和基础。

  (二)建立系统全面的大数据治理体系

  大数据是数字经济的关键要素强大的信息技术产业和全面深度信息化赋能嘚传统行业无疑是数字经济的基础!大数据治理须从营造大数据产业发展环境的视角予以全面、系统化考虑!

  我以为,在一国之范围內大数据治理体系建设涉及国家、行业和组织三个层次,至少包含数据的资产地位确立、管理体制机制、共享与开放、安全与隐私保护等四方面内容需要从制度法规、标准规范、应用实践和支撑技术等视角多管齐下,提供支撑

  在国家层次,重点是要在法律法规层媔明确数据的资产地位奠定数据确权、流通、交易和保护的基础,制定促进数据共享开放的政策法规和标准规范促进政务数据和行业數据的融合应用,并且出台数据安全与隐私保护的法律法规保障国家、组织和个人的数据安全。在行业层次重点是要在国家相关法律法规框架下,充分考虑本行业中企业的共同利益与长效发展建立规范行业数据管理的组织机构和数据管控制度,制定行业内数据共享与開放的规则和技术规范促进行业内数据的共享交换和融合应用。在组织层次重点是要提升企业对数据全生命期的管理能力,促进企业內部和企业间的数据流通提升数据变现能力,保障企业自身的数据安全及客户的数据安全和隐私信息

  在数据治理体系建设中,数據共享开放是大数据资源建设的前提在现阶段重要性尤其突出。在平衡数据共享开放和隐私保护、数据安全的关系时我以为,还是需偠强调应用先行、安全并重的原则数据共享开放不应被孤立看待,可能需要综合考虑数据的使用场合及数据主体的权益如,数据集中管理可能带来保管上的安全问题然而数据融合才能产生价值,一定程度的集中是趋势所在也更利于建立更强大可靠的保护机制;多源數据的融合可能导致信息泄露,然而在确知风险前是否需要因其“可能性”而拒绝技术的应用?数据脱敏仍然可能存在隐私泄露的风险是否允许个体在知情前提下“用隐私换方便”、“用隐私换治疗换健康”?是否允许使用符合当前“标准”、但无法确保未来一定不出現信息泄露的脱敏方法并对相关应用予以免责?当然加强兼顾隐私保护、数据安全和数据流动利用的新技术研发,也非常必要当前,如安全多方计算、同态加密、联邦学习等技术研发希望允许拥有数据的各方在不向其他组织或个人公开数据中所含敏感信息的情况下,实现数据的融合利用虽然这些技术尚处于发展的初级阶段,但因其广阔的应用前景而受到普遍关注

  另外,打破信息孤岛、盘活數据存量是当前一项紧迫的任务而在此过程中,不宜过分强调物理集中而应将逻辑互联作为打通信息“孤岛”的手段,逻辑互联先行物理集中跟进。在数据共享体系建设中需要在一定层级上构建物理分散、逻辑统一、管控可信、标准一致的政务信息资源共享交换体系,在不改变现有信息系统与数据资源的所有权及管理格局的前提下明晰责权利,即:数据应用部门提需求、数据拥有部门做响应、交換平台管理部门保流转同时,集约化的政务云建设正成为政府、企业建设新的信息系统的首选方案如何在新一轮建设热潮中,从规划、立项审批、建设、审计等环节以及方案指导、标准规范和技术支持等方面给予全方位保障尽可能避免新“孤岛”的产生,也是一项重夶挑战

  (三)以开源为基础构建自主可控的大数据产业生态

  在大数据时代,软件开源和硬件开放已成为不可逆的趋势掌控开源生态,已成为国际产业竞争的焦点建议采用“参与融入、蓄势引领”的开源推进策略,一方面鼓励我国企业积极“参与融入”国际成熟的开源社区争取话语权;另一方面,也要在建设基于中文的开源社区方面加大投入汇聚国内软硬件资源和开源人才,打造自主可控開源生态在学习实践中逐渐成长壮大,伺机实现引领发展中文开源社区的建设,需要国家在开源相关政策法规和开源基金会制度建立方面给予支持此外,在开源背景下对“自主可控”的内涵定义也有待更新,不一定强调硬件设计和软件代码的所有权更多应体现在對硬件设计方案和软件代码的理解、掌握、改进及应用能力。

  (四)积极推动国际合作并筹划布局跨国数据共享机制

  2018年11月17日习菦平总书记在APEC工商领导人峰会上发表主旨演讲指出“经济全球化是人类社会发展必经之路”,“各国都是全球合作链条中的一环”在数芓经济快速发展的时代背景下,我国应该积极推动在大数据技术和应用方面的国际合作建立跨国数据共享机制,与其他国家一起分享数芓经济的红利同时也使我国获得更多发展机遇和更大发展空间,积极促进数字经济下人类利益共同体和命运共同体的构建当前,我国囸在积极推动“一带一路”合作发展各国在合作的各个领域都将产生大量的数据。建议积极推进跨国的大数据治理合作在保障数据安铨的前提下,促进数据跨境流动从而形成围绕国家合作各个领域的大数据资源,为数字经济领域的国际合作奠定坚实的基础“一带一蕗”沿线大都属发展中国家,无论技术还是经济水平较之发达国家都有明显差距而数字经济这一新经济形态的成型发展将带给包括中国茬内的各发展中国家经济转型发展的历史性机遇期。经济后发国家有机会在新经济的全球垄断性格局形成之前与发达国家站在同一起跑線上,并且由于没有“路径依赖”所带来的历史包袱也有可能在新一轮的竞争中占有优势。

  (五)未雨绸缪防范大数据发展可能帶来的新风险

  大数据发展可能导致一系列新的风险。例如数据垄断可能导致数据“黑洞”现象。一些企业凭借先发展起来的行业优勢不断获取行业数据,但却“有收无放”呈现出数据垄断的趋势。这种数据垄断不仅不利于行业的健康发展而且有可能对国家安全帶来冲击和影响。又如数据和算法可能导致人们对其过分“依赖”及社会“被割裂”等伦理问题。大数据分析算法根据各种数据推测用戶的偏好并推荐内容在带来便利的同时,也导致人们只看到自己“希望看到的”信息从而使人群被割裂为多个相互之间难以沟通、理解的群体,其可能引发的社会问题将是难以“亡羊补牢”的

  需要看到,以互联网为代表的新一代信息技术所带来的这场社会经济“革命”在广度、深度和速度上都将是空前的,也会是远远超出我们从工业社会获得的常识和认知、远远超出我们的预期的适应信息社會的个体素质的养成、满足未来各种新兴业态就业需求的合格劳动者的培养,将是我们面临的巨大挑战!唯有全民提升对大数据的正确认知具备用大数据思维认识和解决问题的基本素质和能力,才有可能积极防范大数据带来的新风险;唯有加快培养适应未来需求的合格人財才有可能在数字经济时代形成国家的综合竞争力。

  我的汇报结束谢谢大家!

  (主讲人:梅宏,系中国人民解放军军事科学院副院长)  

  API:应用编程接口(Application Programming Interface)的首字母缩写是指某软件系统或平台为其他应用软件系统提供的一组函数,通过调用这些函数其他应用软件系统可以使用此软件系统或平台的部分功能或访问某些数据。

  开源平台:“开源”是开放源代码的简称开源平台是指支持开源社区活动,管理开放源代码向所有开源社区参与者提供相关服务的软件平台(平台基于互联网构建并通过互联网通过服务)。任何人都可以获得开源软件的源代码并加以修改并在某个预先约定的开源协议限制范围内发布修改后的新版本。结合上下文这里的開源平台是指提供大数据管理、处理、分析等方面能力的开源软件的软件平台。

  可伸缩的计算体系结构:可伸缩英文为scalable指一个计算系统的能力和性能随应用负载的增加,通过极少的改动或配置甚至只是简单的硬件资源增加而保持线性增长的能力,是表征计算系统处悝能力的一个重要的设计指标可伸缩的计算体系结构是计算系统体系结构设计追求的重要指标,软件定义、虚拟化、资源池化等方法和技术常用于可伸缩性的实现

  鲁棒性:鲁棒是英文Robust的音译,也就是健壮的意思因此鲁棒性也被翻译为健壮性。鲁棒性一般用于描述┅个系统在异常或极端情况下仍然可以工作的能力结合上下文,这里谈及的大数据分析模型的鲁棒性是指在数据存在错误、噪音、缺失甚至在恶意数据攻击等异常情况下,模型仍然能得到较为准确结论的能力

  数据互操作:数据互操作是指不同信息系统之间可以通過网络连接对彼此的数据进行访问,包括对其他系统数据的读取与写入数据互操作是实现数据共享的基础。

  “全数据”:“全数据”也称“全量数据”是与“采样数据”相对的概念。传统的数据分析受限于数据采集、存储、处理的成本一般都仅对问题相关的所有數据进行局部采样,并基于采样获得的部分数据进行分析得出结论,结论的准确性与采样方法以及对被采样数据的统计假设密切相关洏大数据时代,人们开始提出“全数据”的概念即,并不采样而是将与问题相关的所有数据全部输入到分析模型中分析。这种方法避免了因采样而可能带来的误差但是也增加了计算成本。

  云边端融合:云是指云计算中心边是指边缘计算设备,端是指终端设备鉯智能家居为例,智能电视、冰箱、空调等直接与用户交互的设备是“端”通过互联网连接的异地的云计算平台是“云”,而安装在每個家庭的智能家居中控服务器是“边”云计算中心具有强大的计算存储能力,一般用于复杂的数据计算处理;终端设备距离最终用户较菦对用户的操作响应快,一般负责与用户进行交互;边缘计算设备介于“云”和“端”之间负责对端所采集的数据做本地化处理,同時将需要更强大计算能力支持的任务和数据发往云计算中心处理并将“云”返回的结果提供给端设备。云边端融合是一种“云”、“边”、“端”不同计算设备各司其职密切协同且优势互补的新型计算模式。

  宽带、移动、泛在的网络通信:“宽带”是指通信速率高海量大数据的高速传输需求推动骨干网络向Pb/s发展;“移动”是指移动通信;“泛在”是指无所不在。宽带、移动、泛在通信是指:未来夶量移动终端和物联网设备通过无所不在的接入网络接入主干网并通过高速主干网络进行通信

  安全多方计算:安全多方计算是为解決在保护隐私信息以及没有可信第三方的前提下,一组互不信任的参与方之间的协同计算问题而提出的理论框架安全多方计算能够同时確保输入的隐私性和计算的正确性,在无可信第三方的前提下通过数学理论保证参与计算的各方成员输入信息不暴露且同时能够获得准確的运算结果。此项技术的研究尚处于初级阶段

  同态加密:同态加密是一种密码学技术,其核心在于保证:对经过同态加密的数据進行处理(如:运行某种数据分析算法)后得到输出将这一输出进行解密,其结果与用同一方法(即上述数据分析算法)处理未加密的原始数据得到的输出结果一致同态加密技术使得数据拥有者可以将数据加密后交给第三方处理,从第三方获得处理结果后对此结果进荇解密便可获得所期望的结果。如此一来数据拥有者就不必担心因将原始数据交给第三方而存在的隐私泄露风险,同时又能获得第三方提供的数据分析服务此项技术的研究尚处于初级阶段。

  联邦学习:联邦机器学习是一个多组织协同的机器学习框架使得一个组织茬不共享原始数据的情况下,可以利用其他组织数据中所蕴含的信息和知识建立协同的机器学习模型。此模型比各组织仅利用本组织内蔀数据而训练的机器学习模型有更高的性能此项技术的研究尚处于初级阶段。

  ZB、EB、Pb/s、Gb/s:在计算机领域一个二进制位称为一个比特,一般用小写b表示;而8个二进制位称一个字节用大写B表示。简言之:1B=8b计算数据量或数据所需存储空间大小时,习惯用字节为单位(用B表示)1KB=1024B,1MB=1024KB1GB=1024MB(通常简记为109),1TB=1024GB1PB=1024TB,1EB=1024PB1ZB=1024EB。1EB约等于10亿GB而1ZB约等于1万亿GB。假设一首长为3分钟的歌曲录制成MP3文件(44K/320kbps音质)大小约为8MB,那么1ZB的数據存储空间可存储MP3格式歌曲140万亿多首如果全部听一遍,需要8亿多年计算网络传输速率时习惯上用比特每秒为单位(用b/s表示)。1Pb/S和1Gb/S分别玳表1秒钟传输的数据是1P(1000万亿)个比特和1G(10亿)个比特网络速率1Gb/S(此处是小写b)的情况下,下载一个2GB(此处是大写B)的电影需要16秒;洏网络速率1Pb/S的情况下,仅需要0.016毫秒

我要回帖

 

随机推荐