有七十组数据系列产生在行怎么设置，其中一组数据系列产生在行怎么设置有标记,抽取六组，得到有标记的概率是多少

你的位置：网站首页 >> 频道首页 >>大数据 >>有七十组数据系列产生在行怎么设置，其中一组数据系列产生在行怎么设置有标记,抽取六组，得到有标记的概率是多少

有七十组数据系列产生在行怎么设置，其中一组数据系列产生在行怎么设置有标记,抽取六组，得到有标记的概率是多少

来源：蜘蛛抓取(WebSpider) 时间：2021-01-17 13:05 标签：表格查找重复数据

什么是sap的星型结构能不能详细講解一下？

SAP BI 的星形结构是为了解决传统的星形结构存在的问题研发而成的在SAP BI 星形结构中，事实表中的事实指的是关键值维度属性指的昰特性。维度表通过外键或主键关系连接到中心的事实表与传统的星形结构相比特性不是维度表的组件，也就是说特性值没有存储在維度表中，维度表中存储的是SID每一个维度表有一个系统自动生成的数值型的关键值，称为维度键值主数据系列产生在行怎么设置信息存储在独立的表中，和信息立方体无关称为主数据系列产生在行怎么设置表。其中属性、文本和层级是分开存储的。

在SAP BI 中事实表及與其连接的维度表称为信息立方体。一个信息立方体包含一系列的关系型表格这些表在多维的基础上结合起来。换句话说信息立方体包含一个中心的事实表和几个围绕着的维度表。主数据系列产生在行怎么设置表通过SID 的方式连接到信息立方体(到事实表的关键值)

InfoCube正好包含一个事实表，在这个表中存储了关键值的值事实表最多可以包含233个关键值。InfoCube通常最少包含4个维度表最多包含16个。这些维度表中有13个昰客户创建的3个是SAP 提供的：单位维度表; 数据系列产生在行怎么设置包维度表; 时间维度表。客户自建维度表每个维度表下最多放248个特性InfoObject。

Cube的星型结构中SID技术的优点有哪些

首先第一个优点，因为SID是Int类型的Int类型的要比Char类型的查询速率快，所以适用SID技术以后报表的查询速率偠比以往的快；

其次第二个优点使用SID技术以后，就把主数据系列产生在行怎么设置独立出来了可以使主数据系列产生在行怎么设置被系统内所有的模型共用，符合软件工程里重复利用的规则

一，实现主数据系列产生在行怎么设置共享多个业务数据系列产生在行怎么設置公用一套主数据系列产生在行怎么设置，减少数据系列产生在行怎么设置冗余便于维护；

二，提高查询效率SID表中通过Int型保存数据系列产生在行怎么设置ID，Int查询数据系列产生在行怎么设置比Char更快

什么是BW的星型结构，与传统的星型结构的区别是什么

BW星形结构：中间┅张事实表，周围连接维度表维度表中存放了主数据系列产生在行怎么设置SID，通过主数据系列产生在行怎么设置SID连接到主数据系列产生茬行怎么设置的属性表文本表和层级表。

　　传统的星型模型是将主数据系列产生在行怎么设置与维度表放在一起BW扩展星形结构维度表里存储的不是主数据系列产生在行怎么设置本身，而是主数据系列产生在行怎么设置的SID通过SID连接到主数据系列产生在行怎么设置的属性，文本和层级通过SID，可以实现多语言支持主数据系列产生在行怎么设置共享。

SAP的星型结构相对于传统的星型结构优势

SAP的星型结构囷传统的星型结构是不同的，传统的星型结构是一个事实表关联多个维度表而SAP的星型结构是由关键值组成的数据系列产生在行怎么设置表关联少量的维度表，维度表里面放的是只是维度ID和SID然后再通过SID去关联文本表、属性表和层级表，也就是主数据系列产生在行怎么设置表SAP的星型结构相对于传统的星型结构优势如下：

1、通过自动生成的int4类型的SID可以比阿拉伯数字主键更加快速的访问到数据系列产生在行怎麼设置。

2、查询的性能提高了因为关键值可以存储在他们自己的事实表里面。

3、由于使用SID技术通过维度表来查找主数据系列产生在行怎麼设置使得多语言能力等模型成为可能。

4、使用SID技术从维度表中获得主数据系列产生在行怎么设置使用户可以在不同的信息立方体中使鼡主数据系列产生在行怎么设置也就是说，主数据系列产生在行怎么设置是信息立方体无关的可以重用。

Cube与DSO的效率问题谁的效率更高一些呢？

这里的效率指两方面一个是ETL抽取数据系列产生在行怎么设置的效率，一个是出报表查询数据系列产生在行怎么设置时的效率；如果比较DSO和Cube之间在ETL抽取数据系列产生在行怎么设置方面的效率DSO的效率会更高一些，因为DSO是简单的二维表结构并且如果使用写入优化嘚DSO数据系列产生在行怎么设置还可以不用生成SID表，数据系列产生在行怎么设置进入到DSO就会自动被激活；如果要比较 DSO和Cube之间在出报表时查询數据系列产生在行怎么设置方面的效率Cube的效率会更高一些，因为Cube是星型结构这种结构的查询效率会更高一些。

标准DSO和写入优化DSO的Active表有什么不同

这两种Active表的主键是不相同的，标准DSO的主键就是语义主键而写入优化DSO的主键却是技术性关健值（request、datapakid、record）。

Cube的查询效率为什么会仳DSO快呢

之所以cube比dso查询速度快，和它采用的SID机制分不开的众所周知integer是比char检索速度要快很多的；再就是cube的index，cube里的所有characteristics都是key都有索引，不嘫IO的效率就大大降低了

写入优化的：（不生成主数据系列产生在行怎么设置标识、不合并相同关键字段的值、速度快可用于存储大容量數据系列产生在行怎么设置）这种DSO类型，用来处理大量的数据系列产生在行怎么设置但后台也只对应ACTIVETABLE。通过DTP来更新数据系列产生在行怎麼设置每条数据系列产生在行怎么设置记录的技术关键值是惟一的，所以只进行数据系列产生在行怎么设置库的插入操作没有更新操莋。

优化的数据系列产生在行怎么设置存储对象的设置中以下的设置选项是特有的：语义的数据系列产生在行怎么设置存储键值不唯一。这一选项仅与写优化的数据系列产生在行怎么设置存储对象相关数据系列产生在行怎么设置表的技术关键字经常由数据系列产生在行怎么设置请求标识、数据系列产生在行怎么设置包和数据系列产生在行怎么设置记录号组成。我们定义DSO时指定的关键字段组成了写优化的數据系列产生在行怎么设置存储对象的语义键如果未设置此标识，那么系统检查语义关键字的惟一性并为关键字组合生成带有技术名称"KEY"嘚惟一索引出现任何相关键字组合的记录都会报错。如果设置了此标识那么数据系列产生在行怎么设置存储对象的数据系列产生在行怎么设置表可以包含几个带有相同组合键的记录，它们由技术关键值区别开来在报表的结果上，这些记录是相加的所以在转换规则中，只有汇总选项没有覆盖选项。

标准DSO需注意的问题

如果是激活业务内容的DSO然后复制出来作为自己的DSO使用的话，一般不需考虑关键字段嘚问题系统的设置一般会保证DSO数据系列产生在行怎么设置与PSA数据系列产生在行怎么设置完全一致，但如果是自己通过直接输入信息对象創建的DSO则需考虑值的合并，因为在标准DSO对于相同关键字段的值系统会自动合并这个时候需注意转换中的规则明细是覆盖还是合计，如果有合并的字段即DSO更新的数据系列产生在行怎么设置少于PSA的数据系列产生在行怎么设置，建议把转换中值字段的规则明细全部修改为合計以保证值的正确，总之在使用标准DSO时需考虑值的合并问题(项目中如何使用的)，并考虑转换的规则明细但使用写优化的DSO则不存在该問题

建议如果采用三层数据系列产生在行怎么设置模型架构的话，可考虑第一层使用写优化的DSO保证该层DSO数据系列产生在行怎么设置与PSA完铨一致，第二层DSO使用标准DSO第三层使用CUBE（颗粒度变粗），完全更新的数据系列产生在行怎么设置源情况下写优化DSO在新增数据系列产生在荇怎么设置时，会重复计算以前已抽取数据系列产生在行怎么设置在建立DSO时需仔细考虑DSO类型、数据系列产生在行怎么设置更新方式、DSO关鍵字段和数据系列产生在行怎么设置字段设置、以及转换中的明细规则中的集合设置为覆盖还是合计

Cube的优化方法都有哪些啊？

分区（物理汾区逻辑分区），聚集压缩，索引统计

如何优化InfoCube信息立方体

颗粒度尽量大：尽量不要在Cube里放太明细的数据系列产生在行怎么设置（即维度字段越小越好），这种需求首先考虑R3用ABAP解决如果非要在BW，可以考虑在DSO出明细报表在Cube出汇总报表，通过RRI接口调用明细报表
拆分哆个：当Cube的数据系列产生在行怎么设置量很大时，可以拆分成多个Cube,再用MultiProvider拼起来这样query会在N个Cube中并行，提高效率这就是所谓的逻辑分区。瑺见的分区方式有按年月按国家，按BU按类型等。
索引：数据系列产生在行怎么设置库的索引可以加快查询速度
分区：对于很大的Cube可鉯做partition,这是物理分区，只支持按时间分区
聚集：使用Aggregation可以提高性能。但是Aggregation本身是cube的一个子集提高性能的同时也加大了数据系列产生在行怎么设置冗余，所以不要用太多
使用MP：维度设计上，避免很多数据系列产生在行怎么设置量很大char.放在一个维度上（多对多的不要放在一個维度里）因为这样会让维度表变得很大。通常尽可能拆分成更多的维度（不过维度太多会导致 fact table巨大，所以要做好平衡）然后在multiprovider 层媔，把相关（指业务意义上的相关）的char都放一个维度里然后做好Mapping，这样即可以让用户更容易理解MultiProvider下层CUBE维度的从技术角度拆分与组合（按1:1或1:N的放在一起的原则）提高了性能，两全其美
Line item Dimension：对于material等很大的主数据系列产生在行怎么设置，使用Line item Dimension（即将M：N多对多的字段让他们一個人一个维度，这样自然就成了行项目维度了提高性能）.
BIA:使用BIA是比Aggregation更有效的方法，就是要花不少钱

Cube优化方法中的Partition（分区）是什么意思？

Partition分物理分区和逻辑分区，物理分区是为了把F或者E表的数据系列产生在行怎么设置分散在几个表里一般是按照年、月区分，可以减少Data Manager嘚时间逻辑分区则是拆分成几个小cube，使用M-Cube整合起来由于M-Cube是并行检索的，可以大大提高效率

信息立方体Infocube为什么查询快

需要注意的是，洳果INFOCUBE的数据系列产生在行怎么设置发生了变化同时又创建了聚集，这是需要执行ROLLUP功能保证更新的数据系列产生在行怎么设置及时同步箌聚集表。

BW Query中不显示去年的同期数据系列产生在行怎么设置怎么解决这个问题啊？

首先你要检查一下数据系列产生在行怎么设置看看數据系列产生在行怎么设置有没有问题，如果数据系列产生在行怎么设置没有问题有去年同期的数据系列产生在行怎么设置，这时你可鉯在Query中用时间特性来限制关键值在时间特性上新建一个时间变量，同时要设置时间变量的偏移量为-12 但是要注意一点，过滤器中的时间限制条件一定要拿掉否则偏移量不起作用，因为过滤器中的条件限制优先级最高

关键值下的“累计值/非累计值”是什么意思？

1) 累计值使用这一选项的关键值是一个自身存储数据系列产生在行怎么设置的字段，在运行查询或报表时系统会按照"集合"子窗口的设置将相应嘚值加总或平均，这也是最常见的设置

2) 带非累计值更改的非累计值。使用这一选项的关键值是一个非累计值自身并不存储数据系列产苼在行怎么设置，但是它带有一个附加关键值这一附加的关键值是存储数据系列产生在行怎么设置的，表示的是非累计值的增量变化非累计关键值的取值为附加关键值的累计结果。

3) 带流入和流出的非累计值使用这一选项非累计值带有两个附加关键值，分别表示非累计徝的流入和流出的值其取值为这两个附加关键值的累计结果。

处理链加载本地数据系列产生在行怎么设置报错有什么解决方法？

肯定會报错因为处理链是不能加载本地数据系列产生在行怎么设置的，要加载本地的数据系列产生在行怎么设置只能手动加载

在BEx报表设计Φ，只能选取一个InfoProvider作为数据系列产生在行怎么设置池来构建报表如果所需要的数据系列产生在行怎么设置放在了多个DSO或者多个Cube中，那么僦需要一个工具把这些InfoProvider当中的数据系列产生在行怎么设置集中到一起变成一个InfoProvider这个工具就是MultiProvider或InfoSet。

特征分为属性和文本请问这个文本是鼡来干什么的啊？

特征分为属性和文本属性是用来限制特征的，而文本从根本上来说就是用来替代ID号的在Cube里面特征都是以ID号数字类型嘚形式存储的，但是在报表里面必须要给用户以文本类型显示如果只显示ID号，谁也不会明白某个ID号具体代表的是什么意思所以就有了攵本这个概念。

做增量的时候Tcode：LBWE下集中更新模式的区别是什么啊？

Direct Delta：这就是一种V1模式数据系列产生在行怎么设置同步更新到增量队列，这种模式系统负荷很重特别是对于业务量大的凭证，通过RSA7可以直接查看增量数据系列产生在行怎么设置；

Queued Delta：类似于V3的更新模式与V3更噺的区别在于，增量数据系列产生在行怎么设置首先被收集到一个抽取队列中（V1模式）此时可以通过LBWQ查看增量数据系列产生在行怎么设置，然后通过一步Job操作增量数据系列产生在行怎么设置被送到增量队列中（V3模式）此时可以通过RSA7查看；

Unserialized V3 Update：此模式与Queued Delta模式类似，唯一的区別是增量队列中的数据系列产生在行怎么设置是无序的而Queued Delta中的数据系列产生在行怎么设置是排序的，这个对于采用覆盖模式的模型来说昰最致命的所以如果更新目标是DSO的话，还是不要采用这种模式通过SM13可以查看增量数据系列产生在行怎么设置。

V1同步更新模式即凭证產生就更新增量，与业务数据系列产生在行怎么设置同步更新；

V2异步更新模式就如同一个两步的操作一样，业务凭证产生以后第一步哽新业务数据系列产生在行怎么设置源，第二步更新增量表也就是说业务数据系列产生在行怎么设置源和增量表是异步更新的；

V3异步更噺模式，也是两步操作业务凭证产生以后首先更新业务数据系列产生在行怎么设置源，然后再更新增量表与V2的区别在于它的更新是通過后台事件来触发的，即定一个任务定时收集增量并更新至增量表

在BW当中，InfoCube的访问机制是怎样的

简单来讲，INFOCUBE的访问机制如下：

第一步：访问系统的查询CACHE类似于数据系列产生在行怎么设置库的查询Cahce的机制，主要是针对相同查询条件的查询能直接从内存读取；

第二步：INFOCUBE如果有聚集表则优先查询聚集表，如某一聚集表满足给定的查询条件则从聚集表里查询，聚集表存储的是infocube的数据系列产生在行怎么设置孓集能大大提高查询速度；

第三步：如以上两步均不满足，只能到INFOCUBE里查询

需要注意的是，如果INFOCUBE的数据系列产生在行怎么设置发生了变囮同时又创建了聚集，这是需要执行ROLLUP功能保证更新的数据系列产生在行怎么设置及时同步到聚集表。

BW数据系列产生在行怎么设置源增強的步骤

两步：第一步，增强数据系列产生在行怎么设置源的提取结构就是在需要做增强的数据系列产生在行怎么设置源上增加需要嘚字段，注意这里是把已经做好的字段Append到原有的数据系列产生在行怎么设置源结构上而不是更改原有数据系列产生在行怎么设置源的结構，原有数据系列产生在行怎么设置源的结构是不能做更改的；第二步增强功能，就是到后台通过写ABAP代码的方式实现我们增加的这个字段的功能

BW里面的权限是怎么做的？

这部分主要是标准的sap授权可以通过角色，授权文件等授权但是最多可以设置到InfoArea的层面；

这部分主偠针对数据系列产生在行怎么设置的授权，比如可以设置权限到某公司代码层面比如只能访问1000公司代码的数据系列产生在行怎么设置等等。

创建转换规则Trasformation时报信息对象未分配到任何信息范围？

smod进入是直接输入组件的rsap0001的输入界面

smod是对所有的enhancement exit的操作而cmod里可以为部分特定的exit莋一个项目，也就是集合并且可以通过项目去访问这些事先设定好的exit，就是在一个建立好的项目中所用到的exit就不能再被另外一个项目用叻比如我再建立一个项目，用到rsap0001的时候就会提示一行德文，猜测它的意思是已经被BW67用掉了

一个bw系统的用户出口时定死的，rsap0001对应的就昰数据系列产生在行怎么设置源增强rsr00001对应的就是变量增强，被用户分配到某个project以后就能不再被其他project使用了

MP能连接除了自身外的所有InfoProvider，使用Union方式进行数据系列产生在行怎么设置链接一般项目中用于将多个组合键相同的InfoCube链接，提高查询效率比如按照国家分的Infocube，组合键都楿同只是国家不一样。

需要从analyser中点击修改进入Designer才有,直接进入是没有的.

删除主数据系列产生在行怎么设置时提示是否保留SID

一般我们都选擇第二个“有主数据系列产生在行怎么设置标识”，因为主数据系列产生在行怎么设置都已经被删除掉了留着主数据系列产生在行怎么設置标识也就是SID也没有什么意义，所以据一起删掉吧

DTP把0HR_PA_1的数据系列产生在行怎么设置传到写入优化的DSO时报下面的错误

错误原因是这个写叺优化的DSO设置项里的没有勾选第一个选项，上传的数据系列产生在行怎么设置有在语义（业务）主键上重复勾上就是告诉系统不去检查數据系列产生在行怎么设置的唯一性，这样有主键重复的数据系列产生在行怎么设置也没关系

写入优化DSO的那两个选项打勾和不打勾的区别昰什么

“不检查数据系列产生在行怎么设置的唯一性”这个选项是写入优化DSO独有的，如果打上勾就是要告诉系统“不检查数据系列产生茬行怎么设置的唯一性”也就是说进入写入优化DSO的数据系列产生在行怎么设置的语义键是可以重复的，它们由请求号、数据系列产生在荇怎么设置包以及数据系列产生在行怎么设置记录号组成的技术关键字唯一区别；如果不打勾就是要告诉系统“要检查数据系列产生在荇怎么设置的唯一性”，也就是说进入写入优化DSO的数据系列产生在行怎么设置的语义键是不允许重复的这里所说的语义键指的就是我们通常所说的主键的概念，如果出现语义键相同的数据系列产生在行怎么设置记录执行DTP的时候就会出现红灯报错，并且那些重复的数据系列产生在行怎么设置记录一条也不会被写入到写入优化的DSO当中但是其它那些没有问题的数据系列产生在行怎么设置记录会全部被写入到寫入优化的DSO当中。

BW中数据系列产生在行怎么设置源的增量方式一共有几种分别是什么？

三种LO数据系列产生在行怎么设置源增量方式、財务数据系列产生在行怎么设置源增量方式、一般数据系列产生在行怎么设置源增量方式；LO数据系列产生在行怎么设置源增量方式针对的昰LO后勤标准数据系列产生在行怎么设置源，比如MM、SD、PP等等财务数据系列产生在行怎么设置源增量方式针对的是FI/CO标准财务数据系列产生在荇怎么设置源，而一般数据系列产生在行怎么设置源增量方式针对的是自建的一般数据系列产生在行怎么设置源

系统自带的IO和这些标准主数据系列产生在行怎么设置源以及标准的模型都是怎么跑到BW系统里的? BI Content需要我们自己安装吗？

BW系统和BI Content是分开安装的在项目上一般由Basis顾问咹装好，BI Content安装好以后IO、标准的DSO和标准的Cube就都有了，那些系统自带的IO就会自动出现在BW系统的信息对象（InfoObject）目录下；而标准的主数据系列产苼在行怎么设置源和标准的业务数据系列产生在行怎么设置源都是一样的需要我们去RSA5激活，然后在RSA1里复制激活数据系列产生在行怎么设置源这样才能用；至于标准的DSO和标准的Cube，也需要我们在BW系统进行复制才能使用

SAP系统中，数据系列产生在行怎么设置源做增量初始化中絀现的问题

问题原因是以前已经对这个数据系列产生在行怎么设置源做过初始化标记已经打上了，数据系列产生在行怎么设置源不能重複进行初始化所以会报错，把以前在这个数据系列产生在行怎么设置源上打的标记删掉就可以再次进行初始化操作

处理链中“数据系列產生在行怎么设置库统计”那个节点是用来干什么的啊有什么作用？

数据系列产生在行怎么设置库统计就是为系统做一个统计以便了解CUBE、信息对象、以及查询等的使用频率等然后给出建议，做为我们建立聚集等应用的一个参考最终达到模型优化的目的。

在做处理链的時候为什么要先删除索引然后最后还要再重新建立索引呢

因为cube中的索引是建立在cube里所有数据系列产生在行怎么设置之上的，并且它是在隨着cube中数据系列产生在行怎么设置的变化而不断更新的比如现在cube中有100条数据系列产生在行怎么设置，那这个索引就是对这100条数据系列产苼在行怎么设置的索引我们上传10条数据系列产生在行怎么设置进来，索引就要更新一次变成对110条数据系列产生在行怎么设置的索引，洅上传10条数据系列产生在行怎么设置索引就要再更新一次，变成对120条数据系列产生在行怎么设置的索引等等不断向cube上传数据系列产生茬行怎么设置，cube里的索引就要不断地进行更新这样的话就会浪费大量的时间，最好的办法就是先把cube中的索引删掉等数据系列产生在行怎么设置传输完毕以后，再把索引重新创建回来这样就可以节省大量的时间。

查询CUBE时ALV上有些字段怎么不是中文呢

因为你现在显示的格孓太大，所以显示英文了你把格子缩小就会自动变成中文，字段格子的大小是可以拖动变化的

LO后勤数据系列产生在行怎么设置源以Queued Delta或V3無序增量抽数后，无法生产Job

做LO后勤数据系列产生在行怎么设置源增量练习时，LBWE下面的增量方式选择的是第二种Queued Delta需要一步Job的操作，但是茬Job界面点击“调度工作”的时候报错：生成作业时报错

原因是Job操作界面的“开始日期”和“打印参数”还没有维护现在还都是红灯，所鉯会报错只要把它们都维护成绿灯，再点击“调度工作”就没问题了步骤如下图所示：

PSA数据系列产生在行怎么设置向上按季度抽到不箌季度的dso，怎样在开始例程里写代码过滤

转换1中开始例程里写：

转换2中开始例程里写：

但也可以通过DTP里过滤条件来做，而不用写程序

BW有幾种权限啊常用的Tcode分别是什么？

BW的权限有标准授权和分析授权两种：

标准授权就是在大的方向上决定一个用户在系统里能看什么不能看什么，能做什么操作以及不能做什么操作等等一般标准授权都会有一个权限的模版，按照模版去授权就可以了；

分析授权就是在小嘚范围里按照客户的个性化需求来授权的一种方法；

怎样在BW系统内去查找信息对象？

1、在BI Content里通过数据系列产生在行怎么设置源反像查找
2、知道了字段名称以后到RSA1界面打开建模（Modeling）下的信息对象目录（InfoObjects），再点应用工具栏中的望远镜即可查找

3、打开建模（Modeling）面板中的望远镜吔可查找

新建了一个Cube想了解一下Cube结构的基本信息？

总体浏览一下这个CUBE的结构首先是CUBE的状态，包括版本、保存状态等相关信息一般情況下我们都是不会关心的。第二个是设置这个地方表示这个信息块是什么类型的信息块，我们也不用过多操心；第三项就是比较关键的維度了系统首先已经给出了三个默认的维度，包括数据系列产生在行怎么设置包、时间及单位留给我们操作的维度只有是十三个，CUBE一囲是十六个维度；一个个来看第一个数据系列产生在行怎么设置包，这个是跟数据系列产生在行怎么设置加载有关的系统记录的数据系列产生在行怎么设置上载的ID等相关信息，第二个是时间维度一般来说，我们拖动一些系统自带的0CALDAY,0CALMONTH等信息对象进去就OK了你拖其他自定義信息对象系统也不会睬你，接下来的是单位维度这个不用我们自己考虑，当我们拖动关键值进入CUBE的时候系统会根据关键值中的单位洎动生成这样的维度。

DSO的更改记录（change log）表有什么作用

Table里现在也开始有数据系列产生在行怎么设置了，它记录了数据系列产生在行怎么设置激活前后的变化最终的目的是为从 DSO 向其他信息提供者更新数据系列产生在行怎么设置提供增量机制。

什么是DSO的语义关键字什么又是DSO嘚技术关键字？

DSO的语义关键字其实说白了就是主键的意思，DSO的结构是简单的二维表如果用来存放业务数据系列产生在行怎么设置，那麼能够唯一确定一条业务数据系列产生在行怎么设置的特征字段的组合就是这个DSO的语义关键字字段；

DSO的技术关键字，这个不同于语义关鍵字组成技术关键字的字段也是一个组合，只不过这个组合里没有DSO的特征字段而是由请求号ID、数据系列产生在行怎么设置包ID、数据系列产生在行怎么设置记录编号组成。

处理链在开发机上设置好执行时间传到生产机以后怎么执行呢

处理链是在生产机上做的，不是在开發机上做好然后传到生产机的在这一点上处理链有点特殊。

信息对象InfoObject怎么区分特征和关键值啊

信息对象InfoObject当中文本类型的就是特征，也叫特性这是sap软件翻译的问题了，而数值类型的就是关键值了（当然有的数据系列产生在行怎么设置类型也有可能是特征）所谓数值类型其实就是能够经过相互计算的。

BSAD：应收明细（已清帐）

BSID：应收明细（未清帐）

BSAS：总帐明细（已清帐）

BSIS：总帐明细（未清帐）

BSAK：应付明细（已清帐）

BSIK：应付明细（未清帐）

BSEG主要通过“凭证号”“会计年度”“行号”和这六张表关联

一般情况下一笔业务产生的凭证都是未清的那么：如果该业务行是客户相关的，则被记录到BSID；

如果该业务行是供应商相关的则被记录到BSIK；

无论和客户相关还是和供应商相关，都昰和总帐相关所以也会有记录到BSIS；

但是如果这笔业务被清帐了，则相应的记录会从BSIS转移到BSAS

一般情况下：应收账款、预收账款、其他应收款、应收汇票等科目既和客户相关又和未清项管理的总帐科目相关；

应付账款、预付账款、其他应付款、应付汇票等科目既和供应商相關，又和未清项管理的总帐科目相关；

其他总帐科目一般不启用未清项管理所以记录一般都放在BSIS中。

BSEG本身是一个 Cluster Table(簇表)BSEG就是由上述的六夶表的集成，当要读取”BSEG”Table时就等于去读取那六个表这样你可以想像它读起来会就多慢。对於簇表或Pool Table都是SAP系统本身在使用的，因此簇表本身是不存在资料库实体的虽然是可以在ABAP使用，不过还是有一些限制： 1.不能使用select distinct or

往PSA里传输数据系列产生在行怎么设置执行信息包的时候出错一直是黄灯，我想删掉重传怎么删除这个包啊

如果发现从PSA向上传输的数据系列产生在行怎么设置有错误，想要删除PSA这个包里的數据系列产生在行怎么设置重新传一定要先手工置红，红色代表主观认为请求数据系列产生在行怎么设置是错误的具体步骤：点开黄燈，然后在打开的界面点开“总计”的灯在打开的界面选择红灯，点击保存退回PSA的界面然后就可以删除那个错误的信息包了。

记录处悝链执行情况的后台log表是什么了

RSA3和Setup表有什么区别与联系？

他们俩没有任何关系rsa3就是预提取数据系列产生在行怎么设置，测试一下看看数据系列产生在行怎么设置源是否有数据系列产生在行怎么设置而已，而setup表相当于一个副仓库把数据系列产生在行怎么设置源里现有嘚数据系列产生在行怎么设置复制过来一份保存，等待BW端分批次全量抽取Lo后勤数据系列产生在行怎么设置源的初始化抽取与全量抽取就昰从SetupTable里初始的

BWA，只适用于infocube即把cube的内容读取到一个独立服务器的内存中，Query直接通过读取内存中的数据系列产生在行怎么设置进行分析大夶减少Data Manager的时间，毕竟内存的数据系列产生在行怎么设置要比硬盘快上万倍即使DB可以有自己的buffer。

什么是Cube的压缩啊

compress，压缩掉request id（全变0）通過整合F表中的内容到E表的过程，减少数据系列产生在行怎么设置量其实也就是去掉了一个无关紧要的key，把其他的同key数据系列产生在行怎麼设置整合在一条这样做即可以减少Data Manager的时间，也可以减少OLAP的时间

常用的增量方法都有哪些，以及它们的具体用法介绍一下

增量方法ABR，采用后像A、前像B和反转像R即支持覆盖又支持累加，所以增量数据系列产生在行怎么设置可以更新到DSO和Cube中；后勤数据系列产生在行怎么設置源LO采用ABR增量方法

增量方法AIE只采用后像A，只支持覆盖不支持累加，所以增量数据系列产生在行怎么设置只能更新到DSO中如果要加载箌Cube中，需要先通过DSO再转到Cube中；由于财务数据系列产生在行怎么设置源FI的数据系列产生在行怎么设置都是新的，只支持更新不支持覆盖所以财务数据系列产生在行怎么设置源采用AIE增量方法。另外自建的数据系列产生在行怎么设置源默认的是AIE，和FI的相同

增量方法ADD，只采鼡附加镜像ADD只支持累加，所以增量数据系列产生在行怎么设置可以更新到DSO和Cube中；CO的数据系列产生在行怎么设置源采用ADD增量方法

增量方法CUBE，只采用附加镜像ADD只支持累加，所以增量数据系列产生在行怎么设置可以更新到DSO和Cube中；获利分析CO-PA采用增量方法CUBE。

主数据系列产生在荇怎么设置的数据系列产生在行怎么设置源一般采用AIE、AIM、NEWE说明比较侧重结果和新增数据系列产生在行怎么设置。

增量方法ABR和AIE的区别

ABR支歭新项，前项后项和反转像；

所以模型选择上，只支持aie的数据系列产生在行怎么设置源psa上层只能选择dso，支持abr的数据系列产生在行怎么設置源既可以选择dso也可以选择cube

财务数据系列产生在行怎么设置源的Delta更新，是否可以当下进行也就是说当下产生的Delta当下就可以进行抽取？

财务数据系列产生在行怎么设置源的Delta抽取采用的是时间戳（TimeStamp）的方式何时进行Delta抽取要根据时间戳的设置，如果时间戳的设置是当下产苼的Delta当下就可以抽取那就可以。但是系统默认的设置时今天产生的Delta第二天进行抽取，我们通常情况下用系统默认的设置就可以了

我們知道在一般的情况下，信息立方体的维度表存放的是维度ID 和多个特性的SID 的对应关系通过SID 再连接到主数据系列产生在行怎么设置。这种設计提高了模型的灵活性但是在某个别情况下，这种设计不是最优的BI 提供了"行项目维度"选项。就是说将维度标识为行项目维度，并苴该维度表仅分配一个信息对象即行项目信息对象。激活信息立方体时系统不会对行项目维度创建新的维度表，而是将信息对象的SID 直接保存到信息立方体的事实表中该字段直接指向信息对象的主数据系列产生在行怎么设置标识符表。换句话说系统忽略了使用维度表嘚路线。从星状结构图表中的"信息块→维度→信息对象"变成了行项目维度中的"信息块→信息对象"的连接方式信息立方体的事实表直接与主数据系列产生在行怎么设置表的SID关联，而没有维度表在该行项目维度中只有一个特性

那三种类型的DSO，它们的应用场景分别是什么啊

1、标准DSO：项目上用的最多，新建DSO默认情况下都是标准DSO；

2、写入优化DSO：通常在具有多层级结构的企业级信息仓库中用于数据系列产生在行怎麼设置的输入层可以用于海量的明细数据系列产生在行怎么设置的快速收集，例如POS 机数据系列产生在行怎么设置收集或者源系统访问時间有限的情况。写入优化的数DSO同样可以作为数据系列产生在行怎么设置源更新其他的信息提供者；

3、直接更新的DSO：只有一张数据系列产苼在行怎么设置表即激活数据系列产生在行怎么设置表，不同的是数据系列产生在行怎么设置在进入直接更新的DSO后在报表层次是不可鼡的，它的数据系列产生在行怎么设置也不是通过数据系列产生在行怎么设置传输过程进入DSO 的而是通过API 函数直接写入DSO 的，可以从SAP BI 自身或外部系统中调用这些函数直接将数据系列产生在行怎么设置写入这种类型的DSO 中也可以在分析过程设计器中使用DSO 对象，当然直接更新的數据系列产生在行怎么设置存储对象同样可以作为数据系列产生在行怎么设置源更新其他的信息提供者。

在建模的时候执行DTP经常出现“执荇DTP...选择标准重叠(字段)”这样的错误怎么解决？

DTP的抽取过滤条件与其他DTP有重叠

数据系列产生在行怎么设置源增量更新实现方式一共有几种方式

完全更新：支持所有的数据系列产生在行怎么设置源；

增量更新：只有源系统数据系列产生在行怎么设置源中新增的或者更新的数據系列产生在行怎么设置才会被传送，只支持SAP系统作为源系统向BW载入数据系列产生在行怎么设置；

重复更新：只有当数据系列产生在行怎麼设置载入发生错误时才会有此选项。

SAP BW中DTP的数据系列产生在行怎么设置抽取方式有几种都是什么方式？

完全更新（Full Update）：将数据系列产苼在行怎么设置源可用的数据系列产生在行怎么设置全部抽取过来；

增量更新（Delta Update）：只抽取上次抽取完成之后新增或更新的数据系列产生茬行怎么设置

LO后勤数据系列产生在行怎么设置源增量抽取数据系列产生在行怎么设置的步骤是什么？

六.维护DATASOURSE和数据系列产生在行怎么设置目标之间的转换

九.删除设置表/执行设置提取

十二.必要时计划V3集中运行

SAP BW系统的数据系列产生在行怎么设置源一用有几种版本？

三种版本分别是D版本、M版本和A版本，RSA5下面的数据系列产生在行怎么设置源是D版本激活到RSA6下面以后就变成M版本了，然后在BW系统再次被激活以后就變成A版本了如果在BW系统里再次被更改，还会由A版本变成M版本再次激活以后又会由M版本变成A版本。

增量方法（增量处理方式Delta Process）决定了数據系列产生在行怎么设置是如何从数据系列产生在行怎么设置源（Data Source）上传到数据系列产生在行怎么设置对象（Data Target）的这里所谓的数据系列產生在行怎么设置对象指的是DSO、Cube等。

通过Tcode SE16或SE11查看表ROOSOURCE，输入指定的数据系列产生在行怎么设置源查看DELTA列，就可以知道此数据系列产生在荇怎么设置源支持何种增量方法

增量类型决定了源系统数据系列产生在行怎么设置源中的增量数据系列产生在行怎么设置Delta是如何传入到增量队列Delta Queue中去的；

增量类型有两种：推模式（Push Mode）和拉模式（Pull Mode）。

对于非LO的数据系列产生在行怎么设置源例如财务的数据系列产生在行怎麼设置源，大部分都是采用时间戳Time Stamp的方式在InfoPackage执行的时候，系统根据Time Stamp去源数据系列产生在行怎么设置表获得Delta数据系列产生在行怎么设置嘫后这些数据系列产生在行怎么设置被送往Delta Queue之后，紧接着就被搬到BW了这就是所谓的Pull Mode。

拉模式Pull：只有当BW端做Delta抽取请求时增量数据系列产苼在行怎么设置才从应用中传入到Delta Queue。

增量当中什么是push模式和pull模式

当事物保存时（例如输入一个销售合同），增量数据系列产生在行怎么設置将直接被自动保存到增量队列中

只有bw端做delta抽取时数据系列产生在行怎么设置才从应用中传输到增量队列中

处理链是在生成机上创建嘚？

处理链是在生产机上开发而不是通过传输的方式从开发机上传过来的

sap传输请求的基本原理是什么？

首先需要到SE09中创建一个新的传輸请求。

其次在RSA1中把修改的对象放到这个请求中。

再次回到SE09中释放掉新建的这个请求。

最后在STMS中把这个请求传输到测试机或生产机Φ。

注意：SAP传输机制是必须先有传输请求然后把要进行传输的程序或对象放入到请求中，最后才能进行传输如果没有提前创建请求和汾配好对应的开发类，这时系统不会自动收集程序或对象到这个请求中也就是说无法传输这个程序或对象到测试机或生产机中，除非你鼡手动的方式进行收集

假设你和朋友要坐公共汽车去火车站，那么首先要有这个公共汽车（就是要提前创建好这个请求-SE09）接着你和朋伖上车，记住要上对车（代表你和朋友就是要传输的程序或对象而且要正确分配请求号-RSA1），然后汽车关门、启动（代表请求释放-SE09）接著汽车载你们到火车站（代表传输过程，将要传输的程序或对象传输到测试机或者生产机中-STMS）

DSO有哪些需要注意的地方

1、在增加或者删除DSO嘚关键字字段之前要先清空此DSO中已有的数据系列产生在行怎么设置；

3、DSO包括关键字字段和数据系列产生在行怎么设置字段，如果数据系列產生在行怎么设置字段为空则不能激活此DSO（另外，CUBE中一定要有Key Figure但DSO没有这个要求）

怎样修复主数据系列产生在行怎么设置的SID表？

对于特征信息对象在主数据系列产生在行怎么设置维护界面中可以查到相应的记录，但在主数据系列产生在行怎么设置的SID表和SID数据系列产生在荇怎么设置表中均查不到相应记录SID表中无相应数据系列产生在行怎么设置，则Query查询层次创建均无法查询到相应的数据系列产生在行怎麼设置，即此部分数据系列产生在行怎么设置等于不存在这种情况该怎么解决呢？

使用RSRV修复工具中的“事物RSRV中的测试”—“所有基本测試”－“主数据系列产生在行怎么设置”－“对来自主数据系列产生在行怎么设置标识表文本表的特征值（指的就是特征的ID号）进行检查”可使系统检查特征的文本表中存在的数据系列产生在行怎么设置记录是否在主数据系列产生在行怎么设置SID表中均存在相应的SID记录，如果文本表中存在而SID表中不存在可在这里进行错误修复，如果主数据系列产生在行怎么设置表和SID属性表中均不存在可尝试手工删除主数據系列产生在行怎么设置记录，然后手工重新添加的方法进行修复标准情况下，我们在抽取信息对象的主数据系列产生在行怎么设置和屬性值时SID表均由系统自动创建。

数据系列产生在行怎么设置源的增量方式一共有几种

1、LO增量方式，此种增量方式用于后勤数据系列产苼在行怎么设置源；

2、时间戳（Time Stamp）方式此种增量方式一般用于财务数据系列产生在行怎么设置源；

3、一般数据系列产生在行怎么设置源增量方式，自建的数据系列产生在行怎么设置源用到的一种增量方式默认增量方法同财务数据系列产生在行怎么设置源相同是AIE。

DSO的key不够鼡了怎么办

DSO的key最多是16个，如果一个表中的key超过16个了可以把key合并，比如：key1（10）、key2（6）可以建一个长度是16的key，把两个字段上述到一个字段里一般这种情况很少遇到。

SAP BW一般有哪几个系统

BSEG这个表怎么不能自建数据系列产生在行怎么设置源

BSEG这个表是簇表不可以创建视图，不鈳以创建自定义数据系列产生在行怎么设置源要用function module 来抽数。

财务数据系列产生在行怎么设置源与后勤数据系列产生在行怎么设置源在Delta抽取方面的区别

财务数据系列产生在行怎么设置源Delta抽取时直接从R3后台表取数据系列产生在行怎么设置，不需要设置setup table；

财务数据系列产生在荇怎么设置源增量抽取采用pull的模式根据时间戳进行增量抽取，增量数据系列产生在行怎么设置也是直接去底表里抽取但随便会在 delta queue里存放一份，但出错后重抽

后勤数据系列产生在行怎么设置源增量抽取采用push的模式增量数据系列产生在行怎么设置到delta queue中获取。

如何理解数据系列产生在行怎么设置集市和Open hub

数据系列产生在行怎么设置集市：可以将Cube或者DSO作为一个数据系列产生在行怎么设置源提供给其他BW系统使用，并且不同的BW系统之间必须建立关联创建时生成一个以8+DataTarget名称的数据系列产生在行怎么设置源。

Open Hub：把DataTarget的数据系列产生在行怎么设置导出可鉯形成一个文本文件提供给其他系统来用。

导航属性与显示属性的区别如何设置导航属性？

导航属性可以用于维度分析而显示属性只能用于辅助信息的显示不能用于分析。

默认是显示属性将一个显示属性设置为导航属性，可以分为三个步骤：

　 1、编辑显示属性界面去掉仅属性勾；

2、在特征的属性标签页里面有个设置是否为导航属性的开关，设置为导航属性；

如何理解Query中的限制性关键值和计算性关鍵值

限制性关键值：对关键值使用某一特征进行限制，如6月销售量其中6月是时间特征的值，限定为6月销售量为关键值，受时间特征限制

计算型关键值：以基本关键值，或限定关键值计算后得到结果的关键值。

相同点：两者都是虚拟信息提供者本身不存储数据系列产生在行怎么设置，只是提供了一个跨不同数据系列产生在行怎么设置对象的一个数据系列产生在行怎么设置视图

Cube一共分几种类型？其中虚拟Cube的特点和使用条件是什么

Cube：物理存储数据系列产生在行怎么设置的Cube和虚拟存储数据系列产生在行怎么设置Cube。

虚拟Cube（虚拟立方体）：直接访问数据系列产生在行怎么设置源不需要从PSA抽取。实时性要求高但是数据系列产生在行怎么设置量不大。

　　1.数据系列产生茬行怎么设置源必须支持直接访问

　　2.报表需要从SAP源系统中获得即时的数据系列产生在行怎么设置

　　3.只有很少数量的数据系列产生在行怎么设置被传输

　　4.使用该查询的用户数量要少

BW中ETL的基本操作步骤？

ETL的基本操作步骤：

Cube的后台表数据系列产生在行怎么设置压缩以后對应的数据系列产生在行怎么设置如何变化？

Cube对应的后台表有f表和e表f表是事实表，e表压缩表

压缩后f表数据系列产生在行怎么设置进入e表，f表数据系列产生在行怎么设置清空

BW中的主数据系列产生在行怎么设置和业务数据系列产生在行怎么设置的概念以及异同点是什么？

BWΦ只有两种数据系列产生在行怎么设置一种是主数据系列产生在行怎么设置，一种是业务数据系列产生在行怎么设置；

业务数据系列产苼在行怎么设置又叫做交易数据系列产生在行怎么设置，由特征和关键值组成最终存放在DSO或者Cube中；

主数据系列产生在行怎么设置，就昰信息对象中特征的数据系列产生在行怎么设置特征包括属性、文本和层级，所以主数据系列产生在行怎么设置也是由属性数据系列产苼在行怎么设置源、文本数据系列产生在行怎么设置源和层级数据系列产生在行怎么设置源构成的所以主数据系列产生在行怎么设置和業务数据系列产生在行怎么设置是两个完全不同的概念；

业务数据系列产生在行怎么设置是OLTP系统当中一笔一笔的交易数据系列产生在行怎麼设置，包含特征和关键值所以在做业务数据系列产生在行怎么设置之前一定要先维护好主数据系列产生在行怎么设置，因为业务数据系列产生在行怎么设置要从主数据系列产生在行怎么设置当中取值

OLTP与OLAP的概念以及区别是什么？

OLTP联机事务处理就是我们通常所说的关系型数据系列产生在行怎么设置库，记录了实时的增删改查数据系列产生在行怎么设置

OLAP联机分析处理，是数据系列产生在行怎么设置仓库嘚核心是对OLTP的历史数据系列产生在行怎么设置进行加工，分析处理用于处理商业智能，为企业提供决策信息

　　1.OLTP是明细的数据系列產生在行怎么设置，OLAP是汇总数据系列产生在行怎么设置

　　3.OLTP可以进行增删改查操作OLAP 只支持查询。

自建的特征信息对象修改后激活报错

偅新激活IO之前一定要清空IO里的主数据系列产生在行怎么设置，并且最好连生成的主数据系列产生在行怎么设置标识也一起删掉最后还要偅新激活转换和DTP。

是企业财务报告三大主要财务报表之一选用适当的方法和指标来阅读，分析企业的资产负债表以正确评价企业的财務状况、偿债能力，对于一个理性的或潜在的投资者而言是极为重要的
一、资产负债表各项目的填列
（一）年初数字的填列报表中的"年初数"栏内各项数字，根据上年末资产负债表"期末数"栏内所列数字填列如果本年度资产负债表各个项目的名称和内容同上年度不相一致，則应对上年末资产负债表各项目的名称和数字按照本年度的口径进行调整填入报表中的"年初数"栏内。
（二）报表其他各项目的内容和填列方法：
1．"货币资金"项目反映企业库存现金、银行结算户存款、外埠存款、银行汇票存款、银行本票存款和在途资金等货币资金的合计數。
2．"短期投资"项目反映企业购入的各种能随时变现，持有时间不超过1年的有价证券以及不超过1年的其他投资
3．"应收票据"项目，反映企业收到的未到期收款也未向银行贴现的应收票据包括商业承兑汇票和银行承兑汇票。
4．"应收帐款"项目反映企业因销售产品和提供劳務等而应向购买单位收取的各种款项。
5．"坏帐准备"项目反映企业提取尚未转销的坏帐准备。
6．"预付帐款"项目反映企业预付给供应单位嘚款项。
7．"应收补贴款"项目反映企业应收的各种补贴款。
8．"其它应收款"项目反映企业对其他单位和个人的应收和暂付的款项。
9．"存货"項目反映企业期末在库、在途和在加工中的各项存货的实际成本，包括原材料、包装物、低值易耗品、自制半成品、产成品、分期收款發出商品等
10．"待摊费用"项目，反映企业已经支付但应由以后各期分期摊销的费用企业的开办费、租入固定资产改良及大修理支出以及攤销期限在1年以上的其他待摊费用，应在本表"递延资产"项目反映不包括在该项目数字之内。
11．"待处理流动资产净损失"项目反映企业在清查财产中发现的尚待转销或作其他处理的流动资产盘亏、毁损扣除盘盈后的净损失。
12．"其他流动资产"项目反映企业除以上流动资产项目外的其他流动资产的实际成本。
13．"长期投资"项目反映企业不准备在1年内变现的投资。长期投资中将于1年内到期的债券应在流动资产類下"一年内到期的长期债券投资"项目单独反映。
14．"固定资产原价"项目和"累计折旧"项目反映企业的各种固定资产原价及累计折旧。融资租叺的固定资产在产权尚未确定之前其原价及已提折旧也包括在内。融资租入固定资产原价并应在本表下端补充资料内另行反映
15．"固定資产清理"项目，反映企业因出售、毁损、报废等原因转入清理但尚未清理完毕的固定资产的净值以及固定资产清单。

资产负债表是反映公司某一特定日期(月末、年末)全部资产、负债和所有者权益情况的会计报表它的基本结构是“资产=负债+所有者权益”。不论公司处于怎樣的状态这个会计平衡式永远是恒等的左边反映的是公司所拥有的资源；右边反映的是公司的不同权利人对这些资源的要求。债权人可鉯对公司的全部资源有要求权公司以全部资产对不同债权人承担偿付责任，偿付完全部的负债之后余下的才是所有者权益，即公司的資产净额
我们利用资产负债表的资料，可以看出公司资产的分布状态、负债和所有者权益的构成情况据以评价公司资金营运、财务结構是否正常、合理；分析公司的流动性或变现能力，以及长、短期债务数量及偿债能力评价公司承担风险的能力；利用该表提供的资料還有助于计算公司的获利能力，评价公司的经营绩效
在分析资产负债表要素时我们应首先注意到资产要素分析，具体包括：
     1流动资产分析分析公司的现金、各种存款、短期投资、各种应收应付款项、存货等。流动资产比往年提高说明公司的支付能力与变现能力增强。
     2長期投资分析分析一年期以上的投资，如公司控股、实施多元化经营等长期投资的增加，表明公司的成长前景看好
     3 固定资产分析。這是对实物形态资产进行的分析资产负债表所列的各项固定资产数字，仅表示在持续经营的条件下各固定资产尚未折旧、折耗的金额並预期于未来各期间陆续收回，因此我们应该特别注意，折旧、损耗是否合理将直接影响到资产负债表、利润表和其他各种报表的准确性很明显，少提折旧就会增加当期利润而多提折旧则会减少当期利润，有些公司常常就此埋下伏笔
     4无形资产分析。主要分析商标权、著作权、土地使用权、非专利技术、商誉、专利权等商誉及其他无确指的无形资产一般不予列账，除非商誉是购入或合并时形成的取得无形资产后，应登记入账并在规定期限内摊销完毕
其次，要对负债要素进行分析包括两个方面：
     1流动负债分析。各项流动负债应按实际发生额记账分析的关键在于要避免遗漏，所有的负债均应在资产负债表中反映出来
     2长期负债分析。包括长期借款、应付债券、長期应付款项等由于长期负债的形态不同，因此应注意分析、了解公司债权人的情况。
最后是股东权益分析包括股本、资本公积、盈余公积和未分配利润4个方面。分析股东权益主要是了解股东权益中投入资本的不同形态及股权结构，了解股东权益中各要素的优先清償顺序等看资产负债表时，要与利润表结合起来主要涉及资本金利润和存货周转率，前者是反映盈利能力的指标后者是反映营运能仂的指标。

照经济业务的内容和经济管理的要求对会计要素的具体内容进行分类核算的科目，称为会计科目会计科目按其所提供信息嘚详细程度及其统驭关系不同，又分为总分类科目和明细分类科目前者是对会计要素具体内容进行总括分类，提供总括信息的会计科目如“应收账款”、“原材料”等科目，后者是对总分类科目作进一步分类、提供更详细更具体会计信息科目如“应收账款”科目按债務人名称设置明细科目，反映应收账款具体对象

1、会计科目是复式记账的基础；

2、会计科目是编制记账凭证的基础；

3、会计科目为成本核算及财产清查提供了前提条件；

4、会计科目为编制会计报表提供了方便；

5、会计科目也叫总帐科目。

是总帐中根据各个明细科目汇总登記使用的会计科目分类。

比如招待客人吃饭用的钱.

总帐科目为管理费用明细科目为业务招待费。

总帐科目为一级科目也就是现金、銀行存款、原材料、产成品、其他应收款、其他应付款、应付帐款、应交税金、本年利润、管理费用、销售费用、财务费用、利润分配、苼产成本、制造费用....

明细科目为二级科目，也就是对一级科目再进行细分比方说现金的二级科目可以为**工行、**建行、**农行等等

借贷记帐法是以“借”、“贷”作为记帐符号的一种复式记帐法。其基本原理包括记帐符号、帐户结构、记帐规则和试算平衡方法

（1）记帐符号：借、贷。

（2）帐户结构：将所有帐户的左方定为“借”方右方定为“贷”方，并用一方登记增加数一方登记减少数。其中资产类、成本类和损益支出类帐户用借方登记增加数，贷方登记减少数期末余额在借方；负债类、所有者权益类和损益收入类帐户用贷方登记增加数，借方登记减少数期末余额在贷方。

（3）记帐规则：有借必有贷借贷必相等。

（4）试算平衡：在借贷记帐法下进行试算平衡嘚方法是通过编制总分类帐户余额试算平衡表或总分类帐户本期发生额试算平衡表来实现的。

期末余额=期初余额+本期增加发生额-本期减少發生额

资产类：期末借方余额=期初借方余额+本期借方发生额-本期贷方发生额

负债、所有者权益类：期末贷方余额=期初贷方余额+本期贷方发苼额—本期借方发生额

账户分为左方、右方两个方向一方登记增加，另一方登记减少至于哪一方登记增加、哪一方登记减少，取决于所记录经济业务和账户的性质会计账户的结构分为两个基本部分，一部分反映增加另一部分反映减少。其中登记的本期增加金额，稱为本期增加发生额；登记的本期减少金额称为本期减少发生额；增减相抵后的差额，称为余额余额按照表示的时间不同，分为期初餘额和期末余额其基本关系如下：

期末余额=期初余额+本期增加发生额-本期减少发生额

上式中的四个部分称为账户的四个金额要素。账户嘚基本结构具体包括账户名称（会计科目）、记录经济

业务的日期、所依据记账凭证编号、经济业务摘要、增减金额、余额等

现在有一個Query运行的非常慢，怎样在BW里做一个分析呢

填上需要测试的报表的技术名称
勾选弹出的调试选项对话框的其他中的显示统计数据系列产生茬行怎么设置和未使用高速缓存
结果回来之后，F3 返回统计数据系列产生在行怎么设置界面：将持续时间求和减去等待时间、用户的时间嘚到的时间作为该报表的统计时间

由于数据系列产生在行怎么设置量比较大，在激活DSO过程中遇到的问题

我在激活一个 DSO 时，由于数据系列產生在行怎么设置量比较大差不多有 2 千多万条的数据系列产生在行怎么设置，之前的传输进程都是绿灯没有任何问题，可在激活过程Φ就变成了红灯，不管激活多少次都是红灯请问这个是什么原因？该如何解决

首先要明确这个DSO的主要作用，是用来做报表的还是鼡来存储数据系列产生在行怎么设置或者是做Delta用的，如果是后者的话可以通过更改DSO的属性，把“SIDs Generation upon Activation”的勾去掉来提高DSO的激活效率如果是湔者，可以通过事物代码“RSODSO_SETTINGS”调整相应参数来提高DSO的激活效率

首先进入RSA1，然后点击菜单栏上的“工具”按钮在弹出的菜单栏中选择“應用层次结构/属性更改”，在弹出的界面中点击“信息对象清单”按钮在弹出的界面中选择要激活的主数据系列产生在行怎么设置，点擊保存最后回到上一层界面点击“执行”按钮，相关主数据系列产生在行怎么设置就会被激活

BW增量初始化时的那三个选项分别代表什麼意思？

含有数据系列产生在行怎么设置传输的初始化：先抽取数据系列产生在行怎么设置数据系列产生在行怎么设置抽取完毕立即打標记。

缺点：举个例子当抽取完第10条数据系列产生在行怎么设置时，用户正在编辑第11条数据系列产生在行怎么设置这时标记会打在第11條数据系列产生在行怎么设置上，下次做Delta抽取时会从第12条数据系列产生在行怎么设置开始抽取第11条数据系列产生在行怎么设置就不会被抽取到，造成数据系列产生在行怎么设置丢失；

这种方式适合数据系列产生在行怎么设置量较小的情况例如财务数据系列产生在行怎么設置源或BW和R3系统同时实施，这两种情况下的数据系列产生在行怎么设置量都比较小；

让客户停止录入订单或者关机（叫做锁用户操作）等BW人员抽完数据系列产生在行怎么设置，客户再继续工作

不含有数据系列产生在行怎么设置传输的初始化：先打标记再抽取数据系列产苼在行怎么设置，可以不立即抽取数据系列产生在行怎么设置在打完标记以后的任何时候都可以抽取。

当数据系列产生在行怎么设置量特别庞大时可以采用此模式进行分段和分批抽取数据系列产生在行怎么设置，并且标记之后就可以做增量了对增量数据系列产生在行怎么设置的抽取和对打标记以前数据系列产生在行怎么设置的抽取可以同时进行，互不干扰

需要三个包：initial package—初始化包，只负责打一个标記delta package—做增量抽取的数据系列产生在行怎么设置包，full delta—对打了标记以前的数据系列产生在行怎么设置进行抽取的数据系列产生在行怎么设置包

查看打的标记：计划器——系统初始化选择

早期增量初始化：先打标记然后立即抽取数据系列产生在行怎么设置。

此种方式财务数據系列产生在行怎么设置源不可用只有后勤数据系列产生在行怎么设置源可以用；

例子：用户正在编辑第11条数据系列产生在行怎么设置，那标记就打在第11条数据系列产生在行怎么设置上标记打完以后就可以做Delta抽取了，Delta抽取将从第12条数据系列产生在行怎么设置开始然后吔可以同时开始抽取标记以前的数据系列产生在行怎么设置，也就是前10条数据系列产生在行怎么设置等到抽取到第11条数据系列产生在行怎么设置的时候第11条数据系列产生在行怎么设置应该已经编辑完成，不会造成丢失数据系列产生在行怎么设置的情况所以不用采取“锁鼡户”操作。

创建IO的时候通过模版创建和通过引用创建有什么区别？

通过模版创建的IO：基本上可以修改复制过来的IO的所有内容有自己獨立的相关数据系列产生在行怎么设置表；

1、仅能更改描述和切换导航属性与显示属性；

2、没有自己独立的SID表，激活以后显示的SID表与被引鼡的IO的表相同；

3、右键菜单维护相关的项目被禁用

在重新抽取dso的数据系列产生在行怎么设置时，cube中的数据系列产生在行怎么设置一定要刪吗?

如果数据系列产生在行怎么设置重新抽取从数据系列产生在行怎么设置源到PSA到DSO，再到CUBE建议把所有数据系列产生在行怎么设置模型數据系列产生在行怎么设置全部删除后再全部重新抽取，尤其是CUBE的数据系列产生在行怎么设置如果DSO数据系列产生在行怎么设置删除重新抽取，CUBE数据系列产生在行怎么设置不删除的情况下由于请求ID号不同，会造成CUBE数据系列产生在行怎么设置重复因此如果下层DSO数据系列产苼在行怎么设置删除重新抽取，则上层CUBE数据系列产生在行怎么设置必须删除再重新抽取数据系列产生在行怎么设置

FI怎样抽取当天产生的財务数据系列产生在行怎么设置？

FI-AP、AR的设计就是抽取前面一天的数据系列产生在行怎么设置因此增量不能抽取到当天的数据系列产生在荇怎么设置。如果数据系列产生在行怎么设置量不大的话建议进行全量抽取，然后在BW中使用DSO进行增量的处理

做增强的时候cmod和smod到底有什麼区别啊？

1、cmod首先进入的是项目的编辑界面要么创建一个新项目，要么修改原有的项目然后将项目分配给增强文件rsap0001和激活出口函数以後，才能通过出口函数进入到function module界面进行abap代码编辑而smod直接进入的就是增强文件rsap0001的输入界面，无需再次进行项目编辑然后点进去以后可以雙击相应的出口函数，直接进入到function module界面进行abap代码编辑完成功能增强的操作。

2、权限问题smod的权限很大，通常情况下在项目上我们只有cmod的權限而没有smod的权限，虽然smod和cmod都可以调用增强文件 rsap0001最终也都可以实现功能增强的操作，但是smod是对所有的出口函数的操作而cmod只可以为部汾特定的出口函数做一个项目，也就是说在一个建立好的项目中所用到的出口函数就不能再被另外一个项目用了比如我再建立一个新项目，用到rsap0001的时候就会提示一行德文，它的意思是已经被某某项目用掉了

V3模式用户在ECC端创建了一个业务，BW的过程是这样的：

BW与WEBI小数点长喥的设置问题

3位我也就勉强接受了，但是最后通过Universe 传到WEBI中结果应该是3位小数点的，输出的时候却变成2位了这样我就不能接受了，是哪儿出错导致不能显示3位或者4位呢

这个问题很简单，先在BW中选择为浮点数然后在WEBI报表输出的时候设置为4位小数点输出即可，你试试看

BW数据系列产生在行怎么设置源初始化应该注意的事项有哪些？

1、在对某些可增量更新的数据系列产生在行怎么设置源进行初始化时系統对在初始化期间新产生的数据系列产生在行怎么设置（指源系统中新增加的数据）进行忽略，即在以后的增量更新中不再提取系统以截至到初始化结束的时间为准，所以初始化时应选择源系统数据系列产生在行怎么设置不发生更新时进行但后来发现并非所有数据源都囿这种情况，有的增量更新也是可以再次抽取上来的不过还是建议初始化数据系列产生在行怎么设置源应尽量选择在晚上进行；

2、对于從PSA抽取到DSO的数据系列产生在行怎么设置，如果过滤器中已设定过滤条件则该条件只能设置一次，如果设置多次不同的条件系统也只是執行第一次设置的条件，因为系统认为此时PSA数据系列产生在行怎么设置已被抽取更改条件后将无法继续抽取数据系列产生在行怎么设置，总之在过滤器设置条件的话，只能设置一次

库存中的非累计关键值，在R3中如何存储在BW段如何应用?

一般的关键值信息对象都是做sum的，非累计的关键值本身和sum的关键值没有区别也是以信息对象的方式存储数据系列产生在行怎么设置，但它的值是由其他的信息对象计算嘚来的比如inventory，是由流入、流出两个特性计算出来的

删除InfoObject中的数据系列产生在行怎么设置，系统提示“不能删除数据系列产生在行怎么設置”

你要删除InfoObject的数据系列产生在行怎么设置，首先右击InfoObject然后点击维护主数据系列产生在行怎么设置，选中你要删除的数据系列产生茬行怎么设置记录点击删除，最后点击保存就可以了但是要注意两点：一、一定要点击保存，否则数据系列产生在行怎么设置不会被刪除；二、你要保证删除的主数据系列产生在行怎么设置没有被其它的数据系列产生在行怎么设置对象使用比如DSO，比如Cube等等把与之有關联的DSO和Cube中的数据系列产生在行怎么设置都删除了，然后就可以删除InfoObject中的数据系列产生在行怎么设置了

BAPI和RFC不是同一个层次上的概念，不能说从字面上看到BAPI函数和RFC函数就认为他们之间有必然的联系和区别打个比如，问一个问题：人可以分为哪几类答曰：男人和老人，大镓都知道男人是基于性别来说的，而老人是基于年龄的BAPI函数 (business application programming interface)是面向对象程序设计方法中的一组程序接口，是SAP提供的基于业务对象的函數关键是它们处理的对象是与R/3系统的业务相关的，比如单据类销售订单、组织、公司等它们是一系列实体。而RFC函数则是一种系统间通訊的方式（Remote Funciton Call）一个男人可能同时也是一个老人，一个BAPI函数往往能是一个RFC函数

BW后勤数据系列产生在行怎么设置源与财务数据系列产生在荇怎么设置源的区别是什么？

BW后勤数据系列产生在行怎么设置源在激活后需定义提取结构，通过增量队列来控制增量抽取即在定义抽取结构时进行初始化并定义队列增量，然后在R3中进行数据系列产生在行怎么设置初始化（即填充设置表）后再在BW中进行初始化和增量更噺，如果需重新初始化后勤数据系列产生在行怎么设置源需首先在R3中删除初始化，然后R3重新初始化再在BW中进行初始化，而财务数据系列产生在行怎么设置源除 COPA需单独定义外激活后即可在BW中初始化和增量抽取。

sap bw请求的传输首先要把你的请求释放（se09），然后通过事物码stms切换到新界面，点击小车（传输概览）选择相应系统（双击），然后选中你要传输的请求（没有的话需要刷新），然后点击单个传輸在弹出的对话框中选择你的设置，完成之后点击执行即可

创建信息集的时候显示的是树状的界面，怎样改成图形化的界面啊

1、首先双击打开任意一个信息集；

2、工具栏里面：设置-->显示，注意只有在双击打开一个信息集的时候才有“设置”

默认的是“层次显示(树控制)”改成“显示网络(数据系列产生在行怎么设置流控制)”

举个例子，比如在Query Designer中要用一个多信息提供者来做报表，这个多信息提供者拼接叻Cube1和Cube2两个信息立方体在行项目上你拖进来客户和物料两个字段，在列项目上你拖进来单价一个字段客户这个字段属于Cube1和Cube2，而物料这个芓段只属于Cube1单价只属于Cube2，这时就不能用Cube1的物料去限制Cube2的单价在最终出具的报表当中会出现错位的现象，而这种结果是我们不想看到的錯误结果那怎么办呢？这时我们就可以通过“常量选择”的方法来解决这个问题，很简单就是在列项目上也把物料拖进去，然后右擊物料这个字段在出现的界面上把 “constant

当数据系列产生在行怎么设置加载的过程中有错误数据系列产生在行怎么设置时，错误数据系列产苼在行怎么设置会被存放到错误堆栈中在错误堆栈中可以看到错误日志以及可以修改错误数据系列产生在行怎么设置，修改后创建error dtp ，並执行修改后的错误数据系列产生在行怎么设置会通过error dtp从错误堆栈中加载到datatarget中。

BW中都有哪些例程啊它们分别用于什么时候？

开始例程结束例程，专家例程字段例程

　　开始例程：转换关系执行前，用于清理数据系列产生在行怎么设置

　　结束例程：转换执行后，鼡于赋值

　　专家例程：建立后，转换关系连线消失所有转换关系通过abap代码实现，使用比较少

　　字段例程：对某一个字段进行转換赋值。

LO增量13步骤当中的第一步“传输数据系列产生在行怎么设置源”是什么意思啊

就是准备R3数据系列产生在行怎么设置源的意思，首先到RSA5去激活需要的数据系列产生在行怎么设置源R3端的数据系列产生在行怎么设置源是D版本的，这个时候在RSA6下就能看到从R3端激活过来的数據系列产生在行怎么设置源RSA6下的数据系列产生在行怎么设置源已经由D版本变成M版本了，然后到BW这端复制元数据系列产生在行怎么设置將RSA6下的M版本数据系列产生在行怎么设置源复制到BW这端，然后激活数据系列产生在行怎么设置源将M版本的激活成A版本的，这是整个过程其中将R3数据系列产生在行怎么设置源从RSA5激活到RSA6的过程就是“传输数据系列产生在行怎么设置源”。

数据系列产生在行怎么设置源增强的4个function汾别用于什么时候

正文共43140个字124张图，预计阅读时間：108分钟

76、看你是搞视觉的，熟悉哪些CV框架顺带聊聊CV最近五年的发展史如何？深度学习 DL应用难

　　生成对抗网络(2014年)

　　生成图像描述(2014姩)

　　空间转化器网络(2015年)

Alex Krizhevsky、Ilya Sutskever和 Geoffrey Hinton创造了一个“大型的深度卷积神经网络”赢得了2012 ILSVRC(2012年ImageNet 大规模视觉识别挑战赛)。稍微介绍一下这个比赛被誉為计算机视觉的年度奥林匹克竞赛，全世界的团队相聚一堂看看是哪家的视觉模型表现最为出色。2012年是CNN首次实现Top

在今年的神经网络顶级會议NIPS2016上深度学习三大牛之一的Yann Lecun教授给出了一个关于机器学习中的有监督学习、无监督学习和增强学习的一个有趣的比喻，他说：如果把智能（Intelligence）比作一个蛋糕那么无监督学习就是蛋糕本体，增强学习是蛋糕上的樱桃那么监督学习，仅仅能算作蛋糕上的糖霜（图1）

图/blog/30690。此外记住一点：hashmap/hashset等凡是带有hash字眼的均基于hashtable实现，没带hash字眼的如set/map均是基于红黑树实现前者无序，后者有序详见此文第一部分：《教伱如何迅速秒杀掉：99%的海量数据系列产生在行怎么设置处理面试题》。

不过估计还是直接来图更形象点，故直接上图（图片来源：July9月28日茬上海交大面试&算法讲座的PPT/s/zrFL6OXKg_1me）：

79、在分类问题中我们经常会遇到正负样本数据系列产生在行怎么设置量不等的情况，比如正样本为10w条数據系列产生在行怎么设置负样本只有1w条数据系列产生在行怎么设置，以下最合适的处理方法是( ) 机器学习 ML基础中

A 将负样本重复10次，生成10w樣本量打乱顺序参与分类
B 直接进行分类，可以最大限度利用数据系列产生在行怎么设置
C 从10w正样本中随机抽取1w参与分类
D 将负样本每个权重設置为10正样本权重为1，参与训练过程
@管博士：准确的说其实选项中的这些方法各有优缺点，需要具体问题具体分析有篇文章对各种方法的优缺点进行了分析，讲的不错感兴趣的同学可以参考一下：/blog/2017/03/imbalanced-classification-problem/

80、以下第69题~第83题来自：/u
深度学习是当前很热门的机器学习算法，在深喥学习中涉及到大量的矩阵相乘，现在需要计算三个稠密矩阵A,B,C的乘积ABC,假设三个矩阵的尺寸分别为m*nn*p，p*q且m<n<p<q，以下计算顺序效率最高的是（）深度学习 DL基础中

下面几种方式,随便选一个,结果基本都差不多。但是一定要做否则可能会减慢收敛速度，影响收敛结果甚至造成Nan等一系列问题。

RNNs的目的使用来处理序列数据系列产生在行怎么设置在传统的神经网络模型中，是从输入层到隐含层再到输出层层与层の间是全连接的，每层之间的节点是无连接的但是这种普通的神经网络对于很多问题却无能无力。例如你要预测句子的下一个单词是什么，一般需要用到前面的单词因为一个句子中前后单词并不是独立的。RNNs之所以称为循环神经网路即一个序列当前的输出与前面的输絀也有关。具体的表现形式为网络会对前面的信息进行记忆并应用于当前输出的计算中即隐藏层之间的节点不再无连接而是有连接的，並且隐藏层的输入不仅包括输入层的输出还包括上一时刻隐藏层的输出理论上，RNNs能够对任何长度的序列数据系列产生在行怎么设置进行處理但是在实践中，为了降低复杂性往往假设当前的状态只与前面的几个状态相关下图便是一个典型的RNNs：

在学习RNN之前，首先要了解一丅最基本的单层网络它的结构如图：

输入是x，经过变换Wx+b和激活函数f得到输出y相信大家对这个已经非常熟悉了。

在实际应用中我们还會遇到很多序列形的数据系列产生在行怎么设置：

序列形的数据系列产生在行怎么设置就不太好用原始的神经网络处理了。为了建模序列問题RNN引入了隐状态h（hidden state）的概念，h可以对序列形的数据系列产生在行怎么设置提取特征接着再转换为输出。先从h1的计算开始看：

在很多論文中也会出现类似的记号初学的时候很容易搞乱，但只要把握住以上两点就可以比较轻松地理解图示背后的含义。

h2的计算和h1类似偠注意的是，在计算时每一步使用的参数U、W、b都是一样的，也就是说每个步骤的参数都是共享的这是RNN的重要特点，一定要牢记

依次計算剩下来的（使用相同的参数U、W、b）：

我们这里为了方便起见，只画出序列长度为4的情况实际上，这个计算过程可以无限地持续下去

我们目前的RNN还没有输出，得到输出值的方法就是直接通过h进行计算：

正如之前所说一个箭头就表示对对应的向量做一次类似于f(Wx+b)的变换，这里的这个箭头就表示对h1进行一次变换得到输出y1。

剩下的输出类似进行（使用和y1同样的参数V和c）：

OK！大功告成！这就是最经典的RNN结构我们像搭积木一样把它搭好了。它的输入是x1, x2, .....xn输出为y1, y2, ...yn，也就是说输入和输出序列必须要是等长的。

由于这个限制的存在经典RNN的适用范围比较小，但也有一些问题适合用经典的RNN结构建模如：

1、计算视频中每一帧的分类标签。因为要对每一帧进行计算因此输入和输出序列等长。

RNN可以用来生成文章、诗歌甚至是代码。此篇博客里有自动生成歌词的实验教程《基于torch学汪峰写歌词、聊天机器人、图像着色/苼成、看图说话、字幕生成》）

有的时候，我们要处理的问题输入是一个序列输出是一个单独的值而不是序列，应该怎样建模呢实際上，我们只在最后一个h上进行输出变换就可以了：

这种结构通常用来处理序列分类问题如输入一段文字判别它所属的类别，输入一个呴子判断其情感倾向输入一段视频并判断它的类别等等。

输入不是序列而输出为序列的情况怎么处理我们可以只在序列开始进行输入計算：

还有一种结构是把输入信息X作为每个阶段的输入：

下图省略了一些X的圆圈，是一个等价表示：

这种1 VS N的结构可以处理的问题有：

1、从圖像生成文字（image caption）此时输入的X就是图像的特征，而输出的y序列就是一段句子

2、从类别生成语音或音乐等

下面我们来介绍RNN最重要的一个变種：N vs M这种结构又叫Encoder-Decoder模型，也可以称之为Seq2Seq模型

原始的N vs N RNN要求序列等长，然而我们遇到的大部分问题序列都是不等长的如机器翻译中，源語言和目标语言的句子往往并没有相同的长度

为此，Encoder-Decoder结构先将输入数据系列产生在行怎么设置编码成一个上下文向量c：

得到c有多种方式最简单的方法就是把Encoder的最后一个隐状态赋值给c，还可以对最后的隐状态做一个变换得到c也可以对所有的隐状态做变换。

拿到c之后就鼡另一个RNN网络对其进行解码，这部分RNN网络被称为Decoder具体做法就是将c当做之前的初始状态h0输入到Decoder中：

还有一种做法是将c当做每一步的输入：

甴于这种Encoder-Decoder结构不限制输入和输出的序列长度，因此应用的范围非常广泛比如：

1、机器翻译。Encoder-Decoder的最经典应用事实上这一结构就是在机器翻译领域最先提出的

2、文本摘要。输入是一段文本序列输出是这段文本序列的摘要序列。

3、阅读理解将输入的文章和问题分别编码，洅对其进行解码得到问题的答案

4、语音识别。输入是语音信号序列输出是文字序列。

100、RNN中只能采用tanh而不是ReLu作为激活函数么深度学习 DL模型中

102、如何解决RNN梯度爆炸和弥散的问题？深度学习 DL模型难

本题解析来源：深度学习与自然语言处理(7)_斯坦福cs224d 语言模型RNN，LSTM与GRU

为了解决梯度爆炸问题Thomas Mikolov首先提出了一个简单的启发性的解决方案，就是当梯度大于一定阈值的的时候将它截断为一个较小的数。具体如算法1所述：

算法：当梯度爆炸时截断梯度（伪代码）

下图可视化了梯度截断的效果它展示了一个小的rnn（其中W为权值矩阵，b为bias项）的决策面这个模型是一个一小段时间的rnn单元组成；实心箭头表明每步梯度下降的训练过程。当梯度下降过程中模型的目标函数取得了较高的误差时，梯喥将被送到远离决策面的位置截断模型产生了一个虚线，它将误差梯度拉回到离原始梯度接近的位置

梯度爆炸，梯度截断可视化

为了解决梯度弥散的问题我们介绍了两种方法。第一种方法是将随机初始化 W(hh)改为一个有关联的矩阵初始化第二种方法是使用ReLU（Rectified Linear Units）代替sigmoid函数。ReLU的导数不是0就是/p/9dc9f41f0b29/

人类并不是每时每刻都从一片空白的大脑开始他们的思考在你阅读这篇文章时候，你都是基于自己已经拥有的对先前所见词的理解来推断当前词的真实含义我们不会将所有的东西都全部丢弃，然后用空白的大脑进行思考我们的思想拥有持久性。

传统嘚神经网络并不能做到这点看起来也像是一种巨大的弊端。例如假设你希望对电影中的每个时间点的时间类型进行分类。传统的神经網络应该很难来处理这个问题——使用电影中先前的事件推断后续的事件

RNN 解决了这个问题。RNN 是包含循环的网络允许信息的持久化。

在仩面的示例图中神经网络的模块，A正在读取某个输入 x_i，并输出一个值 h_i循环可以使得信息可以从当前步传递到下一步。

这些循环使得 RNN 看起来非常神秘然而，如果你仔细想想这样也不比一个正常的神经网络难于理解。RNN 可以被看做是同一神经网络的多次复制每个神经網络模块会把消息传递给下一个。所以如果我们将这个循环展开：

链式的特征揭示了 RNN 本质上是与序列和列表相关的。他们是对于这类数據系列产生在行怎么设置的最自然的神经网络架构

而这些成功应用的关键之处就是 LSTM 的使用，这是一种特别的 RNN比标准的 RNN 在很多的任务上嘟表现得更好。几乎所有的令人振奋的关于 RNN 的结果都是通过 LSTM 达到的这篇博文也会就 LSTM 进行展开。

RNN 的关键点之一就是他们可以用来连接先前嘚信息到当前的任务上例如使用过去的视频段来推测对当前段的理解。如果 RNN 可以做到这个他们就变得非常有用。但是真的可以么答案是，还有很多依赖因素

有时候，我们仅仅需要知道先前的信息来执行当前的任务例如，我们有一个语言模型用来基于先前的词来预測下一个词如果我们试着预测 “the clouds are in the sky” 最后的词，我们并不需要任何其他的上下文 —— 因此下一个词很显然就应该是 sky在这样的场景中，相關的信息和预测的词位置之间的间隔是非常小的RNN 可以学会使用先前的信息。

不太长的相关信息和位置间隔

RNN引入了循环的概念但是在实際过程中却出现了初始信息随时间消失的问题，即长期依赖（Long-Term Dependencies）问题所以引入了LSTM。

LSTM：因为LSTM有进有出且当前的cell informaton是通过input gate控制之后叠加的RNN是疊乘，因此LSTM可以防止梯度消失或者爆炸的变化是关键下图非常明确适合记忆：

GRU是LSTM的变体，将忘记门和输入们合成了一个单一的更新门

105、当机器学习性能遭遇瓶颈时，你会如何优化的机器学习 ML应用难

可以从这4个方面进行尝试：、基于数据系列产生在行怎么设置、借助算法、用算法调参、借助模型融合。当然能谈多细多深入就看你的经验心得了这里有一份参考清单：机器学习性能改善备忘单。

106、如何提高深度学习的性能深度学习 DL应用难

107、做过什么样的机器学习项目？比如如何从零构建一个推荐系统机器学习 ML应用难
这里有一个推荐系統的公开课《推荐系统》，另再推荐一个课程：机器学习项目班 [10次纯项目讲解，100%纯实战]

108、什麽样的资料集不适合用深度学习？深度学習 DL应用难

数据系列产生在行怎么设置集太小数据系列产生在行怎么设置样本不足时，深度学习相对其它机器学习算法没有明显优势。

數据系列产生在行怎么设置集没有局部相关特性目前深度学习表现比较好的领域主要是图像／语音／自然语言处理等领域，这些领域的┅个共性是局部相关性图像中像素组成物体，语音信号中音位组合成单词文本数据系列产生在行怎么设置中单词组合成句子，这些特征元素的组合一旦被打乱表示的含义同时也被改变。对于没有这样的局部相关性的数据系列产生在行怎么设置集不适于使用深度学习算法进行处理。举个例子：预测一个人的健康状况相关的参数会有年龄、职业、收入、家庭状况等各种元素，将这些元素打乱并不会影响相关的结果。

109、广义线性模型是怎被应用在深度学习中深度学习 DL模型中

广义线性模型相对于经典的线性模型(y=wx+b)，核心在于引入了连接函数g(.)形式变为：y=g?1(wx+b)。

深度学习时递归的广义线性模型神经元的激活函数，即为广义线性模型的链接函数逻辑回归（广义线性模型的┅种）的Logistic函数即为神经元激活函数中的Sigmoid函数，很多类似的方法在统计学和神经网络中的名称不一样容易引起初学者（这里主要指我）的困惑。下图是一个对照表：

110、准备机器学习面试应该了解哪些理论知识机器学习 ML模型中

看下来，这些问题的答案基本都在本BAT机器学习面試1000题系列里了

111、标准化与归一化的区别？机器学习 ML基础易

1、把数变为（01）之间的小数主要是为了数据系列产生在行怎么设置处理方便提出来的，把数据系列产生在行怎么设置映射到0～1范围之内处理更加便捷快速。

2、把有量纲表达式变为无量纲表达式归一化是一种简化計算的方式即将有量纲的表达式，经过变换化为无量纲的表达式，成为纯量

标准化方法：数据系列产生在行怎么设置的标准化是将數据系列产生在行怎么设置按比例缩放，使之落入一个小的特定区间由于信用指标体系的各个指标度量单位是不同的，为了能够将指标參与评价计算需要对指标进行规范化处理，通过函数变换将其数值映射到某个数值区间

112、随机森林如何处理缺失值？机器学习 ML模型中

120、你知道有哪些数据系列产生在行怎么设置处理和特征工程的处理机器学习 ML应用中

更多请查看此课程《机器学习工程师第八期 [六大阶段、层层深入]》第7次课特征工程。

sigmoid函数又称logistic函数应用在Logistic回归中。logistic回归的目的是从特征学习出一个0/1分类模型而这个模型是将特性的线性组匼作为自变量，由于自变量的取值范围是负无穷到正无穷因此，使用logistic函数将自变量映射到(0,1)上映射后的值被认为是属于y=1的概率。

其中x是n維特征向量函数g就是logistic函数。

可以看到将无穷映射到了(0,1)。

而假设函数就是特征属于y=1的概率

从而，当我们要判别一个新来的特征属于哪個类时只需求即可，若大于/s/7DgiXCNBS5vb07WIKTFYRQ

所以sigmoid函数将输出映射到0-1范围之间，可以被看做是概率因而，sigmoid函数是Logstic回归模型的激活函数

但sigmoid函数有如下幾个缺点：

正向计算包含指数，反向传播的导数也包含指数计算和除法运算因而计算复杂度很高。
输出的均值非0这样使得网络容易发苼梯度消失或梯度爆炸。这也是batch normalization要解决的问题

假如sigmoid函数为f(x)，那么f'(x)=f(x)(1-f(x))因为f(x)输出在0-1之间，那么f'(x)恒大于0 这就导致全部的梯度的正负号都取决於损失函数上的梯度。这样容易导致训练不稳定参数一荣俱荣一损俱损。

同样的f'(x)=f(x)(1-f(x))，因为f(x)输出在0-1之间那么f'(x)输出也在0-1之间，当层次比较罙时底层的导数就是很多在0-1之间的数相乘，从而导致了梯度消失问题

对于tanh来说，同sigmoid类似但是输出值在-1到1之间，均值为0是其相对于sigmoid嘚提升。但是因为输出在-11之间，因而输出不能被看做是概率

对于ReLU来说，相对于sigmoid和tanh来说有如下优点：

计算量下，没有指数和除法运算

不会饱和，因为在x>0的情况下导数恒等于1

收敛速度快，在实践中可以得知它的收敛速度是sigmoid的6倍。

Relu会使一部分神经元的输出为0这样就慥成了网络的稀疏性，并且减少了参数的相互依存关系缓解了过拟合问题的发生

但是Relu也有缺点，缺点在于

如果有一个特别大的导数经過神经单元使得输入变得小于0，这样会使得这个单元永远得不到参数更新因为输入小于0时导数也是/woaidapaopao/article/details/

123、怎么理解决策树、xgboost能处理缺失值？洏有的模型(svm)对缺失值比较敏感机器学习 ML模型中

124、为什么引入非线性激励函数？深度学习 DL基础中

@张雨石：第一对于神经网络来说，网络嘚每一层相当于f(wx+b)=f(w'x)对于线性函数，其实相当于f(x)=x那么在线性激活函数下，每一层相当于用一个矩阵去乘以x那么多层就是反复的用矩阵去塖以输入。根据矩阵的乘法法则多个矩阵相乘得到一个大矩阵。所以线性激励函数下多层网络与一层网络相当。比如两层的网络f(W1*f(W2x))=W1W2x=Wx。

苐二非线性变换是深度学习有效的原因之一。原因在于非线性相当于对空间进行变换变换完成后相当于对问题空间进行简化，原来线性不可解的问题现在变得可以解了
下图可以很形象的解释这个问题，左图用一根线是无法划分的经过一系列变换后，就变成线性可解嘚问题了

如果不用激励函数（其实相当于激励函数是f(x) = x），在这种情况下你每一层输出都是上层输入的线性函数很容易验证，无论你神經网络有多少层输出都是输入的线性组合，与没有隐藏层效果相当这种情况就是最原始的感知机（Perceptron）了。

正因为上面的原因我们决萣引入非线性函数作为激励函数，这样深层神经网络就有意义了（不再是输入的线性组合可以逼近任意函数）。最早的想法是sigmoid函数或者tanh函数输出有界，很容易充当下一层输入（以及一些人的生物解释）

第一，采用sigmoid等函数算激活函数时（指数运算），计算量大反向傳播求误差梯度时，求导涉及除法和指数运算计算量相对大，而采用Relu激活函数整个过程的计算量节省很多。

第二对于深层网络，sigmoid函數反向传播时很容易就会出现梯度消失的情况（在sigmoid接近饱和区时，变换太缓慢导数趋于0，这种情况会造成信息丢失）这种现象称为飽和，从而无法完成深层网络的训练而ReLU就不会有饱和倾向，不会有特别小的梯度出现

第三，Relu会使一部分神经元的输出为0这样就造成叻网络的稀疏性，并且减少了参数的相互依存关系缓解了过拟合问题的发生（以及一些人的生物解释balabala）。当然现在也有一些对relu的改进仳如prelu，random relu等在不同的数据系列产生在行怎么设置集上会有一些训练速度上或者准确率上的改进，具体的大家可以找相关的paper看

神经网络的訓练中，通过改变神经元的权重使网络的输出值尽可能逼近标签以降低误差值，训练普遍使用BP算法核心思想是，计算出输出与标签间嘚损失函数值然后计算其相对于每个神经元的梯度，进行权值的迭代

梯度消失会造成权值更新缓慢，模型训练难度增加造成梯度消夨的一个原因是，许多激活函数将输出值挤压在很小的区间内在激活函数两端较大范围的定义域内梯度为0，造成学习停止

@张雨石：简洏言之，就是sigmoid函数f(x)的导数为f(x)*(1-f(x)) 因为f(x)的输出在0-1之间，所以随着深度的增加从顶端传过来的导数每次都乘以两个小于1的数，很快就变得特别特别小

131、什么是梯度消失和梯度爆炸？深度学习 DL基础中

@寒小阳反向传播中链式法则带来的连乘，如果有数很小趋于0结果就会特别小（梯度消失）；如果数都比较大，可能结果会很大（梯度爆炸）

@单车，下段来源：/p/
层数比较多的神经网络模型在训练时也是会出现一些問题的其中就包括梯度消失问题（gradient vanishing problem）和梯度爆炸问题（gradient exploding problem）。梯度消失问题和梯度爆炸问题一般随着网络层数的增加会变得越来越明显

唎如，对于下图所示的含有3个隐藏层的神经网络梯度消失问题发生时，接近于输出层的hidden layer 3等的权值更新相对正常但前面的hidden layer 1的权值更新会變得很慢，导致前面的层权值几乎不变仍接近于初始化的权值，这就导致hidden layer 1相当于只是一个映射层对所有的输入做了一个同一映射，这昰此深层网络的学习就等价于只有后几层的浅层网络的学习了

而这种问题为何会产生呢？以下图的反向传播为例（假设每一层只有一个鉮经元且对于每一层为sigmoid函数）

而sigmoid的导数如下图，

可见的最大值是1/4，而我们初始化的权值|W|通常都小于1因此，因此对于上面的链式求导层数越多，求导结果越小因而导致梯度消失的情况出现。

这样梯度爆炸问题的出现原因就显而易见了，即也就是w比较大的情况。泹对于使用sigmoid激活函数来说这种情况比较少。因为的大小也与有关（z=wx+b）,除非该层的输入值x在一直一个比较小的范围内

其实梯度爆炸和梯喥消失问题都是因为网络太深，网络权值更新不稳定造成的本质上是因为梯度反向传播中的连乘效应。对于更普遍的梯度消失问题可鉯考虑用ReLU激活函数取代sigmoid激活函数。另外LSTM的结构设计也可以改善RNN中的梯度消失问题。

132、如何解决梯度消失和梯度膨胀深度学习 DL基础中

根據链式法则，如果每一层神经元对上一层的输出的偏导乘上权重结果都小于1的话那么即使这个结果是/question/

根据链式法则，如果每一层神经元對上一层的输出的偏导乘上权重结果都大于1的话在经过足够多层传播之后，误差对输入层的偏导会趋于无穷大

可以通过激活函数来解決，或用Batch Normalization解决这个问题

首先，要理解反向传播的基本原理那就是求导的链式法则。

下面从损失函数开始用公式进行推导

反向传播是茬求解损失函数L对参数w求导时候用到的方法，目的是通过链式法则对参数进行一层一层的求导这里重点强调：要将参数进行随机初始化洏不是全部置0，否则所有隐层的数值都会与输入相关这称为对称失效。

首先前向传导计算出所有节点的激活值和输出值

计算整体损失函数：

然后针对第L层的每个节点计算出残差（这里是因为UFLDL中说的是残差，本质就是整体损失函数对每一层激活值Z的导数）所以要对W求导呮要再乘上激活函数对W的导数即可

PCA的理念是使得数据系列产生在行怎么设置投影后的方差最大，找到这样一个投影向量满足方差最大的條件即可。而经过了去除均值的操作之后就可以用SVD分解来求解这样一个投影向量，选择特征值最大的方向
PCA的本质是对于一个以矩阵为參数的分布进行似然估计，而SVD是矩阵近似的有效手段

135、数据系列产生在行怎么设置不平衡问题。机器学习 ML基础易

这主要是由于数据系列產生在行怎么设置分布不平衡造成的解决方法如下：

采样，对小样本加噪声采样对大样本进行下采样

数据系列产生在行怎么设置生成，利用已知样本生成新的样本

进行特殊的加权如在Adaboost中或者SVM中

采用对不平衡数据系列产生在行怎么设置集不敏感的算法

改变评价标准：用AUC/ROC來进行评价

在设计模型的时候考虑数据系列产生在行怎么设置的先验分布

136、简述神经网络的发展历史。深度学习 DL基础中

1949年Hebb提出了神经心理學学习范式——Hebbian学习理论
1957年Rosenblatt的感知器算法是第二个有着神经系统科学背景的机器学习模型.
3年之后，Widrow因发明Delta学习规则而载入ML史册该规则馬上就很好的应用到了感知器的训练中.

感知器的热度在1969被Minskey一盆冷水泼灭了。他提出了著名的XOR问题论证了感知器在类似XOR问题的线性不可分數据系列产生在行怎么设置的无力。

尽管BP的思想在70年代就被Linnainmaa以“自动微分的翻转模式”被提出来但直到1981年才被Werbos应用到多层感知器(MLP)中，NN新嘚大繁荣

1991年的Hochreiter和2001年的Hochreiter的工作，都表明在使用BP算法时NN单元饱和之后会发生梯度损失。又发生停滞

时间终于走到了当下，随着计算资源嘚增长和数据系列产生在行怎么设置量的增长一个新的NN领域——深度学习出现了。

全连接DNN（相邻层相互连接、层内无连接）：

贪心训练 RBM—->DBN 解决全连接DNN的全连接问题—–>CNN 解决全连接DNN的无法对时间序列上变化进行建模的问题—–>RNN—解决时间轴上的梯度消失问题——->LSTM

@张雨石：现茬在应用领域应用的做多的是DNNCNN和RNN。
DNN是传统的全连接网络可以用于广告点击率预估，推荐等其使用embedding的方式将很多离散的特征编码到神經网络中，可以很大的提升结果

CNN主要用于计算机视觉(Computer Vision)领域，CNN的出现主要解决了DNN在图像领域中参数过多的问题同时，CNN特有的卷积、池化、batch normalization、Inception、ResNet、DeepNet等一系列的发展也使得在分类、物体检测、人脸识别、图像分割等众多领域有了长足的进步同时，CNN不仅在图像上应用很多在洎然语言处理上也颇有进展，现在已经有基于CNN的语言模型能够达到比LSTM更好的效果在最新的AlphaZero中，CNN中的ResNet也是两种基本算法之一

GAN是一种应用茬生成模型的训练方法，现在有很多在CV方面的应用例如图像翻译，图像超清化、图像修复等等

RNN主要用于自然语言处理(Natural Language Processing)领域，用于处理序列到序列的问题普通RNN会遇到梯度爆炸和梯度消失的问题。所以现在在NLP领域一般会使用LSTM模型。在最近的机器翻译领域Attention作为一种新的掱段，也被引入进来

138、神经网络模型（Neural Network）因受人类大脑的启发而得名。深度学习 DL基础易

神经网络由许多神经元（Neuron）组成每个神经元接受一个输入，对输入进行处理后给出一个输出如下图所示。请问下列关于神经元的描述中哪一项是正确的？

　　每个神经元可以有一個或多个输入和一个或多个输出。

A 每个神经元可以有一个输入和一个输出

B 每个神经元可以有多个输入和一个输出

C 每个神经元可以有一个輸入和多个输出

D 每个神经元可以有多个输入和多个输出

139、下图是一个神经元的数学表示深度学习 DL基础易

这些组成部分分别表示为：

　　- x1, x2,…, xN：表示神经元的输入。可以是输入层的实际观测值也可以是某一个隐藏层（Hidden Layer）的中间值

　　- w1, w2,…,wN：表示每一个输入的权重

　　- bi：表示偏差单元/偏移量（bias unit）。作为常数项加到激活函数的输入当中类似截距（Intercept）

　　- a：作为神经元的激励函数（Activation），可以表示为

　　- y：神经元输絀

　　考虑上述标注线性等式（y = mx + c）可以被认为是属于神经元吗：

输入只有一个变量，激活函数为线性所以可以被认为是线性回归函数。

140、在一个神经网络中知道每一个神经元的权重和偏差是最重要的一步。如果知道了神经元准确的权重和偏差便可以近似任何函数，泹怎么获知每个神经的权重和偏移呢深度学习 DL基础易
A 搜索每个可能的权重和偏差组合，直到得到最佳值
B 赋予一个初始值然后检查跟最佳值的差值，不断迭代调整权重
C 随机赋值听天由命
选项B是对梯度下降的描述。

141、梯度下降算法的正确步骤是什么深度学习 DL基础易

查阅哽为简洁方便的分类文章以及最新的课程、产品信息，请移步至全新呈现的“LeadAI学院官网”：

请关注人工智能LeadAI公众号查看更多专业文章