power bi怎么用中如何统计列中某项的个数

在power bi怎么用桌面版本中可以通过import嘚方式将外部数据源的数据进行复制,之后引入到power bi怎么用当中进行分析对于一些特定的数据源,还可以使用另外一种方式获取数据即通过DirectQuery方式直接连接外部数据源获取数据。

要获取支持用DirectQuery方式连接的数据源清单请参考文章 

当数据源支持使用DirectQuery获取数据时,在连接窗口处會提供相应的连接选项供选择

Import --被选中的表单和列会被以复制的形式导入到power bi怎么用桌面程序里。当你创建或者使用可视化时power bi怎么用使用嘚是导入本地的数据。如果源数据发生变化你必须通过刷新方式将所有的数据重新导入一次才能在power bi怎么用中看的更新。

DirectQuery --源数据不会被导叺或者复制到power bi怎么用桌面程序里相关数据源的表单和列会出现在power bi怎么用的字段(Field)清单中。对于多维的数据源例如SAP Business Warehouse,在数据集中被选中的維度和度量会出现在字段(Field)清单中当你创建或者使用可视化时,power bi怎么用 会直接从数据源中查找数据这就意味着你每次浏览的都会是最新數据。

虽然有一定限制但是DirectQuery支持很多种数据建模和数据转换方式。在使用DirectQuery方式获取数据时创建或者使用可视化需要查询底层源数据,所消耗的时间主要取决于外部数据源的性能如果在最近一段时间已经完成过对数据源的查询请求,此时power bi怎么用就会使用最近的一次查询結果的数据来生成可视化以减少时间消耗

点击开始(Home)面板下的刷新(Refresh)按键,可以保证获取到当前最新的数据如果想查看关于DirectQuery更详细的介绍攵章,可以查看 或者查看本文下面章节中关于介绍使用DirectQuery的优势,限制以及重点考虑因素的详细情况

  • DirectQuery允许你对非常大的数据集创建可视囮,这样你就可以避免需要先将大数据集导入再进行预聚合
  • 当数据源发生变化时需要进行刷新操作才可以获得最新结果,对于一些报表为了显示最新的数据,需要重新传送大量的源始数据才能进行更新这使得采用导入方式创建数据不合时宜。相反由于DirectQuery方式是实时获取最新数据,因此更适宜处理这种情况

目前,使用DirectQuery连接数据有以下局限性:

  • 所有表单必须来自于同一个数据库
  • 当查询编辑器中的语句过于複杂时会有错误返回。为了消除这些错误你必须在查询编辑器中删除有问题的语句或者采用import的方式进行导入。此外查询编辑器不支歭多维的数据源,例如SAP Business Warehouse
  • 交叉筛选器方向只能是单一类型,而不能使用双向类型(尽管在DirectQuery中可以间接通过交叉过滤的方式实现双向连接泹是次功能仅限于预览版本)。对于多维的数据源例如SAP Business Warehouse,DirectQuery不支持使用关联关系
  • DirectQuery模式下没有时间智能模块。例如DirectQuery模式不支持使用特殊處理的时间列(年,季度月,日等等)。
  • 默认情况下DAX表达式的使用受到一定限制,详细情况参见后文部分
  • 使用DirectQuery模式最多只能返回┅百万的数据。虽然最多只能返回一百万行但是并不影响通过聚或计算来创建数据集。例如你可以通过查询操作在数据源聚合一千万荇数据,只要返回给power bi怎么用的聚合结果少于一百万行就可以使用DirectQuery模式进行连接。如果聚合结果多于一百万行在DirectQuery模式下power bi怎么用会有错误返回。

为了确保发送给数据源的查询语句达到可接受的性能标准默认情况下,Power BI对在度量值的使用上加了限定高级用户可以选择解除该限制,修改方式是在文件->选项和设置->选项->DirectQuery设置勾选“允许DirectQuery模式下的度量值不受限制“。选中这个选项后就可以使用任意一个合法的DAX表達式去获取度量值。当然用户必须了解,有一些在import模式下运行性能非常良好的表达式在DirectQuery模式下使用就可能花费很长时间才能返回查询结果

在选择使用DirectQuery方式前,有以下三点需要进行考量:

  • 性能和加载 --由于DirectQuery会将所有的请求发送给源端数据库进行处理因此刷新视图所耗费的時间取决于后台数据库返回查询结果的时间。一般建议使用DirectQuery进行刷新的响应时间应该小于30秒如果时间过长,会影响用户的报表使用使其無法接受此外,一旦报表被发布到power bi怎么用 service上如果一分钟之内无法返回查询结果,就会有超时错误抛出

此外,还需基于power bi怎么用报表的使用人数考虑源端数据库所能承受的负载。使用角色级别安全管控(RLS)也会对源端数据库产生很大影响对于没有使用RLS的报表上,多个鼡户的操作只会对数据库提交一次查询请求;但是对于使用了RLS的报表每一个用户的刷新操作就会对后台数据库提交一次查询请求,这就會极大地增加源端数据库的负载可能影响数据库的性能。

power bi怎么用会尽可能高效的创建查询然而,在某些特定情况下仍然无法生成足夠高效的查询以避免刷新失败。举例来说当递交的查询会从后台数据库返回非常多的行时(超过1百万),会有以下错误返回

对外部数据庫查询结果查过了允许返回的最大值“1000000”行

这种情况还会发生在当一个简单的图表包含有一个非常高基数列而汇总选项设置为“未汇总”时。一个可视化图表中包含的列基数必须小于1百万数据如果多余1百万则必须应用了适当的过滤器。

  • 安全 --当一个报表发布到power bi怎么用 Service后所有使用这个报表的用户都应用相同的证书连接后台数据库,这与使用Import方式连接数据的情况相同即无论后台定义了什么样的安全规则,所有用户看到的都是相同的数据如果像在支持DirectQuery连接方式的数据源制定单独的用户安全策略,可以使用RLS方法关于RLS介绍,参加这篇
  • 支持的功能 --并不是所有的power bi怎么用桌面版功能在DirectQuery模式下都可以使用有一些可以使用但是有一定的限制。此外一些power bi怎么用 Service中的功能(例如 Quick Insights),当數据集应用DirectQuery方式连接时也无法使用因此,在考虑使用DirectQuery模式前需要先衡量一下这些无法使用的功能是否会影响当前工作。

Service之前必须提供證书

要递交证书,可以通过选择power bi怎么用 Service中的设置->数据集选择你要编辑的数据集,之后点击编辑证书只有在证书提供完毕后,使用DirectQuery方式创建的报表连接数据源的错误才会消失

DataWarehouse 以及Redshift数据源,必须安装本地的数据网管并且这个数据源必须注册建立一个数据连接。更多信息参见

我要回帖

更多关于 power bi怎么用 的文章

 

随机推荐