本文将为用户介绍「抽取数据」和「直连数据」是什么,以及它们之间有什么区别,如何去选择等等。
抽取数据
通过缓存数据/构建数据副本的方式,支撑较大数据量的OLAP深度自助分析,加速查询的性能,保障其分析体验,同时尽可能避免对业务数据库的影响。
使用的是直连数据集时,FineBI直接使用用户的数据库中的数据计算,FineBl中的数据与数据库中的数据保持同步。
借助客户大数据平台/数仓,满足客户高并发、大数据量前提下的简单自助分析。
直连数据
1)千万数据复杂血缘自助分析
2)使用多个数据库中的数据做联合分析
2)用户量和并发比较高,需要能够线性扩展
3)对于实时性要求较高
4)对于数据安全性要求较高
5)数据量不大,并且觉得抽取比较麻烦
一般适用于大型企业,自己大数据平台建设完善,比较看重数据安全,不希望数据重新抽取一份,对数据实时性要求高
注:本节描述的数据量均指结果集数据量,即仪表板中使用的直接表的数据量,而不是指基础表。
结果集数据量是小数据量(千万级及以下),用抽取数据
结果集数据量是大数据量(亿级及以下),优先推荐抽取数据
结果集数据量在亿级以上,且时效性要求高(小时级的更新),推荐使用直连数据
1)如果直连数据库是OLAP类型的高性能数据库(如:StarRocks、Doris、Hologres、Vertica、GaussDB200),可支持简单自助分析。
简单自助分析场景是指:
①自助数据集复杂计算步骤数(左右合并、从其他表添加列、新增汇总列、新增公式列-DEF函数、行转列、列转行的总步骤数)≤2
②限制直连数据集血缘层数上限为3层
③如使用主题模型,自助数据集中就不能有复杂计算步骤)
2)如果直连数据库是其他数据库,仅支持自助数据集添加一个复杂计算步骤且血缘上限为3层。
依据数据库的逻辑进行过滤
若数据库逻辑是空过滤空,null过滤null,则结果与抽取不同
鼠标选中内容,快速反馈问题
鼠标选中存在疑惑的内容,即可快速反馈问题,我们将会跟进处理。