阿里云数据可视化数据模型的创建和使用

连接完数据源后,便可以将需要的多张数据表关联成一张宽表,并进行需要的数据处理(如字段重命名、新建计算字段、创建层级、调整字段顺序等操作),建立数据模型以便于进行后续的数据可视化分析工作。

多表关联

当拖入多张数据表时,即可实现多表的关联分析(对应为 SQL 语句中的多表 Join)。多表关联时需要选定两个表关联的字段以及关联的类型(目前支持内连接(inner join)和左连接(left join)):

两个表设置关联之后,维度和度量就会分文件夹的方式列出,每个维度和度量以及文件夹都可以鼠标「右键」进行增删改等多种操作,也可拖拽进行顺序的调整或者隐藏一些在分析中用不到的字段等:

维度和度量是什么

维度:分析数据时的粒度

度量:指标的聚合汇总值

聚合方式:汇总的方式,如求和、均值、最大值、最小值

例如我们的官方示例数据源中的销售订单数据(sale_order):

比如我们分析「各个地区的销售价格」,「地区」就是维度,「价格」就是度量,每个地区都有成百上千行数据,我们对这些数据进行了求和汇总。:

数据可视化 默认会把字符型的字段归类为维度,数值型的字段归类为度量,用户也可以手动更改字段的类型。

计算字段

有些时候在分析时,需要对多个字段进行加减乘除、以及一些 SQL 函数计算(如:CONCAT、DATEDIFF、ADDDATE 等)等操作后形成一个新的计算字段,数据可视化 中对度量和维度都可以新建计算字段:

数据类型转换

数据可视化 中支持转换字段的数据类,例如将字符串类型的 20200108 转换成标准化的日期类型,这样在之后的数据分析时我们就会把它当成日期类型来处理、计算和展示。

数据筛选

在创建数据模型时,例如我们想让这个数据模型之后只用来分析「东北」地区的数据,而不关心其它地区的数据。此时就可以对该模型设置「数据筛选器」:

点击「数据筛选器」,并新增一个筛选器,对「地区」字段做限制,只勾选上「东北」

加上该筛选器之后,点击页面中间的「查询数据」,即只能看到「东北」地区的数据,之后基于该数据模型的数据可视化分析也都将只能查询到「东北」地区的数据。

更多关于数据筛选器的描述详见数据筛选。