文字版教程:
1.在数据中心-智能ETL界面点击右上角【+新建ETL】进入可视化操作界面。操作界面分两大模块,左侧是配置页,右侧是编辑页。首先从左侧【数据集】内拖拽【输入数据集】至右侧的编辑页,在ETL的处理中至少需要1项输入数据集,当然您也可以根据需求添加多个。

2.单击【输入数据集】左侧会跳转出现所有数据集,选择您需要的数据集后点击【完成】就可以导入了。接着【点击刷新】确认导入的内容。然后从左侧配置页内根据需求进行规则配置的拖拽连线和数据处理。

说明:比如:选择【添加计算列】拖拽至右侧编辑页,将输入数据集与添加计算列进行连线,单击【添加计算列】左侧状态栏变换,点击【添加计算字段】选择需要的函数,编写公式、填写名称、选择字段类型,所有的函数均有相应的示例可供参考。最后选择【输出数据集】拖拽至右侧进行连线并在左上角编辑名称,右上角点击【保存】就完成了数据处理。

3.在ETL中还有多种灵活的配置项可供您操作:

1)“列编辑”内“合并列”可以对现有数据集中的多列进行合并,给与新的列名,一般用于特定文本信息之间的合并。

2)“分组聚合”是通过对某维度或者某几类维度的数值处理,将多行数据按照维度聚合至一行。

3)“选择列”主要针对一些规范化程度较低的数据可以通过此功能对数据集的各字段进行重命名、选择得到清晰有效的数据集。

4)“行转列”是在您所掌握的数据集维度较为复杂或者需要进行横向分析的时候,进行转换形成新指标的数据集。

5)而“列转行”是行转列的逆操作。通过列转行可以把多个指标归总到一个列中去进行分析。

4.“数据编辑”内“筛选数据行”您可以通过添加筛选规则,筛选输入数据集中的数据,对数据进行前期的清洗和准备。“去重”可以对多行进行去重转换,通常使用输入数据集的主键作为去重列。“值替换”可以对数据集的某一具体值进行替换,如果您大多数情况需要处理null值,可以直接选择“null值替换”更加便捷。

5.“数据集组合”内“行拼接”可以把同业务不同来源的数据拼接在一起。“关联数据”通俗一点理解是“列拼接”不同的是需要找到双方数据集中相同关联列进行拼接,且拼接的形式比较多样化,最终呈现的数据集也可以自定义列。

6.“高级计算”在创建ETL时就可以针对数据库进行SQL的输入,做到真正的智能数据处理。