第二章-kettle的初步使用
kettle安装
java安装
kettle的下载安装与spoon的启动
kettle的使用
转换的基本概念
转换是ETL解决方案中最主要的部分,它负责处理抽取、转换、加载各阶段对数据行的各种操作
组成:步骤、跳、注释
步骤
步骤是转换中的基本组成部分,是一个图形化的组件
关键特性:(四点),最主要的一点是步骤的名字唯一
1 | // 步骤的四个主要特性 |
转换的跳
跳定义了步骤之间进行数据传输的单向通道
从执行角度看:不可能定义执行的顺序和起点步骤、终点步骤;
从功能角度看:有明确的起点步骤和终点步骤
数据行
在kettle里数据的单位是行.
一个数据行是零到多个字段的结合,是kettle的数据单位,简称行。
字段包括的数据类型:7大类(String、Number、Integer、Date、Boolean、Binary)
第一个转换案例
创建转换
核心对象
可视化编程
执行结果
状态栏
主对象树
参数配置
环境变量配置
环境变量:全局的,对所有转换和作业有效
命名参数配置
命名参数:局部的,仅对当前转换和作业有效
定时启动转换
在windows下,可以使用控制面板中的计划任务执行批处理
实例
1 | cd /d d:\data-integration |
1 | //参数描述表 |