Kattle将Oracle数据导入到Hadoop
一、开启Kattle
二、新建一个转换流程
三、在输入中-找到表输入,拖放到右侧的窗口中
四、双击表输入,配置数据库参数
五、将oracle的jdbc放到kattel的lib中,重启kattel
六、再次验证参数,验证通过
七、测试下SQL执行
八、在输出中,将hadoop组件拖到面板中,并按shift键建立关联
九、双击hadoop组件,配置信息。记下测试弹出面板的CHD5.10信息。
十、点击测试,显示验证失败
十一、配置kattel中haloop的信息,和上面的CHD5.10一致
十二、将hadoop的配置复制到该文件夹下
十三、再次验证,已连接到hadoop
十四、选择数据要输入的hadoop文件夹
十五、选择一个新建的文件夹
十六、建立两个组件的关联
十七、选择参数
十八、启动转换
十九、确定启动
20、转换流程开始