随着公司的进一步发展,产生了大量的数据,而这些数据中包含了大量的垃圾信息,当然了还有一些有价值的数据,而我们的方法就是利用Kettle对这些数据进行抽取、分离、清洗等一系列转化。一般把kettle安装在win7系统下,这里我要讲解的是安装在Linux服务器中。
工具/原料
linux操作系统 64位
jdk-8u144-linux-x64.tar.gz(http://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151.html)
Kettle6.1(pdi-ce-6.1.A-stable.zip)
方法/步骤
linux图像化界面安装
1.前提linux联网
测试是否联网:
ping www.baidu.com
如图安装成功
2.以此使用下面命令:
yum -y groupinstall Desktop
yum -y groupinstall "X Window System"
3.执行命令:startx
即可启动图形化界面
安装jdk-8u144-linux-x64.tar.gz
1.首先进入usr目录下:cd /usr .
查看是否存在java文件,如果没有,则创建:mkdir java
2.将文件jdk-8u144-linux-x64.tar.gz移动到/usr/java目录下,并解压:
tar -zxvf jdk-8u144-linux-x64.tar.gz
mv jdk-8u144 jdk1.8
3.设置环境变量
利用vim /etc/profile打开文件,并在文件中设置:
export JAVA_HOME=/usr/java/jdk1.8
export JRE_HOME=$JAVA_HOME/jre
export CLASSPATH=.:$JAVA_HOME/lib:$JRE_HOME/lib
export PATH=$JAVA_HOME/bin:$PATH
4.保存退出。
5.使环境变量生效:source /etc/profile
6.验证jdk是否安装成功
java -version
java
javac
三者都成功才算成功
kettle安装
1.linux下创建一个叫kettle的文件夹,把我们从网上下载到的文件(pdi-ce-6.1.A-stable.zip)通过解压放到该文件夹下:
unzip pdi-ce-6.1.A-stable.zip
2.进入到pdi-ce-6.1.A-stable/data-integration目录下:cd /pdi-ce-6.1.A-stable/data-integration
3.添加权限:chmod +x *.sh
4.测试安装是否成功:
./kitchen.sh
5.运行弹出图形化界面:
./spoon.sh
6.弹出图形化,安装成功。
更多Linux知识可参考:
https://www.linuxprobe.com/zhidao