开源ETL东西Kettle简介ITeye - 牛牛娱乐

开源ETL东西Kettle简介ITeye

2019-01-11 14:35:59 | 作者: 若翠 | 标签: 资源库,东西,运转 | 浏览: 2260

1.1.  什么是 kettle

Kettle 也叫 PDI,在2006年 Kettle 加入了开源的 BI 安排 Pentaho, 正式命名为PDI,英文全称为Pentaho Data Integeration。Kettle 是“Kettle E.T.T.L. Envirnonment”只取首字母的缩写,这意味着它被规划用来协助你完成你的ETTL需求:抽取、转化、装入和加载数据;翻译成中文称号应该叫水壶,姓名的来源正如该项意图主程序员 MATT 在一个论坛里说的哪样:期望把各种数据放到一个壶里然后以一种指定的格局流出。

Spoon是一个图形用户界面,它答应你运转转化或许使命,其间转化是用Pan东西来运转,使命是用Kitchen来运转。Pan是一个数据转化引擎,它能够履行许多功用,例如:从不同的数据源读取、操作和写入数据。Kitchen是一个能够运转运用XML或数据资源库描绘的使命。一般使命是在规则的时刻距离内用批处理的方式主动运转。

 

1.2.  Kettle的装置

要运转kettle东西有必要装置Sun公司的JAVA运转环境,kettle 4.2.0需求运转java 1.6或许更高版别,Kettle的下载能够到获得最新版别。kettle不需求装置,装置好java环境后,在操作体系环境变量path中装备jre途径,把kettle东西压缩包解压后可直接运用。

 

1.3.  运转Spoon

下面是在不同的渠道上运转 Spoon所支撑的脚本:

Spoon.bat:在windows 渠道运转Spoon。

Spoon.sh: 在 Linux、Apple OSX、Solaris 渠道运转 Spoon。

1.4.  资源库

资源库是用来保存转化使命的,用户经过图形界面创立的转化使命能够保存在资源库中。资源库能够使多用户同享转化使命,转化使命在资源库中是以文件夹方式分组办理的,用户能够自定义文件夹称号。资源库有两种方式:

一、Kettle database repository,即保存在各种常见的数据库资源库类型,用户经过用户名/暗码来访问资源库中的资源,默许的用户名/暗码是admin/admin和guest/guest。

二、Kettle file repository,保存在服务器硬盘文件夹内的资源库类型,此类型的资源库无需用户进行登录,直接进行操作。

 

当然,资源库并不是有必要的,假如没有资源库,用户还能够把转化使命保存在xml文件中。为了便利办理,主张用户树立并运用数据库类型资源库Kettle database repository。

温馨提示:

一、在删去资源库中单个内容时,不会提示“是否确认需求删去”,需求特别注意。

二、win7体系下,“Kettle file repository”类型资源库创立文件夹后,无法删去文件夹,不确认是Kettle东西自身的bug或许是在win7操作体系下的bug。

三、“Kettle database repository”类型资源库虽然有需求用户和暗码进行登录,但现在还没有相应的权限操控。

 

 

版权声明
本文来源于网络,版权归原作者所有,其内容与观点不代表牛牛娱乐立场。转载文章仅为传播更有价值的信息,如采编人员采编有误或者版权原因,请与我们联系,我们核实后立即修改或删除。

猜您喜欢的文章

阅读排行

  • 1

    Oracle中rownum、rowid、rowITeye

    相同,记载,排名
  • 2

    中止Oracle JobITeye

    中止,履行,运转
  • 3
  • 4
  • 5
  • 6

    oracle defered constraintITeye

    一个,发现,今日
  • 7
  • 8
  • 9

    asmcmd详解(原创)ITeye

    检查,指令,文件
  • 10

    根本触发器ITeye

    触发器,主动,它们