新聞中心
kettle按一列分組并把另一列合并為一條記錄怎么做?
首先:使用Sort rows控件,根據(jù)需要分組的字段AA排序下;

其次:使用Group by控件,分組字段為:AA,Aggredates部分Name為新字段名,Subjest為BB,Type選擇Concatenate strings separated by ,
ETL工具的典型代表主要有什么?
Extraction-Transformation-Loading的縮寫,中文名稱為數(shù)據(jù)提取、轉(zhuǎn)換和加載。 ETL工具有:OWB(Oracle Warehouse Builder)、ODI(Oracle Data Integrator)、Informatic PowerCenter、Trinity、AICloudETL、DataStage、Repository Explorer、Beeload、Kettle、DataSpider
目前,ETL工具的典型代表有:Informatica、Datastage、OWB、微軟DTS、Beeload、Kettle……
開源的工具有eclipse的etl插件。cloveretl.
數(shù)據(jù)集成:快速實(shí)現(xiàn)ETL
ETL的質(zhì)量問題具體表現(xiàn)為正確性、完整性、一致性、完備性、有效性、時(shí)效性和可獲取性等幾個(gè)特性。而影響質(zhì)量問題的原因有很多,由系統(tǒng)集成和歷史數(shù)據(jù)造成的原因主要包括:業(yè)務(wù)系統(tǒng)不同時(shí)期系統(tǒng)之間數(shù)據(jù)模型不一致;業(yè)務(wù)系統(tǒng)不同時(shí)期業(yè)務(wù)過程有變化;舊系統(tǒng)模塊在運(yùn)營、人事、財(cái)務(wù)、辦公系統(tǒng)等相關(guān)信息的不一致;遺留系統(tǒng)和新業(yè)務(wù)、管理系統(tǒng)數(shù)據(jù)集成不完備帶來的不一致性。
實(shí)現(xiàn)ETL,首先要實(shí)現(xiàn)ETL轉(zhuǎn)換的過程。它可以集中地體現(xiàn)為以下幾個(gè)方面:
1、空值處理:可捕獲字段空值,進(jìn)行加載或替換為其他含義數(shù)據(jù),并可根據(jù)字段空值實(shí)現(xiàn)分流加載到不同目標(biāo)庫。
2、規(guī)范化數(shù)據(jù)格式:可實(shí)現(xiàn)字段格式約束定義,對(duì)于數(shù)據(jù)源中時(shí)間、數(shù)值、字符等數(shù)據(jù),可自定義加載格式。
3、拆分?jǐn)?shù)據(jù):依據(jù)業(yè)務(wù)需求對(duì)字段可進(jìn)行分解。例,主叫號(hào) 861082585313-8148,可進(jìn)行區(qū)域碼和電話號(hào)碼分解。
4、驗(yàn)證數(shù)據(jù)正確性:可利用Lookup及拆分功能進(jìn)行數(shù)據(jù)驗(yàn)證。例如,主叫號(hào)861082585313-8148,進(jìn)行區(qū)域碼和電話號(hào)碼分解后,可利用Lookup返回主叫網(wǎng)關(guān)或交換機(jī)記載的主叫地區(qū),進(jìn)行數(shù)據(jù)驗(yàn)證。
到此,以上就是小編對(duì)于kettle表輸出報(bào)錯(cuò)的問題就介紹到這了,希望這2點(diǎn)解答對(duì)大家有用。
網(wǎng)站標(biāo)題:kettle表輸出獲取不到字段怎么解決
本文網(wǎng)址:http://fisionsoft.com.cn/article/dhgsess.html


咨詢
建站咨詢
