|
Fehlerhafte Datensätze aus einer CSV Datei filtern.
|
|
28.06.2011, 19:57
Beitrag: #1
|
|||
|
|||
|
Fehlerhafte Datensätze aus einer CSV Datei filtern.
Hi @ all
Ich habe eine csv Datei die als Trennzeichen das Semikolon hat. Innerhalb dieser Datei gibt es Felder in denen frei Text eingegeben werden kann. Nun kommt es gelegentlich vor, dass jemand bei der freien Texteingabe ein Semikolon verwendet, was dann die Datenstruktur für das nachfolgende Programm durcheinander würfelt. Gibt es mit Talend eine einfache Möglichkeit diese Datensätze herauszufiltern, damit nur die mit der korrekten Satzstruktur weiterverarbeitet werden können ? Ich bin für jede Hilfe dankbar. |
|||
|
29.06.2011, 17:06
Beitrag: #2
|
|||
|
|||
|
Hi,
ich habe es selbst hinbekommen. Mit tSchemaComplianceCheck war es ganz einfach. closed |
|||
|
29.06.2011, 17:23
(Dieser Beitrag wurde zuletzt bearbeitet: 29.06.2011 17:23 von wg1.)
Beitrag: #3
|
|||
|
|||
| RE: Fehlerhafte Datensätze aus einer CSV Datei filtern. | |||
|
01.07.2011, 13:31
(Dieser Beitrag wurde zuletzt bearbeitet: 04.07.2011 23:11 von Giant0040.)
Beitrag: #4
|
|||
|
|||
|
RE: Fehlerhafte Datensätze aus einer CSV Datei filtern.
Hi wg1,
das ist auch eine gute Idee. Ich probier mal aus welche Lösung performanter ist. thx. Also bei ca. 30 Mio Datensätzen braucht die Lösung: tSchemaComplianceCheck ca. 25 Min StringHandling.COUNT ca. 10 Min |
|||
|
|
Neuigkeiten!


