Forside Fora Off-topic CSV med for mange kommaer

Currently, there are 0 users and 1 guest visiting this topic.
  • Oprettet af
    Emne
  • #0
    SvenBent
    Rusher
    Offline

    Jeg har modtage en csv fil med knap 600.000 linier i.
    Problemet er at noget af de data der er exporter ind i csv file…indeholder Kommaer.
    jeg kan se at de ekstra commar heldgivis er i foerste celle af data so det er altid de foerste komma’er der er for mange naar der er mere end X kommaer.

    Er der et god tool der kan rende CSV filen igennem og rette ind saa de extra kommaer i startern kan blive fjernet eller skiftes ud med noget andet?

    - Sven Bent

Viser 6 svar - 1 til 6 (af 6 i alt)
  • Forfatter
    Svar
  • #1
    GrillBiller
    Rusher
    • 73 Indlæg
    Offline

    Notepad ++
    Og find and replace
    Og leg med hvilket andet tegn der kan bruges
    Husk at tag en backup først

    #2
    SvenBent
    Rusher
    #0 Trådstarter
    • 311 Indlæg
    Offline

    Saa har jeg lidt brug for hvilken regex code der skal bruges i replace for at find de extra kommaer foerst i linien

    - Sven Bent

    #3
    SvenBent
    Rusher
    #0 Trådstarter
    • 311 Indlæg
    Offline

    AHA fandt en nemmere metode som ikke loeser grund problemet men fikser den specificer situation.

    Heldig var var forste kolonne af data, som indeholder de uoenskeded kommaer, altid med 3 bestemtes character foerst.
    Saa jeg kunne nemt med “find and replace” indsaette ” foran cell data”
    og heldigvis var det at 2nd kolonne altid starter med 5 forskellige moenstre af data. Saa 5 flere gange med “find and replace” fik jeg indsaet et ” foer foreste kommer der er korrekt.

    dermed var all celler i foerste kolonne altid omkapslets i ” og de extra kommaer blev ikke set som separations tegn.

    Loesningen var desvaere data afhaengig saa hvis nogen har en mere generisk loesning ser jeg den gerne i tilfaelde jeg igen for forkert formateret data

    - Sven Bent

    #4
    Snowball42
    Rusher
    • 274 Indlæg
    Offline

    Jeg havde en lignende opgave for nogle år siden, der endte jeg med at køre det igennem med powershell og løbe hver linje gennem med regex for at finde ud af hvor meget det drejede sig om, så jeg startede egentlig med at rende igennem for at tælle antal kommaer i alle linjer, for at se omfanget og antal kommaer i hver linje.

    Derefter bare regex der matchede det.

    Hvis det kniber med Regex koden, så findes der en masse online udgaver der kan hjælpe dig med det, og du kan paste lidt af csv filen ind i og teste på så du ved det virker.

    god fornøjelse.

    #5
    Paybacktime
    Rusher
    • 1085 Indlæg
    Offline

    Lær nu bare PowerShell, SB (eller for den sags skyld en anden shell – kunne være bash i WSL). Så har du en generel løsning, i stedet for at skulle lede efter meget specifikke tools hele tiden.

    I ain't got time to bleed

    #6
    Bams
    Rusher
    • 357 Indlæg
    Offline

    ChatGPT?

Viser 6 svar - 1 til 6 (af 6 i alt)
  • Du skal være logget ind som bruger for at kunne svare...