For at importen skal fungere problemfritt, må Excel/CSV-filen som inneholder dataene, følge følgende retningslinjer:

 

Formatering

  • Vask dataene før du importerer dem! Én kolonne skal inneholde én datatype.  En kolonne som inneholder tall, kan for eksempel ikke inneholde tekst. Tips: Bruk filterfunksjonen for å se de ulike verdiene i hver kolonne.
  • Kolonneoverskriftene blir variablenavnene i Ledidi Core. Du kan endre navn under importprosessen eller senere. Bruk av anførselstegn, komma eller (semi)kolon i kolonneoverskriften er tillatt, men vil kreve noen justeringer under importen.
  • Begynn i celle A1. Det skal ikke være noen tomme rader eller kolonner "rundt" datasettet.
  • Filen konverteres automatisk til en kommaseparert fil (CSV) under importen, noe som betyr at bare celleverdiene importeres, og at alle formler og beregninger går tapt.
  • Under importen importeres bare det første regnearket i filen. 

Datatyper

Ledidi Core foreslår automatisk datatyper for variablene (kolonnene) under importen. Hvis du vil definere datatypene for hver variabel før import, kan du gjøre det ved å markere dem i filen. Definer hvilken type data hver kolonne inneholder ved å legge til "datatype#" foran navnet/overskriften på hver kolonne (som blir navnet på variabelen etter import). Følgende typer gjenkjennes: 
  • integer (tall uten desimaler) (integer#)
  • float (tall med desimaler) (float#)
  • kategori (category#)
  • multippel kategori (categoryMultiple#)
  • dato (date(%Y-%m-%d)#)
  • date og tid (datetime#)
  • string (tekst) (string#)
  • Unik (userDefinedUnique#)
Eksempel




NB: Bruk kun én datatype i hver kolonne - dvs. ikke bland datoer i noen celler og tekst i andre. NB: Når du bruker dato-/dato-tidsformatet, må du sørge for å bruke små og store bokstaver riktig. %y-%m-%d og %Y-%m-%d er forskjellige formater ettersom %y står for 2-sifret årstall (85, som betyr 1985) og %Y står for 4-sifret årstall.


De ulike datatypene

Tall uten desimaler (integers) 
Disse verdiene skal ikke ha desimaler. Merk at hvis du velger datatypen "Tall uten desimaler" og det finnes verdier med desimaler, vil importen mislykkes. Cellen som forårsaket feilen, vil bli angitt i feilmeldingen. 


Tall med desimaler (float) 
Det er tillatt å bruke komma og punktum som desimalskilletegn. Disse verdiene skal ikke være uendeligheter. Spesielle tekstverdier som "inf", "INFINITY" osv. gjenkjennes som standard som uendeligheter. Hvis du har slike verdier i en fil som skal importeres, vil importen mislykkes. Det er en grense for verdien av en float. Vi bruker float64. En float-verdi utenfor dette området vil føre til at importen mislykkes. 


Kategori 
Hvis du ønsker at en kategorisk variabel skal ha faste verdier, må du manuelt aktivere "faste verdier"-knappen for denne variabelen i "Variabler"-vinduet etter importen. 
NB: Merk at de importerte verdiene må være identiske med de faste verdiene som er angitt i Ledidi, ellers vil importen mislykkes. 


Multippel kategori 
Hvis du vil importere verdier for en variabel med datatypen Multippel Kategori, skal verdiene pakkes inn i firkantede parenteser og skilles med et loddrett strekksymbol. Eksempel én verdi: [Verdi1] eller [|||Value1]. Eksempel på flere verdier: [Verdi2|Verdi3] eller [Verdi2|||Verdi3|]. Hvis verdiene er spredt over flere kolonner, kan du bruke formelen ="["&CELLENAVN&"|"&CELLENAVN&"]" i Excel for å slå dem sammen til én kolonne. 
Dato
  • Kontroller at celler som inneholder datoer, er formatert som datoer (YYYY-MM-DD).
  • Definer datatypen i variabeloverskriften ved å legge til "date(%Y-%m-%d)#" foran variabelnavnet. Dette er ikke obligatorisk, men øker sannsynligheten for at importen lykkes. Vi anbefaler på det sterkeste at du gjør dette når du legger til flere oppføringer i et eksisterende prosjekt.
  • Lagre filen som en CSV-fil før import. 
Tekst 


Unik 
Vær oppmerksom på at Ledidi Core ikke validerer at verdiene i den importerte filen er unike. Men hvis du legger til flere oppføringer i datasettet ved å importere, valideres de importerte verdiene mot allerede eksisterende data for den aktuelle variabelen. Hvis det blir funnet en matchende verdi, dvs. en verdi som ikke er unik, mislykkes importen. 
Tid (varighet) 
Tidsvarighetsvariabler skal importeres som integer eller float (dvs. tall med eller uten desimaler).
  1. Etter import, gå til Variabel-vinduet og endre datatypen til "Tid (varighet)"
  2. Velg riktig kildeenhet, dvs. enheten som brukes i importfilen. Merk at du bare kan velge én kildeenhet.
  3. Velg tidsformatet du vil at variabelen skal vises i i Ledidi. NB: Ved endring av minimum tidsenhet til en høyere verdi enn kildeenheten (f.eks. tidsenhet = timer og kildeenhet = minutter), vil noen data gå tapt på grunn av avrunding. Dette er irreversibelt. NB: Det er ikke mulig å importere flere data til en eksisterende Tid (varighet) variabel. (Se også Import av tilleggsvariabler til eksisterende oppføringer

 

Spesifikke retningslinjer for Excel-filer

Ovennevnte retningslinjer gjelder for Excel-filer. Merk at både formatene ".xls" og ".xlsx" (bare "Excel Workbook (*.xlsx)" og IKKE "Strict Open XML Spreadsheet(*.xlsx)")-formatene godtas.


Spesifikke retningslinjer for CSV-filer

Når du importerer data lagret i en CSV-fil:
  • Sørg for at det brukes komma for å skille verdier. Tab (\t), semikolon (;) eller bar (|) godtas også.
  • Carriage return newline (\r\n) og newline (\n) godtas som radskillere.
  • Hvis verdien inneholder komma (f.eks. i tekst), sørg for at det er et dobbelt anførselstegn. f.eks. "Dette vil bli sett på som én verdi, selv om det har et komma i seg" vs. Dette vil bli sett på som to verdier, fordi det ikke er noen doble anførselstegn.
Hvis CSV-filen din er veldig bred, vil vi ikke kunne utlede CSV-verdiseparatoren, og vi vil falle tilbake til å bruke "," som skilletegn. 
CSV-filer kan kodes med forskjellige formater, både utf-8-koding og Windows-1252 støttes.