nisfarm.ru

Formát CSV nebo Kde čárky umístit?

Mezi aplikacemi, které se vyskytují, pokud ne programátorem, není pokročilý uživatel, import dat z jedné aplikace do druhé není neobvyklý. A docela často je nutné importovat tabulkové údaje, pro které byl ve skutečnosti vytvořen formát CSV. Nyní bylo vyvinuto několik alternativních řešení (XML je mezi nimi). Vytvoření souboru CSV však zůstává v některých případech nejvhodnějším řešením a některé - nejproblematičtější.csv formátu

Název formátu je dešifrován jako hodnoty vyčleněné v korespondenci, oddělené čárkami. V souboru Poznámkový blok vypadá soubor takto:

00, 01, 02, 03;

01, 15, 34, 11;




16, 27, 33, 06 (na samém konci není nutné uvádět označení)

A v tabulce aplikace Excel nebo v podobné aplikaci je tomu tak již:

00010203
01153411
16273306

Ale teď jsme analyzovali nejjednodušší případ. Problémy začínají právě proto, že kvůli velmi komprimovanému zobrazování dat se formát CSV používá k přenosu velkého množství informací. Nejčastěji v databázích jsou různé hodnoty: digitální, abecední, abecední, s mezery atd. Často ve velkých polí jsou chyby, a je-li například, někde bude navíc čárka v obsahu jednoho z polí, mohou být všechny buňky posunuty o jednu.formát souboru csv

Obecně platí, že problémy, které vznikají při importu dat přes formát souboru CSV, lze rozdělit do tří kategorií:

1 - Nesprávné vyplnění pole.

2 - Nesprávná konverze dat při ukládání souboru v CSV.

3 - Nesprávné rozpoznávání formátů importovaným programem.

První případ již byl částečně zkoumán. K potírání tohoto problému je nutné poskytnout prostředky pro kontrolu správnosti vstupních dat. Pokud například potřebujete sestavit databázi adres pro mailing list, existují speciální skripty, které kontrolují, zda daná osoba zadala svůj e-mail v požadovaném formátu. Tam, kde existují mezery, čárky a jakékoliv další údaje, které lze číst v pořádku, obsah pole musí být v uvozovkách (tzv počítač „“).

Druhý případ se týká volby kódování. Je nutné zjistit, často podle zkušeností, co kódování programového dovozce bude upřednostňovat. V systému Windows je 1251 univerzálně použit, takže pokud se zdrojový soubor setká s textem Unicode, zobrazí se v aplikaci příjemce jako řetězec otázek. V aplikaci Excel můžete uložit do formátu CSV s různými kódovacími a oddělovacími znaky (s výjimkou čárky, karty a středník jsou stále používány), ale je nejlepší vytvořit soubor v Poznámkovém bloku ++ nebo OpenOfficeCalc.

Třetí případ je důsledkem druhého. Historicky formát CSV nemá jediný standard. Mnoho programů přijímá oba soubory CSV oddělení TSV (oddělené tabulátory) a SCSV (středník), zejména proto, že přípona souboru tuto zprávu nehlásí. V tomto případě se data čte chybně a nejsou distribuovány v buňkách v požadovaném pořadí. Nejlepší, co lze doporučit, je vytvořit soubor CSV s vlastní rukou. Jak již bylo řečeno, musíte použít vhodný editor.csv formátu

Triky, jak zkreslit formát CSV, jsou programátorům známy. Stačí, když se jednoduchý uživatel bude řídit našimi doporučeními pro vytvoření souboru. Nejmenší problém nastane, když je soubor vytvořen speciálně pro import do konkrétní aplikace (také se to stane jiným způsobem). Je snadnější vzít v úvahu všechny možné problémy, které na cestě vznikají přenos dat.

Sdílet na sociálních sítích:

Podobné
© 2021 nisfarm.ru