Ivo, já vím, že pro nás děláte hodně a velmi si toho vážím. Ovšem v poslední době se formát exportu změnil několikrát (nové sloupce uprostřed). Docela mi to činí problémy; je možné všechny změny seskupovat a měnit najednou? (Já si v excelu s daty nehraji, na to máme jiné nástroje, a tyto změny mi to automatické zpracování statistik ničí, pracně pak dohledávám, jak se pořadí sloupců změnilo.)
Pro data scientisty, co používají pandas, zde je definice (ke dni 2. 12. 2019), ať neztrácíte čas:
df = pd.read_excel(
filename,
header=None,
skiprows=3,
parse_dates=[6, 7, 36, 37, 38, 40, 46]
)
df.columns = [
"id_klienta",
"prezdivka",
"typ_investice",
"nazev",
"stav",
"id_pribehu",
"dt_zafinancovani",
"dt_vyporadani",
"vyse_uveru",
"celkova_vyse_splatky",
"vyse_splatky",
"zaplaceno_z_poplatku_pct",
"zbyva_splatek",
"pojisteno",
"odklad_splatky",
"castka_puvodni_investice",
"castka_investovano_mnou",
"castka_z_toho_vyuzite_rezervace",
"castka_vratilo_se_mi",
"castka_zbyva",
"castka_prodano_za",
"castka_castka_poplatek_za_prodej",
"castka_po_splatnosti",
"urok_kc_ocekavany",
"urok_kc_zaplaceny",
"urok_kc_zbyva",
"urok_kc_po_splatnosti",
"zaplacena_pokuta",
"urok_v_pct",
"investorsky_poplatek_v_pct",
"zaplaceny_investorsky_poplatek_v_kc",
"nezauctovany_investorsky_poplatek_v_kc",
"soucasny_pocet_splatek",
"puvodni_pocet_splatek",
"aktualne_zaplaceno_splatek",
"zbyvajici_pocet_splatek_pri_nakupu_na_smp",
"dalsi_platba_dt",
"posledni_prijata_platba_dt",
"koupeno_na_smp_dt",
"nakupni_cena",
"prodano_na_smp_dt",
"nejdele_dni_po_splatnosti",
"dni_od_posledniho_problemu",
"prodatelne",
"vyse_slevy_v_pct",
"prodejni_castka_po_sleve",
"prodej_bez_poplatku_od_dt",
"prodano_za_po_odecteni_poplatku",
"ztraceno_pct"
]
df["pojisteno"] = df["pojisteno"].map({
"Ano": True,
"Ne": False,
"V minulosti": False,
})
df["odklad_splatky"] = df["odklad_splatky"].map({
"Ano": True,
"Ne": False,
})
df["prodatelne"] = df["prodatelne"].map({
"Ano": True,
"Ne": False,
})
df["smp"] = ~pd.isnull(df["koupeno_na_smp_dt"])