Power Query je mocný nástroj pro načítání dat z externích zdrojů, pojďme prozkoumat k čemu slouží.
Power Query je doplněk do aplikací MS Excel a Power BI. Slouží k načtení a úpravě dat. Power Query byl zveřejněn poprvé v roce 2013 jako instalovatelný doplněk do MS Excel. Později se stal integrovanou součástí MS Excel i Power BI.
Jak Power Query funguje?
Power Query obsahuje řadu datových konektorů, pomocí kterých je možné se připojit k externím datovým zdrojům (soubory MS Excel, csv, databáze, online zdroje). Z těchto datových zdrojů je možné data přímo načíst či před načtením upravit.
Jak funguje načtení dat?
Příkazem Načíst data se připojíme k datovému zdroji.
V následném navigačním okně je možné volit z možností Načíst, Načíst do a Transformovat.
Načíst – načte data přesně tak jak jsou v datovém zdroji uložena do tzv. chytré tabulky
Načíst do – umožňuje načtení do kontingenční tabulky (příp. kontingenčního grafu či jen vytvořit připojení)
Transformovat – umožňuje upravit data před samotným načtením, transformace dat pomocí PQ nemění původní datový zdroj!
Jak načtení dat funguje když se data v datovém zdroji mění?
Pokud se zdrojová data mění, je nutné myslet na aktualizaci dat. Aktualizace dat funguje dobře, pokud v datovém zdroji:
- přibývají nové řádky
- mění se stávající data
- přibývají nové sloupce
Pozor na:
- změnu názvů sloupců ve zdrojových datech
- změnu názvu zdrojového souboru a cesty k souboru
Pokud se něco z toho změní je třeba upravit import dat.
Aktualizaci dat je možné provést „ručně“ či automatizovaně.
Ukázka uživatelem řízené aktualizace dat.
Ukázka nastavení automatizované aktualizace dat.
Jak funguje transformace dat?
Pokud je potřeba data před importem upravit, je třeba volit před načtením dat volit možnost Transformovat data
Tím se dostaneme do okna editoru Power Query, kde je možné samotnou transformaci provést.
V okně Power Query je řada prvků/panelů.
V horní části jde o pás karet s příkazy – zde se „nakliká“ samotná transformace dat (odebrání nadbytečných sloupců, řádků, rozdělení textu do sloupců, zaokrouhlení atp.)
V panelu dotazy je možné se přepínat mezi různými importovanými tabulkami z různých datových zdrojů.
V řádku vzorců je zápis kódu transformace v jazyku M.
V panelu Historie změn je možné krok po kroku procházet historii datové transformace – jednotlivé kroky je možné zpětně upravit či smazat.
Jak propojit data z různých datových zdrojů?
Velká síla Power Query spočívá v možnosti kombinování dat z různých zdrojů do jedné finální tabulky.
Rozlišujeme sloučení dotazů (přidání nových sloupců z jiné tabulky), připojení dotazů (přidání nových řádků z tabulky se stejnou strukturou a názvy sloupců) a kombinování souborů (načtení více souborů se stejnou strukturou – názvy listů i sloupců např. z jedné složky)
V čem spočívá hlavní síla Power Query?
- V opakovaném načítání dat – vhodné při častých změnách ve vstupních datech
- V kombinování různých datových zdrojů do sebe
- V transformaci dat – některé z možnosti nemají v MS Excel analogii