Datová analýza

Chcete znát lépe svá data, najít odpovědi na otázky a umět se lépe rozhodovat?

Identifikace problému / zadání
Nanooq IT protip: Na začátku je opravdu dobré si promyslet, čeho chceme dosáhnout, jaký problém vyřešit, jak to obohatí můj byznys, plán monetizace aplikace a přínosy řešení.
1.
První zadání od klienta

V prvním kroku nám klient pošle zadání a problém, který řeší. Popíše jeho hlavní cíle, kterých by chtěl dosáhnout, byznys, kterému se věnuje a jeho potřeby. Projdeme stávající čísla / dashboardy a dostupné datové zdroje, ze kterých chceme data získat.

2.
Hrubé odhady

Po prvním setkání s klientem sepíšeme hrubý časový odhad a postup implementace od analýzy, design, vývoj až po testování a správu aplikace. Následně s klientem odhady projdeme a zamyslíme se také nad našimi nápady a možnostmi vlastního pohledu na projekt.

3.
Kick off

Po upřesnění zadání s klientem odhady upravíme, ujasníme si, co bude dodáno jakou formou, v jakém čase. Následně již nic nebrání výkopu projektu s klientem a jeho oddělením - ideálně s lidmi, kteří budou na projektu pracovat s námi.

Analýza
Nanooq IT protip: V procesu analýzy je dobré si 2x promyslet funkcionalitu a fázi, ve které bude dodána. Výsledky je dobré validovat na stále větším a větším vzorku dat s lidmi, kteří s výsledky přímo pracují a znají jejich význam.
4.
Rozdělení projektu

Na Trelle projekt rozdělíme na fáze a jednotlivé sprinty, přičemž klient je součástí plánování, o všem má přehled a je zapojen do rozhodování a stanovení priorit na projektu.

5.
Analýza

Vytvoření analýzy projektu, sepsání zadání, vydefinování výstupů analýzy, vydefinování potřebných datových zdrojů, potřebné aktualizace a formát dat, kde a jak budou data ukládána a zabezpečena.

6.
Vytvoření modelu

Dalším a nejdůležitějším krokem je vytvoření modelu potřebného pro analýzu dat. V tomto kroku jsou data očištěna, transformována do správné podoby, optimalizována pro rychlejší výkon a přetvořena do datového modelu nebo modelů potřebných pro konkrétní machine learning řešení.

Implementace a rozvoj
Nanooq IT protip: Je dobré být zapojen do komunikace a testování po celou fáze vývoje a být aktivním členem týmu, moci přidávat změny agilně a rovnou vidět výstupy.
7.
Vývoj

Agilní vývoj aplikace v dohodnutých sprintech. Vývoj proběhne nad testovacími daty, učícím datasetem, kdy se zformulují základní algoritmy řešící potřebné otázky. Následně se aplikuje stejný proces nad produkčními daty a validují výsledky.

8.
Průběžné testování

Po vývoji v každém sprintu přecházíme do fáze testování, kdy po každém testu se výsledky validují s klientem, upřesňují, upravují vstupní / výstupní datové zdroje a formáty a následně i finální podoba dat pro potřeby dashboardu nebo aplikace.

9.
Nasazení a správa

Posledním krokem je nasazení vytvořených algoritmů a modelů do cloudu nebo na stranu klienta. Při datové analýze je dobré vytvořit middleware, ve kterém jsou všechna data zgrupena, transformována a převedena do finální podoby.

Nejnovější projekt: Parkování v Praze

Parkování v Praze se věnuje problematice aktuálně dostupných volných míst na parkovištích. Datovým zdrojem jsou open data města Prahy, veřejně dostupné na jeho portálu. Analýza obsazenosti parkovišť, analýza náročných dní a hodin, obsazenost zón a nesprávné / nezaplacené parkování.


Prague ZOO

Zpracování open dat města Prahy o městské ZOO. Informace a datové zpracování byly zaměřeny na zvířata žijící v ZOO, jejich potravu a následně propojení s informacemi o geolokaci jednotlivých pavilonů. Datové zpracování externích zdrojů jako městské hromadné dopravy k / do ZOO, počasí v daný den a pravděpodobnost obsazenosti ZOO na základě akcí konaných v ZOO.