10 let

sbíraná databáze, kterou jsme měli vyhodnotit

52,8 milionů řádků

které obsahoval vstupní datový soubor

1 přehledný report

díky kterému má klient přehled o ziskovosti středisek i produktů

Už na začátku podnikání jste chtěli řídit svůj business s pomocí dat. Pustili jste se tedy do jejich sběru. A dělali jste to 10 let. Hromadění informací je však jen začátek. V momentě, kdy chcete data vyhodnotit, se můžete zaseknout. Zpracování tak enormní databáze byste sice zvládli, ale už teď se hrozíte času, který vám to zabere. Přesně v takové situaci byl i náš klient Tatry Mountain Resorts (TMR), který nás oslovil s jasným požadavkem: na základě analýzy dat o zákaznících nalézt odpovědi na otázky klíčové pro jeho business.

Pracovali jsme pro klíčového hráče v cestovním ruchu ve střední a východní Evropě

Společnost Tatry Mountain Resorts se za dobu deseti let své existence stala největším investorem v regionu Vysokých a Nízkých Tater. Spravuje 20 hotelů, 10 lyžařských středisek, přes 40 barů a diskoték a také aquaparky, restaurace, lyžařské školy, sportovní obchody a mnoho dalšího na Slovensku, v České republice a Polsku.

A co jsme pro TMR řešili? Hledali jsme otázky i odpovědi

Klient chtěl vytěžit databázi a díky ní nejen lépe poznat zákazníky, ale také zjistit, která střediska přinášejí největší zisky.

Potřeboval zjistit, které produkty jsou nejziskovější, jak si v prodeji vede chytrá permanentka, nebo jaké je demografické rozložení zákazníků v jednotlivých střediscích.

V rámci dataminingu jsme proto navrhli zpracování a úpravu dat pro segmentační otázky, které jsme zákazníkovi pomohli sestavit. Poté už přišel čas na čištění a analýzu dat.

Povolali jsme na pomoc Indiány

Už z úvodu musí být jasné, že 10 let sbíraná databáze se úplně na disketu nevejde. Nemohli jsme proto použít tradiční metody zpracování. Místo toho jsme „povolali do zbraně“ nástroj přímo určený na zprocesování tak velkého objemu dat – Apache Spark.

Největší výzvou bylo správné uchopení dat a pochopení závislostí, které nebyly na první pohled jasné. Následně jsme všechny analýzy několikrát zopakovali, protože při čištění a analýze dat bylo často možné přijít na spolehlivější nebo přesnější metodu. Tento proces proto vyžadoval rozumné nastavení dotazů, testování metod na menších souborech dat s následným nasazením na reálná data.

A co bylo výsledkem našeho snažení? Vypočítali jsme potřebné metriky i tabulky a grafy jsme vizualizovali do prezentace v našem Mark O. Jak to vypadalo?

Datamining: počet nových nákupů F a opakovaných nákupů R za rok v absolutních číslech (všechny nákupy)

Počet nákupů obecně od roku 2019 klesá v důsledku pandemických opatření. Naopak míra opakovaných nákupů se drží na stabilní úrovni kolem 70 % (v naší analýze pracujeme s filtrovanými offline nákupy).

Míra opakovaných nákupů má pozitivní trend a obecně se neztrácejí vracející se zákazníci.

Datamining: Pro kolik lidí nakupují zákazníci gopassu nejčastěji?

Téměř polovina (49.3 %) nakupuje pro 2 nebo 3 osoby. 22.7 % nakupuje jen pro jednu osobu, to ale neznamená, že nejedou na hory v partě,

Nad Tatrou se blýská… na lepší datové časy

A co by mohlo následovat? Automatizace definovaných segmentů a jejich sledování v reálném čase –⁠ třeba při nasazení různých strategií, které je mohou ovlivnit. Ať už se naše společné kroky s TMR budou ubírat kamkoliv, už teď se na ně těšíme!

Jsou data vaše Achillova pata?
Změňte to.

Kontakty jsou here

602 708 610
42@databy.io

Jsme prostě

Data by
Proficio