Budoucnost nás vždycky nějak překvapí. Například v roce 1950 jistě nikdo pořádně netušil, co všechno přinesou čerstvě vynalezené počítače za půl století. A desetileté politické a hospodářské prognózy, vypracované u nás kolem roku 1985, můžeme dnes číst v lepším případě jako sci-fi, v horším případě jako nezdařený černý humor. Na druhou stranu tam, kde nedojde k překvapivým zvratům, je předvídání dalšího vývoje na základě analýzy časových řad užitečnou a dobře rozpracovanou disciplínou.
Když jsem se kdysi učil analyzovat časové řady, dospěl jsem k závěru, že používané metody se dělí na ty jednoduché, ale většinou málo spolehlivé, a na metody korektní, ale složité a časově náročné.
Proložíte-li časovou řadu prodejů přímkou nebo parabolou s pomocí jednoduché regrese, můžete být rychle hotovi; ale výsledek vás nejspíš povede k závěru, že vaše prodeje časem vzrostou popřípadě klesnou nade všechny meze. Což je – bohužel popřípadě bohudík – zhola nemožné.
Naopak pokud použijete složitější metodu predikce, můžete dostat přesnější odhad, ale budete počítat déle, nevystačíte s běžným softwarem, a především se od vás bude vyžadovat znalost statistiky na poměrně vysoké úrovni.
Nedostatečnost jednoduchých modelů názorně ilustruje následující obrázek. Časovou řadu osmdesáti objemů prodejů jsme proložili parabolou. Ta vcelku spolehlivě vystihla dosavadní průběh, naprostá většina známých hodnot ležela uvnitř „konfidenčního pásu“ (vymezeného křivkami UCL a LCL – tj. horní a dolní konfidenční mezí, Upper / Lower Confidence Limit). Predikce do blízké budoucnosti se ovšem ukázala jako zcela pomýlená: zatímco parabola klesala, skutečný objem prodeje spíše rostl.
Obr. 1: Rizika prokládání časové řady křivkou
Výhodou trendu v podobě paraboly nebo přímky ovšem je, že s trochou šikovnosti ho lze odhadnout v každém tabulkovém kalkulátoru. Použití složitějších modelů dosud nebylo nic pro laiky. Už jenom odhadování, jaký typ a řád modelu zvolit, vyžadovalo poměrně rozsáhlé znalosti a často hodiny počítání.
Proto mě v této oblasti příjemně překvapil software DecisionTime, vyvinutý firmou SPSS (www.spss.com , česká pobočka www.spss.cz ), který člověku ušetří práci, přemýšlení a nutnost studovat do hloubky teorii. Je navržen tak, aby s jeho pomocí mohl analyzovat časové řady každý manažer a obchodník. Zabudovaný wizard provádí uživatele krok za krokem analýzou souboru a umožňuje zadávat jednotlivé požadavky. Lze tak zadat například:
- proměnné, ovlivňující sledovanou veličinu (např. prodej může být ovlivněn cenovou hladinou);
- okamžiky, v nichž došlo k mimořádným událostem (např. výpadky výroby nebo změny sortimentu);
- období, ve kterých byl prodej podporován marketingovými akcemi (např. slevy, reklamní kampaně).
Umělá inteligence programu DecisionTime poté pro každou analyzovanou časovou řadu vybere nejlepší model a odhadne předpověď na požadovaný počet dní či měsíců.
Příklad analýzy programem DecisionTime: K dispozici máme záznamy o prodeji dámského ošacení, pánského ošacení a klenotů v jistém zásilkovém obchodě za poslední dekádu. V excelovém listě, kde jsou čísla uvedena, máme kromě toho zanesena i čísla vyjadřující intenzitu marketingové podpory: například objem inzerce nebo počet dopisů, zaslaných potenciálním zákazníkům (direct mail). Tato čísla jsou na základě marketingového plánu odhadnuta i pro letošní rok, i když zatím nejsou k dispozici skutečné hodnoty prodeje.
Tab. 1: Ukázka dat o prodejích
Mě síc | Pánské | Dámské | Klenoty | Maily | Stránek | Telefony | Inzerce | Servis |
I.92 | 11358 | 16579 | 10776 | 7978 | 73 | 34 | 22294 | 20 |
II.92 | 10606 | 18236 | 10822 | 8290 | 88 | 29 | 27426 | 20 |
III.92 | 16999 | 43394 | 22846 | 8029 | 65 | 24 | 27979 | 26 |
IV.92 | 6564 | 30908 | 11103 | 7752 | 85 | 20 | 28950 | 22 |
V.92 | 6608 | 28702 | 16067 | 8685 | 74 | 17 | 22642 | 21 |
VI.92 | 9839 | 29648 | 11061 | 7847 | 87 | 30 | 27211 | 23 |
VII.92 | 9398 | 31142 | 11329 | 7881 | 79 | 28 | 26633 | 22 |
VIII.92 | 10396 | 31177 | 16789 | 8121 | 72 | 27 | 30375 | 20 |
IX.92 | 11663 | 30672 | 14453 | 7811 | 83 | 35 | 26795 | 15 |
Data z Excelu načteme do DecisionTime a zadáme počáteční datum a typ časové řady (v tomto ohledu bohužel má inteligence programu své meze, protože si není schopen tento údaj sám zjistit z datové tabulky).
Časové řady je možné přehledně zobrazit vedle sebe nebo ve stejném okně:
Obr. 2: Vysvětlující proměnné
Poté automaticky nastoupí wizard, který nás provede zadáním úlohy.
Obr. 3: Ukázka jednoho kroku wizarda: zde je třeba přenést do pravého okénka jména vysvětlujících proměnných
Po proklikání wizarda začne program „přemýšlet“ a po uzavření výpočtů dá k dispozici výstup. I ten je možné znázornit graficky:
Obr. 4: Výstup DecisionTime: roční předpověď prodeje
Hnědá čára na výstupním obrázku znázorňuje historická data, modrá čára je predikce. Je vidět, že model dokáže vystihnout jak sezónní charakter řad, tak i další vlivy ostatních proměnných. Budeme-li chtít, můžeme formu zobrazení změnit a např. do obrázku připojit konfidenční pásy, vyjadřující meze pravděpodobného výskytu budoucích hodnot. Pod grafem je uvedeno označení modelu, který byl pro danou časovou řadu použit. Například prodej pánského ošacení se podle výše uvedeného obrázku vyvíjí ve shodě s modelem typu ARIMA (0,0,0)(1,1,0) – čísla v závorkách jsou parametry modelu, označující zhruba řečeno jak hluboko do minulosti se model „dívá“ – a navíc prodej pánského ošacení závisí na počtu rozeslaných reklamních dopisů a počtu telefonistů; je tedy zdaleka nejvíce ze všech tří sledovaných oblastí prodeje ovlivňován aktivitami direct marketingu.
Shrňme: Pro správné předpovědi a vůbec jakékoli analýzy časových řad je lépe používat moderní metody než střílet od oka anebo prokládat přímkou a parabolou. Tyto metody umožňují zahrnutí sezónnosti, setrvačnosti časové řady i vlivu dalších proměnných, jako je například míra marketingových aktivit nebo působení inflace. Protože však jde o metody náročné, budete potřebovat buď dobrý program (jako je DecisionTime), anebo dobrého statistika.
A úplně nejlepší je mít obojí.