Analiza danych za pomocą podstawowych narzędzi graficznych

Sławomir Zabawa

Od 2011 roku specjalizuje się w obszarze zarządzania i doskonalenia procesów za pomocą metod i koncepcji Lean Six Sigma i TPM. 

Z wykształcenia jestem technologiem żywności z specjalizacją zarządzania i inżynierii produkcji. Ukończyłem Uniwersystet Przyrodniczy we Wrocławiu oraz Politechnikę Opolską.

Moje zamiłowanie kulturą Lean Six Sigma pozwoliło mi uzyskaź tytuł Lean Six Sigma Master Black Belt

Opublikowano 06.29.2020
Zaczynając szkolenie z narzędzi analizy graficznej, zawsze wracam do momentu kiedy rozpoczynałem pracę zawodową. Każdy z nas miał kontakt z nimi już wcześniej. Elementy analizy numerycznej i graficznej pojawiały się na wczesnym etapie edukacji szkolnej. Tym większe było moje zdumienie, kiedy zobaczyłem że nie wykorzystuje nawet części ich potencjału.

W dzisiejszym artykule skupimy się na pierwszych kilku narzędziach analizy graficznej. Poprzednie artykuły zakończyły pierwszy blok zwany ,,analizą numeryczną„. Następne pozwolą nam zamknąć drugi rozdział, po którym wrócimy do budowy mapy drogowej Lean 6 Sigma oraz mapy projektu. Jak widzisz, struktura naszej pracy polega na rozwijaniu pewnych teorii i zamykaniu ich klamrą za pomocą praktycznych przykładów. Jeśli przyjrzysz się bliżej, zobaczysz że każdy z artykułów łączy się z kolejnym i tworzy jedną większą historię.

Odpowiedzmy na pytanie, jakie narzędzia stosujemy w analizie graficznej?

  • Podstawowe metryki statystyczne (rozstęp, średnia, wariancja, mediana),
  • Wykresy przebiegu w czasie,
  • Wykresy pudełkowe,
  • Diagram korelacji,
  • Wykres Pareto Lorenza,
  • Histogram Karla Pearsona,
  • Karty kontrolne statystycznej kontroli procesu,
  • Wiele, wiele innych.

Wymieniłem celowo siedem narzędzi i to nimi zajmiemy się w najbliższym czasie. Dlaczego akurat te ? Są najczęściej stosowane w celu analizy i rozwiązywania problemów. Wiele z nich jest zaliczanych do „Siedmiu złotych narzędzi jakości”.

Wykres danych w czasie (z ang. Time Series Graphs).

Jest to najprostsze narzędzie, które używamy do pokazania zależności danych od czasu. Skala pionowa wskazuje otrzymywane wartości a pozioma, jest podzielona na konkretne przedziały czasowe. Wykres czytamy od lewej do prawej strony. Pierwszą zaletą tego narzędzia jest możliwość szybkiej analizy danych za pomocą porównania wartości aktualnej do całego szeregu wartości poprzednich. Ilustracja graficzna zdecydowanie szybciej dostarcza nam informacji, czy ostatni pomiar jest czymś specjalnym i nadzwyczajnym. Drugą zaletą stanowi możliwość obserwowania położenia i stabilności naszego procesu. Wykres szybko pokaże nam, jak operuje nasz proces i czy występują w nim trendy.

Przeanalizujmy poniższy wykres pokazujący wydatki związane z zatowarowaniem:

Brak alternatywnego tekstu dla tego zdjęcia

Wykres ten przedstawia wydatki związane z zakupem materiałów do produkcji pierogów po miesiącach. Każdy pojedynczy pkt. to przedział miesięczny wyrażony w tys. złotych. Jak możemy zobaczyć, rok 2017 i 2018 można traktować jako zupełnie różne okresy. Widzimy, że pownniśmy interpretować oba okresy oddzielnie, gdyż są one pochodną innej grupy źródeł zmienności. Daje nam to możliwość wyciągania prezycyjnych wniosków, obserwować trendy oraz potwierdzać, czy duża zmiana jest czymś stałym, czy tylko chwilowym zdarzeniem w czasie.

Histogram Karla Pearsona

Następne narzędzie używane jest do prezentacji częstości występowania danych liczbowych lub jakościowych naszego procesu. Pojedynczy kwadrat pokazuje nam jednostkowe wystąpienie danej wartości w przedziale. Mówiąc prościej, skala pozioma służy do grupowania danych w konkretnych przedziałach, a skala pionowa mówi o częstotliwości zdarzeń w każdym z nich. Przeanalizujmy dwa histogramy poniżej:

Prezentowany wykres gromadzi dane z przebiegu w czasie w przedziały gęstości występowania. W przypadku naszego projektu widzimy jasno, że wydatki naszgo bohatera 2017 roku wynosiły najczęsciej 44 i 47 tys. zł. Ponadto dowiadujemy się że najczęsciej w 2018 roku opłaty wynosiły 70 i 72 tys. zl. Wiemy, że poziom kosztów wzrósł średno o 26 tys. zł w porównaniu do poprzedniego roku i możemy przewidzieć w dużym przybliżeniu, ile będą wynosić w kolejnych miesiącach. Oczywiście każdy z histogramów należy interpretować osobno. Ich wygląd wynika z innego kontekstu i źródeł zmienności.

Wartość średnia prawdę Ci powie

Bardzo chętnie przy opisie zjawiska posługujemy się wartością średnią. Może spotkaliście się z twierdzeniem, że stosowanie tej cechy jest nieprecyzyjne. Istnieje nawet powiedzenie, że. Idąc tym tokiem myślenia: ja i mój pies mamy razem po trzy nogi”. Jak wobec tego jest naprawdę? Średnia jest wynikiem podziału sumy wszystkich wartości przez ich ilość. Mówi się, że jej podstawową cechą jest określenie środka miary położenia danych. By zrozumieć niedokładność wynikającą z stosowania tej cechy, przeanalizujmy przykład poniżej:

Nasz bohater zaprezentował miesięczną ilość sprzedanych pierogów. Do badania wybrał 3 produkty z swojego menu, które zawiera 40 pozycji. Zdecydował się na 3 produkty, które są w pierwszej dziesiątce pod kątem ilościowym, ale w jego odczuciu cechują się największą zmiennością. Operając się w sposób standardowy na wartości średniej można założyć, że pierogi Franciszkańskie powinny sprzedawać się średnio w 240 zestawach miesięcznie. Czy logiczne zatem jest zamawianie w takiej ilości składników w celu przygotowania tego wyrobu? Średnia dla piergów ze szpinakiem wyniosła 218 a dla pierogów z kaczką 174. Czy nasz histogram potwierdza, że wyniki grupują się najczęściej wokół średniej ?

Bardzo często porównujemy produkty pomiędzy sobą za pomocą wartości średniej. Przykład powyżej pokazuje ograniczenia z tego płynące. Jak widzimy, w żadnym przypadku wyniki nie kumulują się istotnie wokół średniej. Czy wobec tego, nie powinniśmy posługiwać się wartością średnią ? Po pierwsze, wartość średnia informuje nas o położeniu środka procesu. Bierzmy ją pod uwagę, ale interpretujmy w szerszym kontekście. Bądźmy świadomi natury zmienności i rozrzutu jaki może występować w naszym przypadku. Sprowadza nas to do kolejnego typu opisowego danych, jakim jest rozstęp.

Porozmawiajmy o rozstępie

Kolejną omawianą cechą jest miara rozstępu. Informuje nas o skali rozproszenia danych. Uzyskujemy ją za pomocą obliczenia wartości różnicy pomiędzy wartością minimalną i maksymalną. Nasz bohater też posłużył się tą miarą w swojej działalności:

Kontynując analizę produktową dla wcześniej wspominianych pozycji zauważamy, że pierogi Franciszkańskie cechują się największym rozstępem (140), pierogi ze szpinakiem (140), pierogi z kaczką (55). Sygnalizuje to, że największą powtarzalność zamówień wykazują pierogi z kaczką. Zamawianie materiałów dla tego asortymentu będzie bardziej powtarzalne. W przypadku pozostałych dwóch produktów należy zachować szczególną ostrożność, by nie wygenerować braku materiałów bądź zamrażać przepływ gotówki, poprzez magazynowanie zbyt dużej ilości półproduktów.

Magazynowanie to jedna z 8 głównych strat w przedsiębiorstwach produkcyjno – usługowych. Jest to jedna z bardziej wyniszczających przyczyn, zablokowania płynności finansowej firm. Podobnie jak braki. Stosując miarę rozstępu, możemy dowiedzieć się więcej o zmienności sprzedaży i dostosować planowanie zamówień do każdego produktu oddzielnie. Najpierw jednak, należy zrozumieć źródła zmienności decydujące o wielkości rozstępu, który kreują takie wyniki.

Podsumujmy to, czego się dowiedzieliśmy

W analizie graficznej stosuje się różne narzędzia, które używamy w zależności od tego, co chcemy się nauczyć o procesie. Dowiedzieliśmy się o kilku z nich:

  • Wykres przebiegu w czasie pozwala nam na intepretację danych rozłożonych w czasie. Pozwala nam wnioskować w oparciu o kontekst, co wywołało zmianę procesu, trend lub jaką zmiennością cechuje się nasz proces.
  • Histogram Karla Pearsona mówi nam o gęstości prawdopodobieństwa naszych danych. Klasuje je w odpowiednich przedziałach i informuje o częstotliwości ich występowania.
  • Statystyka opisowa miary średniej jest uniwersalną cechą określającą środek położenia procesu. Należy brać ją pod uwagę, ale powinniśmy pamiętać o naturze zmienności procesu.
  • Miara rozstępu mówi nam o całkowitym rozłożeniu naszych danych. Informuje jak szeroko potrafią występować wartości w naszym zbiorze danych.

Zapraszam was do kolejnych artykułów oraz pozostawienia komentarza. Może chcecie podzielić się swoimi przemyśleniami na temat analizy graficznej danych.

0 komentarzy

Wyślij komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *

Share This