Agregacja danych
W świecie analizy danych zdolność do agregowania i podsumowywania informacji jest kluczową umiejętnością. Tableau Prep jako potężne narzędzie do przygotowywania danych oferuje solidne możliwości agregacji, dzięki którym użytkownicy zdobywają cenne spostrzeżenia ukryte w ich zbiorach danych. Niezależnie od tego czy pracujesz z danymi sprzedażowymi, produkcyjnymi, analityką stron internetowych czy jakimkolwiek innym rodzajem danych, opanowanie sztuki agregacji może być przełomem w Twojej analitycznej podróży.
Zarys ogólny agregacji
Agregacja danych to fundamentalny element analizy danych umożliwiający podsumowywanie i interpretację dużych zbiorów danych. Agregowanie danych pomaga zmienić poziom szczegółowości pliku lub tabeli ułatwiając łączenie danych z innymi plikami i tabelami. Tableau Prep pełni rolę potężnego narzędzia w tym procesie usprawniając przygotowanie i agregację danych.
Jeśli chcesz dostosować szczegółowość danych, skorzystaj z opcji Aggregate
, by dodać krok grupowania i agregowania danych. To, czy dane są agregowane, czy grupowane, zależy od typu danych (String, Number lub Date).
Istota agregacji
Agregacja to proces matematyczny, który zmniejsza szczegółowość (poziom granulacji) danych poprzez przekształcenie wielu wartości w jedną, np., jeśli posiadamy dane dotyczące ukończenia uczelni, gdzie każdy wiersz reprezentuje szczegółowe informacje o każdym studencie, agregacja może przekształcić te dane w taki sposób, że każdy wiersz będzie teraz reprezentować dane dla każdej grupy. Innymi słowy, studenci zostają "zgrupowani" w grupy, a ich dane są agregowane w dane dotyczące odpowiednich grup.
Zanim przystąpisz do agregacji danych, zapoznaj się z poniższymi terminami:
Agregaty w Tableau Prep
- SUM - suma wszystkich wartości w wyrażeniu. Wartości SUM można używać wyłącznie z polami numerycznymi. Wartości null są ignorowane.
- AVERAGE - średnia wszystkich wartości w wyrażeniu. AVERAGE można używać wyłącznie z polami numerycznymi. Wartości null są ignorowane.
- MEDIAN - mediana pojedynczego wyrażenia. MEDIANĘ można stosować wyłącznie z polami numerycznymi. Wartości null są ignorowane.
- COUNT - liczba elementów w grupie. Wartości null nie są zliczane.
- COUNT DISTINCT - liczba odrębnych elementów w grupie. Wartości NULL nie są zliczane. Każda unikalna wartość jest liczona tylko raz.
- MINIMUM - wartość minimalna wśród wszystkich wartości w wyrażeniu.
- MAXIMUM - wartość maksymalna wśród wszystkich wartości w wyrażeniu.
- STD. DEV - przykładowe odchylenie standardowe wyrażenia.
- STD. DEV POP. - odchylenie standardowe populacji wyrażenia.
- VARIANCE - statystyczna wariancja wszystkich wartości w danym wyrażeniu na podstawie próby populacji.
- VARIANCE POP. - statystyczna wariancja wszystkich wartości w danym wyrażeniu na podstawie próby populacji.
- PERCENTILE - wartość percentyla z danego wyrażenia odpowiadającą określonej liczbie. Prawidłowe wartości liczby to od 0 do 1. PERCENTYL([wyrażenie], 0,50) zawsze zwraca średnią wartość w wyrażeniu.
Aggregate - kroki
- W panelu przepływu kliknij ikonę ➕ i wybierz opcję
Aggregate
. Panel przepływu wyświetli nowy etap agregacji, a panel profilu zostanie dostosowany wyświetlając profil zagregowany i grupowy. - Przeciągnij pola z lewego panelu do panelu
Grouped Fields
(pola tworzące wiersz) lub do paneluAggregated Fields
(dane, które zostaną zagregowane i zaprezentowane na poziomie zgrupowanych pól).
Możesz również:
- użyć opcji drag&drop dla pól pomiędzy dwoma panelami.
- wyszukać pola na liście i wybrać te, które chcesz uwzględnić w swojej agregacji.
- poprzez dwukrotnie kliknięcie pola dodać je do lewego lub prawego panelu.
- zmienić funkcję pola, by automatycznie dodać je do odpowiedniego panelu.
- kliknąć opcję
Add All
lubRemove All
, aby zbiorczo dodać lub usunąć pola. - wykorzystać operacje czyszczenia. Aby uzyskać więcej informacji o dostępnych opcjach czyszczenia, sprawdź treści na ten temat ▶️ tutaj ◀️.
Przykład wykorzystania agregatów
Poniższy przykład obrazuje zagregowaną sumę sprzedaży, zysku i ilości oraz średnią zniżkę wg regionu i roku sprzedaży.
Pola są rozdzielane pomiędzy kolumny Grouped Fields
i Aggregated Fields
na podstawie typu danych. Aby zmienić typ grupy lub agregacji, kliknij ich nagłówek, np. SUM, AVG.
Na siatce danych poniżej agregacji i w profilu grupy można podejrzeć przykłady zawierające się w grupie czy agregacji.
Ponadto wszelkie operacje czyszczenia pól są widoczne na karcie Changes
.
← Poprzednia strona
Następna strona →
Kontakt | Polityka prywatności
© Vizyble - Wszelkie prawa zastrzeżone