Web Analytics
Agregacja danych
Agregacja danych

Agregacja danych

Agregacja danych

W świecie analizy danych zdolność do agregowania i podsumowywania informacji jest kluczową umiejętnością. Tableau Prep jako potężne narzędzie do przygotowywania danych oferuje solidne możliwości agregacji, dzięki którym użytkownicy zdobywają cenne spostrzeżenia ukryte w ich zbiorach danych. Niezależnie od tego czy pracujesz z danymi sprzedażowymi, produkcyjnymi, analityką stron internetowych czy jakimkolwiek innym rodzajem danych, opanowanie sztuki agregacji może być przełomem w Twojej analitycznej podróży.

image
image

Zarys ogólny agregacji

Agregacja danych to fundamentalny element analizy danych umożliwiający podsumowywanie i interpretację dużych zbiorów danych. Agregowanie danych pomaga zmienić poziom szczegółowości pliku lub tabeli ułatwiając łączenie danych z innymi plikami i tabelami. Tableau Prep pełni rolę potężnego narzędzia w tym procesie usprawniając przygotowanie i agregację danych.

📢
W tej sekcji omówimy: ° istotę agregacji danych oraz jej znaczenie w analizie. ° funkcje Tableau Prep do agregacji danych. ° kroki oraz przykład, jak wykorzystać Tableau Prep w efektywnej agregacji danych.

Jeśli chcesz dostosować szczegółowość danych, skorzystaj z opcji Aggregate, by dodać krok grupowania i agregowania danych. To, czy dane są agregowane, czy grupowane, zależy od typu danych (String, Number lub Date).

Istota agregacji

Agregacja to proces matematyczny, który zmniejsza szczegółowość (poziom granulacji) danych poprzez przekształcenie wielu wartości w jedną, np., jeśli posiadamy dane dotyczące ukończenia uczelni, gdzie każdy wiersz reprezentuje szczegółowe informacje o każdym studencie, agregacja może przekształcić te dane w taki sposób, że każdy wiersz będzie teraz reprezentować dane dla każdej grupy. Innymi słowy, studenci zostają "zgrupowani" w grupy, a ich dane są agregowane w dane dotyczące odpowiednich grup.

Zanim przystąpisz do agregacji danych, zapoznaj się z poniższymi terminami:

Pola grupujące
Operacje matematyczne

Agregaty w Tableau Prep

image
  • SUM - suma wszystkich wartości w wyrażeniu. Wartości SUM można używać wyłącznie z polami numerycznymi. Wartości null są ignorowane.
  • AVERAGE - średnia wszystkich wartości w wyrażeniu. AVERAGE można używać wyłącznie z polami numerycznymi. Wartości null są ignorowane.
  • MEDIAN - mediana pojedynczego wyrażenia. MEDIANĘ można stosować wyłącznie z polami numerycznymi. Wartości null są ignorowane.
  • COUNT - liczba elementów w grupie. Wartości null nie są zliczane.
  • COUNT DISTINCT - liczba odrębnych elementów w grupie. Wartości NULL nie są zliczane. Każda unikalna wartość jest liczona tylko raz.
  • MINIMUM - wartość minimalna wśród wszystkich wartości w wyrażeniu.
  • MAXIMUM - wartość maksymalna wśród wszystkich wartości w wyrażeniu.
  • STD. DEV - przykładowe odchylenie standardowe wyrażenia.
  • STD. DEV POP. - odchylenie standardowe populacji wyrażenia.
  • VARIANCE - statystyczna wariancja wszystkich wartości w danym wyrażeniu na podstawie próby populacji.
  • VARIANCE POP. - statystyczna wariancja wszystkich wartości w danym wyrażeniu na podstawie próby populacji.
  • PERCENTILE - wartość percentyla z danego wyrażenia odpowiadającą określonej liczbie. Prawidłowe wartości liczby to od 0 do 1. PERCENTYL([wyrażenie], 0,50) zawsze zwraca średnią wartość w wyrażeniu.

Aggregate - kroki

  1. W panelu przepływu kliknij ikonę ➕ i wybierz opcję Aggregate. Panel przepływu wyświetli nowy etap agregacji, a panel profilu zostanie dostosowany wyświetlając profil zagregowany i grupowy.
  2. image
  3. Przeciągnij pola z lewego panelu do panelu Grouped Fields (pola tworzące wiersz) lub do panelu Aggregated Fields (dane, które zostaną zagregowane i zaprezentowane na poziomie zgrupowanych pól).
  4. image
    image

Możesz również:

  • użyć opcji drag&drop dla pól pomiędzy dwoma panelami.
  • image
  • wyszukać pola na liście i wybrać te, które chcesz uwzględnić w swojej agregacji.
  • image
  • poprzez dwukrotnie kliknięcie pola dodać je do lewego lub prawego panelu.
  • zmienić funkcję pola, by automatycznie dodać je do odpowiedniego panelu.
  • image
    image
  • kliknąć opcję Add All lub Remove All, aby zbiorczo dodać lub usunąć pola.
  • image
  • wykorzystać operacje czyszczenia. Aby uzyskać więcej informacji o dostępnych opcjach czyszczenia, sprawdź treści na ten temat ▶️ tutaj ◀️.

Przykład wykorzystania agregatów

Poniższy przykład obrazuje zagregowaną sumę sprzedaży, zysku i ilości oraz średnią zniżkę wg regionu i roku sprzedaży.

image

Pola są rozdzielane pomiędzy kolumny Grouped Fields i Aggregated Fields na podstawie typu danych. Aby zmienić typ grupy lub agregacji, kliknij ich nagłówek, np. SUM, AVG.

image

Na siatce danych poniżej agregacji i w profilu grupy można podejrzeć przykłady zawierające się w grupie czy agregacji.

image

Ponadto wszelkie operacje czyszczenia pól są widoczne na karcie Changes.

image

← Poprzednia strona

Pivot