Web Analytics
Blendowanie danych (Data Blending)
🖨️

Blendowanie danych (Data Blending)

Data Blending czyli blendowanie danych

Czym jest blendowanie danych?

Blendowanie w przeciwieństwie do Relacji i Joins nie oznacza tak naprawdę łączenia źródeł danych. Pozwala ono na zestawienie dwóch i więcej różnych źródeł danych, ale podczas pracy Blend kieruje zapytania bezpośrednio i niezależnie do każdego ze źródeł. Wyniki są agregowane na pewnym określonym poziomie, a następnie zaprezentowane w formie wizualnej. Z tego powodu blendowanie może odbywać się na różnym poziomie szczegółowości i z użyciem publikowanych źródeł danych.

Blendy nie tworzą nowego źródła danych (zblendowanego) i stąd też nie może ono zostać opublikowane jako „blended data source”.

Blendowanie odbywa się indywidualnie na poziomie konkretnego arkusza, stąd jest ono szczególnie przydatne, gdy do naszej analizy potrzebujemy stworzyć relacje w sposób różny w każdym z arkuszy bądź przy użyciu publikowanych źródeł danych.

Blend niejako przypomina tylko w swoim działaniu typ połączenia Join z lewej strony.

Kiedy i jak, krok po kroku, stosować blendowanie

Jak wcześniej napisaliśmy, blendowanie odbywa się w każdym arkuszu oddzielnie i ustanawia się w momencie, gdy pole z drugiego źródła danych zostanie użyte na widoku.

Aby utworzyć połączenie typu blend w workbooku, musisz połączyć się z co najmniej dwoma źródłami danych. Przenieś pole z jednego źródła danych do arkusza, wówczas stanie się ono głównym źródłem danych. Przełącz się na drugie źródło danych i użyj pola na tym samym widoku - stanie się ono drugim źródłem danych. W panelu danych pojawi się ikona łączenia, wskazująca, które pole lub pola są używane do połączenia źródeł danych.

  1. Upewnij się, że workbook ma wiele źródeł danych. Drugie źródło danych należy dodać przechodząc do Data i New data source. (Do blenda wymagane są dwa lub więcej odrębnych źródeł danych, które pokazują się niezależnie w panelu Data. Dodanie kolejnego połączenia do pierwszego źródła danych umożliwia relacje i łączenia na stronie Data Source.
  2. Przeciągnij dowolne pole z pierwszego źródła do widoku. To źródło danych będzie głównym źródłem danych.
  3. Przełącz się na inne źródło danych i sprawdź czy istnieje relacja łączenia z głównym źródłem danych:
  4. image

    ikona pola łączącego, która oznacza źródła danych są automatycznie połączone. Dane można łączyć, o ile istnieje co najmniej jedno aktywne łącze.

    image

    ikona przerwanego łącza. Jeśli pole takie powinno łączyć dwa źródła danych, kliknij ikonę obok niego (prawym przyciskiem). Ukośnik zniknie reprezentując aktywne łącze.

    Jeśli ikona łącza nie pojawi się obok żądanego pola, zobacz Definiowanie połączeń do blendowania.

  5. Przeciągnij pole do widoku z pomocniczego źródła danych.

Znaczniki niebieskie i pomarańczowe

Gdy tylko to drugie źródło danych zostaje użyte na tym samym widoku, blend znajduje zastosowanie. W poniższym przykładzie naszym podstawowym źródłem danych jest Sample - Superstore, a pomocniczym źródłem danych jest Sales Target.

Podstawowe źródło danych jest oznaczone niebieskim znacznikiem na źródle danych (1). Pola z podstawowego źródła danych używane na widoku nie mają żadnego wskazania.

Pomocnicze źródło danych jest oznaczone pomarańczowym znacznikiem na źródle danych (2) i pomarańczowym paskiem z boku panelu Data (3). Pola z pomocniczego źródła danych używane w widoku mają pomarańczowy znacznik wyboru (4).

image

Prawidłowe rozumienie podstawowych i pomocniczych źródeł danych

Łączenie danych w blend wymaga podstawowego źródła danych i co najmniej jednego dodatkowego źródła danych. Pierwsze źródło danych używane w widoku staje się podstawowym źródłem danych i definiuje widok. Może to ograniczyć wartości z pomocniczego źródła danych - w widoku pojawiają się tylko wartości, które mają odpowiadające dopasowania w podstawowym źródle danych. Jest to porównywalne z połączeniem Join z lewej strony.

Przykładowo, jeśli podstawowe źródło danych ma pole Miesiąc, które zawiera tylko styczeń, luty, marzec, każdy widok zbudowany wokół miesięcy będzie wyświetlał tylko styczeń, luty i marzec, nawet jeśli dodatkowe źródło danych ma wartości dla pozostałych dziewięciu miesięcy. Jeśli pożądana analiza obejmuje wszystkie dwanaście miesięcy, należy zmienić źródło danych, które jest podstawowe, przebudowując arkusz i najpierw używając tego drugiego źródła danych.

Definiowanie połączeń do blendowania

Do budowania połączeń typu blend Tableau musi rozpoznać wspólny wymiar lub wymiary między łączonymi źródłami danych. Ten wspólny wymiar nazywa się polem łączącym, ang. link. Aktywne linki są identyfikowane w panelu Data dla drugorzędnego źródła danych za pomocą ikony aktywnego łącza, a potencjalne pola łączące są identyfikowane za pomocą ikony przerwanego łącza. Linki nie są wskazywane w podstawowym źródle danych. Np. w mieszance danych transakcyjnych i wartościowych, pole geograficzne może być pożądanym polem łączącym, dzięki czemu można analizować zarówno kwotę, jak i wydajność w odniesieniu do tej kwoty dla tego samego miasta, stanu, kraju.

📢

Wskazówka: Aby blend zadziałał, pola łączące muszą również współdzielić wartości albo pewne elementy. Tableau tworzy widok z połączonych danych na podstawie współdzielonych wartości. Np. jeśli Kolor jest polem łączącym w obu źródłach danych, Tableau dopasuje Biały z podstawowego źródła z kolorem Biały z pomocniczego. Z kolei Róż nie będzie poprawnie dopasowany do Różowy. Aby pomóc Tableau zidentyfikować pola łączące, możesz zmienić nazw pól bądź edytować aliasy dla określonych wartości w tych polach.

Ustanawianie łącznika

Jeśli pole łączące w podstawowym i pomocniczym źródle danych ma taką samą nazwę, Tableau automatycznie tworzy relację. Gdy podstawowe źródło danych zostanie ustanowione (tj. pole zostanie użyte na widoku) i pomocnicze źródło danych zostanie wybrane w panelu Data, wszystkie pola o tej samej nazwie między dwoma źródłami danych będą wyświetlać ikonę łącza w pomocniczym źródle danych. Jeśli powiązane pole z podstawowego źródła danych jest używane w widoku, łącze staje się automatycznie aktywne.

Jeśli w źródle danych pomocniczych nie ma ikon linków, konieczne może okazać wsparcie Tableau w ustanowieniu takiego linku na jeden z dwóch sposobów:

  1. Jeśli wspólne wymiary nie mają tej samej nazwy (np. „Tytuł” i „Tytuł książki”), zmiana nazwy jednego z nich pozwoli Tableau zidentyfikować je jako wspólne wymiary i ustanowić link.
  2. Dodatkowo można ręcznie zdefiniować relację między polami w podstawowym i pomocniczym źródle danych.
    1. Wybierz DataEdit Blend Relationships….
    2. image
    3. W oknie dialogowym Blend Relationships sprawdź czy podstawowe źródło danych zostało wybrane z listy rozwijanej jako Primary data source.
    4. image
    5. Wybierz źródło danych pomocniczych w sekcji Secondary data source. W tabeli z prawej strony przy zaznaczeniu Automatic widoczne są wszystkie łączniki automatycznie wykryte przez Tableau.
    6. image
    7. Wybierając Custom zyskujemy możliwość ręcznego dodawania pól mapujących na liście relacji blenda. W tym celu wybierz Add. W nowym oknie dialogowym Add/Edit Field Mapping: wybierz pole z podstawowego źródła danych oraz porównywalne pole z pomocniczego źródła i kliknij OK.
    8. image

      Ważne: W przypadku dat, blend można określić bardzo precyzyjnie. Rozwiń pole daty i wybierz pożądany jej aspekt, tj. dokładna data, miesiąc, kwartał, rok, itp.

    9. Utwórz tyle mapowań pól, ile chcesz, a następnie kliknij OK.

Łączniki wielokrotne

Podobnie jak w przypadku relacji lub połączeń, zdarzają się sytuacje, gdy powiązania między źródłami danych są definiowane przez więcej niż jedno pole. Np. jeśli regionalne limity sprzedaży są tygodniowe, połączenie danych transakcyjnych sprzedaży i danych limitów musi zostać ustanowione zarówno dla regionu, jak i tygodni, aby poprawne dane zostały zebrane razem na widoku. To oznacza, że wiele linków może być aktywnych w tym samym czasie.

Praca na źródłach zblendowanych

Ze względu na charakter danych zblendowanych, należy pamiętać o kilku kwestiach podczas pracy na połączonych źródłach danych.

Wykonywanie kalkulacji  z polami z więcej niż jednego źródła danych może się nieznacznie różnić od zwykłych kalkulacji. Kalkulacje muszą zostać utworzone w jednym źródle danych. Górna część edytora obliczeń wskazuje, w którym źródle danych znajduje się obliczenie - tuż obok nazwy nadanej kalkulacji.

image
  • Agregacja ⬇️
  • Wszystkie pola używane z innego źródła danych będą zawierały agregację - domyślnie SUM, ale można to zmienić. Ponieważ kalkulacje nie mogą mieszać argumentów agregujących i nieagregujących, pola z głównego źródła obliczeń też muszą być zagregowane. Na przykładach poniżej agregacja SUM została dodana automatycznie, a agregacja sum została dodana ręcznie).

    SUM([Sample - Superstore].[Sales])/sum([Sales Target])

    sum([Sample - Superstore].[Sales])/SUM([Sales Target])

  • Oznaczenia kropek ⬇️
  • Każde pole, do którego odwołuje się kalkulacja, należące do innego źródła danych, odnosi się do swojego źródła danych za pomocą notacji kropkowej. Na przykładach poniżej dla obliczeń zbudowanych w Sample - Superstore, pole Sales Target staje się [Sales.Targets].[Sales Target], dla tych zbudowanych w Sales Targets, pole Sales staje się [Sales - Superstore].[Sales].)

    Są to równoważne wersje tego samego obliczenia zbudowanego w każdym źródle danych. W obu przypadkach jest to SUM(Sales) / SUM(Sales Target).

    image
    image

Ograniczenia

Oprócz nieco innego sposobu obsługi obliczeń istnieją pewne ograniczenia dotyczące drugorzędnych źródeł danych. Sortowanie według pola z drugorzędnego źródła danych może nie być możliwe, a filtry akcji mogą nie działać zgodnie z oczekiwaniami w przypadku danych mieszanych.

Przeczytaj więcej w temacie blendowania na stronie:

🛟Blendowanie a Left Join - różnice

← Poprzednia strona

Join Calculation