Web Analytics
Typy połączeń do danych - Live vs Extract
🔗

Typy połączeń do danych - Live vs Extract

Typy połączeń - Live oraz Extract

Istnieją dwa tryby, za pomocą których można podpiąć się do danych:

Live – połączenie, kiedy użytkownik komunikuje się z Tableau w czasie rzeczywistym (Tableau wysyła zapytanie do API BigQuery, a API BigQuery zwraca dane do Tableau). Ten typ połączenia jest stosowany w przypadku konieczności tworzenia raportów w czasie rzeczywistym, gdy dane bardzo często się zmieniają. Połączenie jest przydatne do tworzenia raportów, które są udostępniane online, w dowolnym miejscu i czasie dla każdego, kto posiada aktualny link.

Połączenie Live określone jest domyślnie w Tableau na karcie źródła danych.

image

W samym arkuszu, źródło danych będzie oznaczone ikoną jednego cylindra (czyli podłączenie do oryginalnego zbioru), jak na poniższym zrzucie.

image

👉 Szczegółowe informacje o raportowaniu w czasie rzeczywistym znajdziesz na naszym blogu w artykule ▶ tutaj ◀.

Extract – połączenie ze źródłem danych, które jest niezmienne przynajmniej na czas pracy. Stosowane jest ono do tworzenia raportów statycznych, które zazwyczaj są udostępniane okresowo, np. codziennie, co tydzień, miesiąc. Opiera się ono na wycinku danych (subset), które użytkownik chce ująć na czas pracy z danymi. Dane z pliku źródłowego są kopiowane na Tableau Server, odświeżenie pliku źródłowego nie spowoduje aktualizacji do najświeższych danych. W tym celu należy zedytować ekstrakt. Istnieją dwa sposoby odświeżenia Ekstractu: pełne – które zastąpi całą zawartość ekstraktu oraz przyrostowe - które jedynie doda nowe wiersze nieujęte w poprzednim odświeżeniu.

Podłączenie Extract dostępne jest obok Live w tej samej sekcji.

image

W przypadku podłączenia Extract, źródło danych będzie oznaczone ikoną dwóch cylindrów w arkuszu (co będzie wskazywać, że analiza odbywa się na zbiorze będącym kopią), jak na poniższym zrzucie.

image

Zalety stosowania Extractu

  • Ekstrakt jest w stanie obsłużyć ogromne zbiory danych.
  • Ekstrakt pozwala zwiększyć wydajność pracy (w przeciwieństwie do połączenia bezpośrednio z oryginalnymi danymi źródłowymi).
  • Ekstrakt pomaga w lepszym wykorzystaniu funkcjonalności Tableau, które z kolei nie są dostępne czy obsługiwane przy użyciu oryginalnych danych źródłowych, np. Count Distinct.
  • Ekstrakt pozwala na dostęp do danych w trybie offline, co umożliwia pracę i zapisywanie jej postępów lokalnie.

Ustawianie Extractu

Istnieje kilka sposobów połączenia do źródła w trybie Extract, jeden z nich opisany jest poniżej. Na Karcie źródła danych po przeciągnięciu pierwszej tabeli na kanwę w prawym górnym rogu zaznacz Extract, a następnie wybierz Edit. Otworzy się nowe okno dialogowe.

image

Jak dane Extractu powinny być przechowywane?

Pierwszą z opcji, jaka pojawi się w oknie ustawień jest wybór warstwy (struktury), w jakiej Extract ma być tworzony, a mianowicie czy będzie to tabela w warstwie logicznej (Logical Tables) czy fizycznej (Physical Tables).

image

W przypadku Extractu jako tabeli w warstwie logicznej Tableau tworzy jedną tabelę dla każdej tabeli logicznej w źródle danych.

image

Tabele fizyczne, które definiują tabele logiczne, są łączone i przechowywane razem z nimi. Np. jeśli źródło danych składa się z jednej tabeli logicznej, dane będą przechowywane w jednej tabeli. Jeśli zaś źródło składa się z dwóch tabel logicznych (z których każda oparta by była na trzech tabelach fizycznych), dane Extractu będą przechowywane w dwóch tabelach – po jednej dla każdej tabeli logicznej.

Ponadto ten rodzaj Extractu stosuje się, gdy konieczne jest ustawienie dodatkowych właściwości jak filtry Extractu, wartości agregowane czy Top N, itp. Extract jako tabela logiczna aplikuje Joins (jeśli odnoszą się w danym ekstrakcie) w momencie tworzenia Extractu.

Na poniższym przykładzie, dwie tabele w warstwie fizycznej Orders i People połączone są na zasadzie Inner Join i określają jedną tabelę Orders w warstwie logicznej. Wybierając Extract jako Logical Tables możliwym jest określenie dodatkowych jego ustawień, jak wcześniej wspomniano: filtrów, wartości agregowanych czy Top N.

image

Extract zbudowany jest z jednej tabeli logicznej, która zawiera pola odpowiednio z obu tabel w warstwie fizycznej, z których została ona zbudowana.

image

W przypadku Extractu jako tabeli warstwie fizycznej Tableau tworzy jedną tabelę dla każdej tabeli fizycznej ze źródła danych.

image

Ponadto, ten rodzaj Extractu stosuje się, gdy tabele są ze sobą zestawione za pomocą jednego lub więcej Joins na zasadzie równości (equality / =). Extract jako tabela fizyczna aplikuje Joins w momencie wysyłania zapytania do bazy.

Na poniższym przykładzie, dwie tabele w warstwie fizycznej Orders i People połączone są na zasadzie Inner Join i określają tabelę Orders w warstwie logicznej. Wybierając Extract jako Physical Tables nie jest możliwym określenie dodatkowych jego ustawień, jak było to możliwe na wcześniejszym przykładzie (pola są wyszarzone).

image

Otwierając taki Extract, do wyboru są obie tabele logiczne. Każda stworzona jest niezależnie.

image

Jaka ilość danych powinna być przechowywana?

W następnym kroku, jeśli wybrany został Extract jako Logical Tables, możesz dodać kolejne ustawienia.

  1. Kliknij Add…
  2. image
  3. Pojawi się kolejne okno, które będzie listować wszystkie pola w danej tabeli dodanej ze źródła. Wybierz pole (pola), które będzie użyte do zbudowania Extractu i zatwierdź przez OK. Na poniższym przykładzie wybrano pole daty zamówienia.
  4. image
  5. W następnym oknie pojawiają się już opcje, w których precyzuje się wartości, jakie mają być użyte w ekstrakcie. W przypadku dat, istnieje możliwość wyboru:
    • daty w ujęciu ciągłym
    • daty w ujęciu dyskretnym
    • image

Na poniższym przykładzie wybrano opcje przedziału czasowego czyli 01.01.2021 do 31.12.2021.

image

Po zatwierdzeniu OK, filtr wskakuje na listę. Kolejne filtry mogą być dalej dodawane w ten sam sposób.

image

W ujęciu dyskretnym okno wyboru wygląda nieco inaczej. Na poniższym przykładzie wybrano konkretne miesiące: styczeń, kwiecień, lipiec, październik.

image

Po zatwierdzeniu OK, filtr wskakuje na listę. Kolejne filtry mogą być dalej dodawane w ten sam sposób.

image

W przykładzie poniżej dodano dodatkowo filtr na Regionie East i West.

image

Czy dane powinny być agregowane, a jeśli tak - do jakiego poziomu?

W następnym kroku możesz wybrać czy miary powinny być agregowane dla danych wymiarów. Agregacja odbywa się tutaj przez konsolidowanie wartości wierszy, co w znacznym stopniu zmniejsza ciężar pliku Extractu i tym samym zwiększa wydajność pracy. Po wyborze agregacji otworzy się następna możliwość rolowania dat do określonego poziomu, tj. rok, miesiąc, kwartał, itd.

image

Poniższy przykład przedstawi ideę agregacji i rolowania dat dla Extractu.

Oryginalne dane źródłowe zawierają 9 rekordów: sprzedaż w danym dniu w Regionie.

image

Wybór Aggregate data for visible dimensions konsoliduje sprzedaż do 7 rekordów - per Region per dzień.

image

Wybór rolowania dat do poziomu miesiąca ponownie skonsoliduje wiersze. Sprzedaż zostaje ujęta miesięcznie per Region.

image

Liczba wierszy, które Extract ma obejmować

W ostatniej sekcji masz możliwość wyboru liczby wierszy, jakie mają się znaleźć w Extrakcie. Tutaj możesz wybrać wszystkie wiersze albo liczbę N (Top – z początku źródła danych albo Sample – jako próbka dowolnie wybranych przez Tableau).

image

Po wybraniu wszystkich ustawień Extractu zatwierdź OK.

image

W prawym górnym rogu pojawi się informacją, że Extract zawiera podzbiór danych (Extract will include subset of data).

image

Przechodząc już do Arkusza, po kliknięciu w jego zakładkę otworzy się okno zapisu Extractu i jego lokalizacji na dysku lokalnym. Wybierz nazwę pliku i kliknij Zapisz.

image

Plik zapisany jest w wybranej lokalizacji

image

Odświeżanie Extractu

Istnieją dwa sposoby odświeżenia Ekstraktu:

  • pełne – które zastąpi całą zawartość ekstraktu
  • przyrostowe - które jedynie doda nowe wiersze nieujęte w poprzednim odświeżeniu

Aby odświeżyć Extract:

  • z poziomu Arkusza, z Paska Menu wybierz Data, a następnie Refresh All Extracts.
  • image
  • w nowym oknie potwierdź klikając Refresh.
  • image
  • status procesu odświeżania zostanie wyświetlony w oknie końcowym. Wybierz Close, by zamknąć.
  • image
  • z poziomu karty źródła danych, w prawym górnym rogu wybierz Refresh.
  • image
👉
Dodatkowe informacje o:

Następna strona →

Zarządzanie metadanymi