START - Cegładanych

Witam na blogu cegładanych!
Materiały dla inżyniera danych w Azure

Ten blog jest stworzyłem po to by dzielić się wiedzą i pokazać jak wygląda przetwarzanie danych w Azure. Najważniejsze tematy to Spark/Databricks/Lakehouse.

Zacznij tutaj

Darmowe materiały do pobrania

Przygotowałem dla Ciebie ebooka, w którym zebrałem ważne informacje o Apache Spark. To pozwoli Ci poznać filar technologii Big Data.

Ostatnie wpisy

Databricks Klastry

Krzysztof Nojman

05.05.2026

Wybór odpowiedniego typu compute w Databricks to jedna z kluczowych decyzji wpływających na koszt, wydajność i wygodę pracy. Nic tak nie frustruje jak gapienie się na monitor w…

Czytaj Dalej Databricks Klastry

Jak efektywnie korzystać z Databricks Assistant – 5 sprawdzonych praktyk

Krzysztof Nojman

16.11.2025

Databricks Assistant to twój osobisty pomocnik w Databricks oczywiście jest AI, jak wszystko dzisiaj 😁. znacząco zwiększa produktywność pracy. Co potrafi Wygenerować kod Python i SQL Autouzupełnianie kodu…

Czytaj Dalej Jak efektywnie korzystać z Databricks Assistant – 5 sprawdzonych praktyk

Jakość danych w Databricks DQX

Krzysztof Nojman

28.01.2025

Jak sprawdzić jakość danych w Databricks i to zautomatyzować. Nie martw się jest nowe narzędzie od Databricks i bardzo Ci pomoże w kontroli jakości. Bardzo ważny temat wchodzący…

Czytaj Dalej Jakość danych w Databricks DQX

Jak Spark robi join?

Krzysztof Nojman

13.01.2025

Nie znam rozwiązania gdzie nie trzeba połączyć jakiś tabel. Możesz pracować przy różnych modelach architektonicznych takich jak Lakehouse czy Warehouse bądź innym cudzie technologii. W każdym przypadku pracując…

Czytaj Dalej Jak Spark robi join?

Lista narzędzi AI dla każdego inżyniera, które warto znać

Krzysztof Nojman

30.11.2024

Skoro ten świat pożerany jest przez AI, to warto mieć pod ręką trochę narzędzi. Każdego dnia przybywa ich coraz więcej, i chcę rzucać się na każde, ale obserwuje.…

Czytaj Dalej Lista narzędzi AI dla każdego inżyniera, które warto znać

Kilka pomysłów na konfigurację Databricks

Krzysztof Nojman

26.11.2024

W wielu przypadkach ładowania danych w procesie ETL będziesz potrzebował/ła sparametryzować proces zasilania. Prawie każdy pipeline wymaga jakiś parametrów, np. nazwa tabeli, nazwa środowiska (dev, test, prod) ect..…

Czytaj Dalej Kilka pomysłów na konfigurację Databricks

Witam na blogu cegładanych!
Materiały dla inżyniera danych w Azure

Darmowe materiały do pobrania

Ostatnie wpisy

Databricks Klastry

Jak efektywnie korzystać z Databricks Assistant – 5 sprawdzonych praktyk

Jakość danych w Databricks DQX

Jak Spark robi join?

Lista narzędzi AI dla każdego inżyniera, które warto znać

Kilka pomysłów na konfigurację Databricks

Najnowsze wpisy

Informacje Prawne

Witam na blogu cegładanych! Materiały dla inżyniera danych w Azure

Darmowe materiały do pobrania

Ostatnie wpisy

Footer

Najnowsze wpisy

Tagi

Informacje Prawne

Witam na blogu cegładanych!
Materiały dla inżyniera danych w Azure