• Przejdź do treści
  • Przejdź to drugiego menu
  • Przejdź do stopki
  • START
  • BLOG
  • NEWSLETTER
  • KIM JESTEM
  • KONTAKT
Cegładanych

Cegładanych

Dane - Databricks i Chmura Azura

  • Azure
  • Databricks
  • Spark
  • Etl
  • Engineering
  • AI

Witam na blogu cegładanych!
Materiały dla inżyniera danych w Azure

Ten blog jest stworzyłem po to by dzielić się wiedzą i pokazać jak wygląda przetwarzanie danych w Azure. Najważniejsze tematy to Spark/Databricks/Lakehouse.

Zacznij tutaj

Darmowe materiały do pobrania

Przygotowałem dla Ciebie ebooka, w którym zebrałem ważne informacje o Apache Spark. To pozwoli Ci poznać filar technologii Big Data. 

Big Data ebook

Ostatnie wpisy

Jak efektywnie korzystać z Databricks Assistant – 5 sprawdzonych praktyk

Krzysztof Nojman
16.11.2025

Databricks Assistant to twój osobisty pomocnik w Databricks oczywiście jest AI, jak wszystko dzisiaj 😁. znacząco zwiększa produktywność pracy. Co potrafi Wygenerować kod Python i SQL Autouzupełnianie kodu…

Czytaj Dalej Jak efektywnie korzystać z Databricks Assistant – 5 sprawdzonych praktyk

Databricks DQX

Jakość danych w Databricks DQX

Krzysztof Nojman
28.01.2025

Jak sprawdzić jakość danych w Databricks i to zautomatyzować. Nie martw się jest nowe narzędzie od Databricks i bardzo Ci pomoże w kontroli jakości. Bardzo ważny temat wchodzący…

Czytaj Dalej Jakość danych w Databricks DQX

spark joins

Jak Spark robi join?

Krzysztof Nojman
13.01.2025

Nie znam rozwiązania gdzie nie trzeba połączyć jakiś tabel. Możesz pracować przy różnych modelach architektonicznych takich jak Lakehouse czy Warehouse bądź innym cudzie technologii. W każdym przypadku pracując…

Czytaj Dalej Jak Spark robi join?

AI Tools

Lista narzędzi AI dla każdego inżyniera, które warto znać

Krzysztof Nojman
30.11.2024

Skoro ten świat pożerany jest przez AI, to warto mieć pod ręką trochę narzędzi. Każdego dnia przybywa ich coraz więcej, i chcę rzucać się na każde, ale obserwuje.…

Czytaj Dalej Lista narzędzi AI dla każdego inżyniera, które warto znać

Kilka pomysłów na konfigurację Databricks

Krzysztof Nojman
26.11.2024

W wielu przypadkach ładowania danych w procesie ETL będziesz potrzebował/ła sparametryzować proces zasilania. Prawie każdy pipeline wymaga jakiś parametrów, np. nazwa tabeli, nazwa środowiska (dev, test, prod) ect..…

Czytaj Dalej Kilka pomysłów na konfigurację Databricks

Dobre praktyki

Krzysztof Nojman
14.09.2024

Zebrałem taką krótka listę dobrych praktyk. Żeby o nich nie zapomnieć i mieć ściągawkę na przyszłość. Są to ogólne zasady, które będą lepiej już gorzej pasować do większości…

Czytaj Dalej Dobre praktyki

Footer

Najnowsze wpisy

  • Jak efektywnie korzystać z Databricks Assistant – 5 sprawdzonych praktyk
  • Jakość danych w Databricks DQX
  • Jak Spark robi join?
  • Czy JSON to samo zło
  • VS Code nowości AI 
  • Lista narzędzi AI dla każdego inżyniera, które warto znać
  • Kilka pomysłów na konfigurację Databricks

Tagi

AI Apache Spark Architektura Azure BIg Data Certyfikat cloud Databricks Data Factory Dataframe DQX ETL Hurtownia Danych Intellij IoT Jaka technologia Join Kod Konfiguracja lakehouse Narzędzia Optymalizacja pyspark Spark Windows 10 zadania

Informacje Prawne

To jest nudna część lecz wymagana, wszystkie notki prawne o stronie znajdziecie tutaj.

Polityka Prywatności

Regulamin

Copyright © 2026 · Wszelkie prawa zastrzeżone. Krzysztof Nojman