Ilmoittaudu tästä linkistä lokakuun Saminariumiin Early Bird -hinta voimassa 30.6. saakka🐦

DP-750: Implement Data Engineering Solutions Using Azure Databricks

Kurssi on suunnattu data engineereille, jotka vastaavat dataputkien ja lakehouse-arkkitehtuurien rakentamisesta ja ylläpidosta Azure-ympäristössä. Se sopii myös analytics engineereille, jotka työskentelevät datan muunnoksen ja mallinnuksen parissa pilviympäristöissä
azure-databricks

kesto 4 pv

1890 + ALV
  • Kurssimuoto: Luokka, Etä

Kurssi sisältää laajan käytännön harjoituskokonaisuuden. Harjoitukset perustuvat kuvitteellisiin, työelämää mukaileviin skenaarioihin, ja jokainen laboratorioharjoitus tukee kurssin moduuleja sekä DP-750-sertifiointiin liittyviä taitoja. Harjoituksissa käsitellään muun muassa työtilan navigointia, notebookejaUnity Catalog –volumeita, laskentaresursseja, PySparkia, katalogeja, skeemoja, tauluja, näkymiä, row filter -toimintoja, column masking -ratkaisuja, Azure Key Vault -salaisuuksia, Delta Lake -mallinnusta, Auto Loaderiamedallion-arkkitehtuuria, Lakeflow Jobs -prosesseja, Databricks CLI:tä ja Spark UI:ta

Kurssin kohderyhmä 

Kurssi on suunnattu data-ammattilaisille, jotka haluavat suunnitella, toteuttaa ja ylläpitää tuotantokelpoisia data engineering -ratkaisuja Azure Databricks -ympäristössä. 

Kurssin esitietovaatimukset 

Osallistujilta suositellaan perustietoja data-analytiikan ja tietovarastoinnin käsitteistä, pilvitallennuksesta ja Azure-resurssien hallinnasta. Lisäksi osallistujan on hyvä tuntea SQL:n käyttö datan kyselyssä ja hallinnassa sekä Python-ohjelmoinnin perusteet, koska kurssilla käytetään notebookeja ja PySparkia


Koulutus valmistaa Microsoftin viralliseen sertifiointitestiin DP-750: Implementing Data Engineering Solutions Using Azure DatabricksSuoritettava sertifointi on Microsoft CertifiedAzure Databricks Data Engineer Associate. 

Tietoa koulutuksista

Luokkakoulutukset
Corellian koulutustiloissa:
Kalevankatu 9 A, Helsinki

Kiinnostaako asiakaskohtainen toteutus? Meillä onnistuu.

Kurssin olennainen sisältö

  1. AzureDatabricks -ympäristön käyttöönotto ja konfigurointi 

Kurssin alussa perehdytään Azure Databricks -ympäristön perusteisiin, työtilan käyttöönottoon, laskentaresurssien valintaan ja Unity Catalog -rakenteiden organisointiin. Tämä osa luo perustan koko kurssille ja auttaa ymmärtämään, miten Azure Databricks -ympäristö rakentuu teknisesti ja hallinnollisesti.  

Sisältöä muun muassa: 

  • Azure Databricks -ympäristöön tutustuminen 
  • Laskentaresurssien valinta ja konfigurointi 
  • Unity Catalog -objektien luonti ja organisointi  

 

  1. UnityCatalog -objektien suojaus ja hallinta 

Toisessa osassa keskitytään datan turvalliseen hallintaan Azure Databricksissa. Kurssilla käsitellään käyttöoikeuksia, hienojakoista pääsynhallintaa, credential management -käytäntöjä ja data governance -toimintoja.  

Sisältöä muun muassa: 

  • Unity Catalog -objektien suojaus 
  • Käyttöoikeuksien ja hienojakoisten oikeuksien hallinta 
  • Rivisuodatus ja sarakkeiden maskaus 
  • Azure Key Vault -salaisuudet 
  • Datan lineage, auditointilokit, tagit ja Delta Sharing  
  1. Datan valmistelu ja käsittelyAzureDatabricksilla 

Kolmannessa osassa keskitytään datan mallintamiseen, ingestointiin, muokkaukseen ja laadunhallintaan. Tämä on kurssin käytännönläheisimpiä kokonaisuuksia: osallistujat työskentelevät datan parissa SQL:n ja PySparkin avulla sekä rakentavat pohjaa tuotantotason data engineering -ratkaisuille.  

Sisältöä muun muassa: 

  • Datamallien suunnittelu ja toteutus Azure Databricksilla 
  • Datan ingestointi Unity Catalogiin 
  • Datan puhdistus, muunnos ja lataaminen 
  • Data quality -rajoitteiden toteutus ja hallinta 
  • Delta Lake, schema enforcement ja Lakeflow Spark Declarative Pipelines  

 

  1. Dataputkien ja työkuormien käyttöönotto sekä ylläpito

Kurssin lopussa keskitytään dataputkien suunnitteluun, tuotantoon vientiin, ajastamiseen, kehityksen elinkaaren hallintaan sekä valvontaan ja optimointiin. Tämä osa auttaa siirtämään opitut taidot käytännön tuotantoratkaisuihin.  

Sisältöä muun muassa: 

  • Dataputkien suunnittelu ja toteutus Azure Databricksilla 
  • Lakeflow Jobs -prosessien toteutus 
  • Kehityksen elinkaaren käytännöt Azure Databricksissa 
  • Spark-työkuormien valvonta, vianetsintä ja optimointi 

 

Kurssin kesto

Kesto 4 pv.

Kurssityyppi

Luokka / Etä

Kouluttajat

Kim Pihlström

Ilmoittaudu kurssille

Oletko kiinnostunut asiakaskohtaisesta toteutuksesta?

Kerro tarpeesi, niin suunnittelemme koulutuksen tarpeisiinne räätälöitynä.