127. spotkanie Data Community Krakow
18:00 – 18:15 Rozpoczęcie spotkania, sprawy organizacyjne
18:10 – 19:10 Zarządzanie danymi z Azure SQL w Azure ML Studio - Maciej Kępa
19:10 – 19:40 Networking
19:40 – 20:40 Microsoft Fabric Databases - Tomasz Libera
20:40 – 20:50 Zakończenie spotkania
Zapraszamy na pierwsze w tym roku, 127. spotkanie krakowskiej grupy Data Community.
KIEDY
16 stycznia (środa) - 18:00
GDZIE
Wyższa Szkoła Ekonomii i Informatyki w Krakowie - sala Praga
ABSTRAKT
Zarządzanie danymi z Azure SQL w Azure ML Studio - Efektywne zarządzanie danymi to klucz do sukcesu w projektach uczenia maszynowego. W tej sesji przyjrzymy się, czy i jak można wykorzystać Azure SQL w połączeniu z Azure Machine Learning Studio do realizacji procesów AI/ML.
Omówimy następujące zagadnienia
- Proces konfiguracji i integracji Azure SQL z Azure ML Studio
Przedstawimy kroki potrzebne do zestawienia połączenia między Azure SQL a Azure ML Studio, uwzględniając metody takie jak klasyczne połączenie SQL-ML, import danych oraz wykorzystanie natywnych formatów, takich jak Parquet.
- Scenariusze użycia i proponowane rozwiązania Microsoftu
Skoncentrujemy się na procesach importu danych z Azure SQL, przygotowywaniu danych w formacie Parquet oraz przekształcaniu zapytań SQL na operacje zintegrowane z pipeline’ami ML.
- Zalety oraz problemy połączenia klasycznych baz danych z Azure ML Studio
Omówimy zalety, takie jak łatwy dostęp do danych i możliwość integracji, a także wyzwania, w tym odtwarzalność zapytań (query reproducibility) oraz zabezpieczenie przed nadpisaniem danych. Przedstawimy strategie radzenia sobie z tymi problemami, np. poprzez wersjonowanie zapytań i odpowiednie zabezpieczenia na poziomie bazy danych.
- Wybrane metody konfiguracji baz danych i tabel
Zwrócimy uwagę na konfigurację tabel w trybie read-only, która minimalizuje ryzyko przypadkowej modyfikacji, oraz zastosowanie tabel typu ledger w Azure SQL, aby zapewnić integralność i audytowalność danych.
Microsoft Fabric Databases - W ramach sesji przedstawię najważniejszą nowość w Microsoft Fabric, zaprezentowaną podczas konferencji Ignite 2024 - Fabric Databases.
BIO
Maciej Kępa - Cloud Data Engineer & Technical Leader @ Datumo
Inżynier danych oraz lider techniczny w Datumo. Swoją karierę zadedykował obszarom AI/ML, urządzeniom brzegowym oraz IoT. Zawodowo związany z projektowaniem oraz wdrażaniem rozwiązań opartych głównie na chmurze Azure. Zwolennik sztucznej inteligencji zorientowanej na dane (Data-centric AI). Prywatnie miłośnik zwierząt, gier komputerowych oraz majsterkowania.
Tomasz Libera - Data Architect TIDK | MVP Data Platform | KursySQL.pl Data Architect w TIDK. MVP Data Platform, MCT. Aktywny członek Data Community Poland. Prelegent na konferencjach dotyczących Microsoft Data Platform. Jego prezentacje i sesje szkoleniowe można znaleźć na kanale YouTube www.youtube.com/c/kursysql oraz na stronie internetowej www.kursysql.pl. Pasjonat kolarstwa i maratonów MTB.