Kraj: Poland
Lokalizacja: Wrocław, PL
Na Useme od 9 sierpnia 2024
O mnie
Jestem Data Engineerem z doświadczeniem w pracy na danych produkcyjnych (SQL, Python, Spark, chmura). Na co dzień zajmuję się analizą, debugowaniem i poprawą przetwarzania danych — szczególnie tam, gdzie wyniki się nie zgadzają, pipeline działa błędnie lub raporty pokazują różne liczby.
Realizuję konkretne, zamknięte zadania techniczne, m.in.: - sprawdzanie i porównywanie danych z różnych źródeł, - debugowanie zapytań SQL oraz logiki Spark / Python, - jednorazowe przeliczenia danych historycznych, - weryfikację jakości danych przed raportem lub audytem, - proste automatyzacje w Pythonie, Excelu (VBA) oraz Make — tam, gdzie mają realnie oszczędzać czas.
Kod i przykładowe rozwiązania udostępniam na moim GitHubie.
Nie prowadzę długoterminowych projektów ani doradztwa biznesowego — skupiam się na konsultacjach technicznych i rozwiązywaniu konkretnych problemów.
Preferuję jasny zakres, krótkie zlecenia i pracę zadaniową.
Kategorie
CV / Résumé
Wrz 2017 - Teraz
Konsultant techniczny ds. danych
Projekty komercyjne / freelance
Pełny opis mojego doświadczenia zawodowego, projektów i zakresu obowiązków dostępny jest na profilu LinkedIn. linkedin.com/in/golen
Portfolio
Automatyzacja z wykorzystaniem VBA
Opracowanie aplikacji w Excelu przy użyciu VBA i AI w celu zastąpienia obrazów i danych w ponad tysiącu różnych typów plików (Word, Excel, PowerPoint).
Automatyczne rozpoznawanie dokumentów pdf / AI IDP
Trening modeli AI do rozpoznawania danych z plików PDF | Przetwarzanie dokumentów (IDP) | Zarządzanie Azure Blob Storage | Testowanie modeli AI pod kątem wydajności i przyszłego wykorzystania przez klienta
Wyszukiwarka numerów telefonów
To prosty program do wyodrębniania numerów telefonów i e-maili z dowolnych plików lub stron internetowych. Działa na danych w standardzie USA, ale można go dostosować do innych regionów. Wystarczy skopiować dane, uruchomić program i wkleić wyniki.
Otwieranie wielu Exceli np. z linków
Prosty skrypt VBA do automatycznego otwierania wielu linków w Excelu, oszczędzający czas na ręcznym klikaniu. Skrypt pochodzi z zasobów internetowych i został dostosowany do własnych potrzeb. Idealny do masowego otwierania około 100 linków.
Automatyzacja raportu
Automatyzacja raportu cotygodniowego: pobieranie, łączenie plików, analiza danych (sumy, min, max) i tworzenie wykresów. Kod działa tylko w mojej organizacji ze względu na restrykcje dostępu.
Inżynier danych / programista ETL
Praca w Scrumie | Dostarczanie danych przez ADF | Pobieranie danych z różnych źródeł: csv, txt, sFTP, SQL, Dataverse | Praca z GitHub | Rozwój i wdrażanie pipelinów ADF | Wsparcie DevOps i ładowanie danych do aplikacji Power Platform
Sorter plików PDF
pdfFile_sorter to program w Pythonie używający biblioteki PyPDF2 do weryfikacji liczby stron w plikach PDF. Pliki niezgodne z wybraną liczbą stron są przenoszone do wskazanego podfolderu, a oryginały usuwane.
Sorter VBA
To narzędzie do dzielenia arkuszy Excel/CSV na osobne arkusze według warunków. Arkusze można następnie zapisać i wysłać przez Outlook z grupy mailingowej. Idealne do sortowania danych i organizacji arkuszy.
Pobieranie danych z internetu
To mój pierwszy działający program automatyzujący pobieranie plików, co zwiększyło efektywność pracy mojego zespołu. Program automatycznie pobiera pliki i zmienia ich nazwy, ale działa tylko w mojej organizacji ze względu na restrykcje dostępu.