Specjalista Data Science / Machine Learning
Posiadam bazę ponad 50 tys. produktów (różnie nazwanych), które muszą zostać poprawnie zmapowane i skategoryzowane.
Chcę zbudować system, który:
-na podstawie nazw produktów przypisuje im odpowiednie kategorie,
-radzi sobie z literówkami, skrótami, synonimami (np. „masło 82%”, „masło ekstra 200g”),
-może się uczyć i poprawiać w miarę dodawania nowych danych,
-działa w prostym środowisku (Excel/CSV jako wejście i wyjście).
Technologie, które widzę jako najlepsze (ale jestem otwarty):
-Python (pandas, scikit-learn, XGBoost, LightGBM)
-NLP / embeddings (np. HuggingFace, sentence-transformers)
-fuzzy matching (rapidfuzz/fuzzywuzzy)
-opcjonalnie AutoML (Google, AWS, Azure)
Czego oczekuję:
-przygotowania działającego prototypu (pipeline: reguły + ML + fuzzy matching),
-możliwości łatwego uruchamiania modelu (np. w Google Colab albo jako prosty skrypt),
-przejrzystej dokumentacji: jak dodać nowe dane, jak ponownie wytrenować model,
-ewentualnej pomocy przy integracji z moim Excellem / systemem.
Dodatkowe informacje:
-dane mam w plikach Excel/CSV,
-interesuje mnie współpraca próbna (Proof of Concept), a następnie ewentualne rozszerzenie,
-preferuję osobę, która potrafi wytłumaczyć rzeczy w prosty sposób (nie jestem programistą).