Dostosowanie i rozbudowa istniejącego parsera do pełnej funcjonalnosci - czytanie pdf i zrzut danych do csv lub xlsx
W języku python powstał kod do zaczytywania danych z faktur za energię elektryczną i zczytania wybranych elementów do csv. Niestety paser jest niekompletny i wymaga dalszej rozbudowy do pełnej funcjonalności. Aktualnie kod zawiera ok 50% oczekiwanych funkcjonalności.
Paracujemy na fakturach za prąd dla firm wpdf od Tauron, Enea, Energa i PGE, a nazewnictwo tych samych danych może się różnić. Co zczytujemy? 12 miesięcy historii z 12 faktur do jednego pliku dla tego samego punktu poboru:
NIP firmy,
Adres firmy,
Punkt poboru - numer,
Moc umowna,
Taryfa,
pobór energii czynne w podziale na strefy od 1 do max 3 stref w zależności od taryfy,
opłata mocowa,
energia bierna,
współczynniki K1,K2,K3,K4,
Zależy mi żeby zachować strukturę i wgląd pliku wyjściowego jako efekt zczytania danych (w załaczeniu szkic tego pliku). Paser ma być obsługiwany przez nie-programistów dlatego oczekuję automatyzacji pobierania plików wsadowych pdf i łatwego i jasnego przełożenia ich na plik docelowy, bez konieczności znania się na kodzie źródłowym.