Opis zlecenia
Wymagania:
- technologia: python, java, nodejs lub dobra alternatywa
- bot ma działać na serwerze non stop i uruchamiać się co x min
- plik in z frazami oraz oznaczeniem ile podstron zostało przeszukanych. Plik out csv z wynikami i szczegółami wyszukiwania
- eliminuje duplikaty domen w trakcie wykonania oraz porównując z całym plikiem out
- po znalezieniu danej strony próbuje również szukać na pozostałych podstronach jak najwięcej danych
- obsługa bledow/wyjątków tak, aby nieoczekiwany błąd nie przerywał działania
- prośba o info co ile min może bot się uruchamiać tak aby nie został zablokowany przez google
- prośba o info czy dodatkowo można zrealizować darmowe i lub platne proxy na serwerze oraz jak to wpłynie na możliwa częstotliwość odpalania bota
- korekta nr tel do formatu 9 znaków
- przed zapisem do out korekta i usuwanie pot duplikatów danych
- ma działać na serwer typu linux
- określenie kosztu wykonania, wdrozenia, oraz ew proxy
- dodatkowo opcje, ustawianie w par do ilu wyn w google ma szukać np do 100, 200
-