Здравствуйте!
Не могу разобраться с задачей обнаружение аномалий.
Есть набор данных включающий себя время, IP адреса пользователей и количество передаваемого трафика по IP адресам.
На первом этапе произвожу группировку по времени и IP адресам и вычисляю количество передаваемого трафика за час, но это по одному txt файлу.
На втором этапе загружаю второй файл с данными за другой день за те же часы.
Каким образом я могу сравнить результаты?
Можно ли построить график, который будет содержать различия ?
Также интересует вопрос, есть ли такой функционал, который позволил бы на основе "правильных данных" без аномалий обнаруживать аномалии при вводе других данных, но уже с аномалиями?