ABC-анализ используется при решении множества задач. Однако выбрать пороги для ABC-групп не так просто, так как тяжело учесть влияние скрытых факторов на исследуемых процесс. Использование неактуальных параметров для определения ABC-групп может привести к ошибочным решениям. Метод касательных устраняет эту проблему.
На практике в реальных данных очень часто встречаются пропуски. Причинами могут быть ошибки ввода данных, сокрытие информации, фрод. Из нашей новой статьи вы узнаете, в каких случаях неправильная обработка пропусков простыми методами приведет вас к ошибкам в моделях и принятии решений.
В статье рассматриваются стратегии сэмплинга, которые могут быть применены в случае, когда в наборе данных классы не сбалансированы. Рассмотрены такие подходы, как случайное удаление примеров мажоритарного класса, связи Томека (Tomek links), SMOTE, ASMO и другие.
В статье описаны методы очистки персональных данных, основанные на статистических понятиях. В них приводятся определения и расчеты основных статистических показателей, с помощью которых можно выявлять возможные ошибки, а также вычислять наиболее вероятные значения для их замены.
Большинство компаний собирают персональную информацию о своих клиентах с целью ее дальнейшего анализа и выявления скрытых закономерностей. Полученная база данных содержит ошибки (опечатки, пропуски, некорректные значения...), которые мешают дальнейшей её обработке. Существует ряд методов, позволяющих обнаружить и очистить "загрязненные" данные. В статье рассматриваются наиболее простые из них.
Описание модуля WavUtils. В качестве инструмента вейвлет-преобразования были выбраны вейвлеты Добеши - как наиболее хорошо изученные и удобные в вычислительном плане. Использование вейвлетов до 10 порядка включительно представляется достаточным для решения подавляющего большинства прикладных задач, связанных с цифровой обработкой сигналов.
Большое количество сведений о клиентах, имеющееся в базах данных, хранятся в неудобном для аналитической обработки виде, например, адресная информация. Можно ли и нужно ли ее применять для анализа? Да, нужно использовать обязательно. Но без предварительной обработки не получится в виду того, что общепринятого формата записи не существует. Поэтому необходимо его разбить на составляющие.
В статье рассматриваются самые актуальные вопросы применения вейвлетов в наиболее общих задачах, связанных с обработкой информации, таких как очистка сигнала от помех, сжатие данных, выявление кратковременных и глобальных закономерностей, спектральный анализ составляющих сигнала.
Несколько советов, на основании которых каждый может построить целое семейство вейвлетов "в домашних условиях" и оценить достоинства вейвлет-анализа, применив их к имеющимся данным.