Вход
Регистрация

Решение задачи на "Ассоциативные правила"

Как правильно сформировать начальную таблицу для анализа данных с помощью вкладки "Ассоциативные правила"?
Задача похожа на пример с чеками и товарами из руководства пользователя в разделе "Ассоциативные правила", но там отсутствует переход – «первичная информация – промежуточный результат в Deductor, который получается как бы «сам собой». А хотелось бы более подробно.
Задача же следующая:
Имеется значительный ассортимент различных брендов, который выбирают различные торговые точки. То есть
Торг точка 1 Бренд 1 Бренд 2
Количество товара, например, в рублях. Хотелось бы узнать, с какими брендами чаще всего выбирают определенные бренды. В случае ввода информации в Deductor в виде – Название точки – Название бренда получается слишком скудный набор правил, который явно не соответствует реальности. Хотя Deductor самостоятельно заносит название точки в вид «транзакции», то есть ввод сделан верно. Очевидно, далее следует каким-то образом изменить первичную информацию. Как это сделать?
Как я понимаю, Deductor во вкладке «Ассоциативные правила» вычисляет частоты взаимного появления в отдельной точке какого-либо бренда, но как правильно завести начальную информацию в программу?
Кроме того, хотелось бы также учесть, что количества различных брендов, которое выбирают различные точки, также различаются. Возможно ли учесть также и эти различия?
Но начальным и самым важным является момент первичного ввода. В руководстве Deductor (вкладка «Ассоциативные правила») указан переход от первичной таблицы, где указаны товары и их принадлежность к конкретному чеку, а далее каким-то образом получается уже таблица частот («набор товаров a,b встречается … (в разах и %) ; набор b,c - … ; набор a,b,c - …) . Как происходит переход к этой таблице? Хотелось бы по шагам, начиная от первичной таблице (торговая точка – бренд). В Сети – множество статей, где указаны общие принципы, много теории, на основе которой выводятся эти правила, но нет решения по шагам, хотя есть информация о том, что следует исключить наиболее часто встречающиеся товары (правило, которое ясно и без анализа) и другие рекомендации. Но как именно это сделать, начиная с первичного набора? Как мне кажется, проблема не слишком сложная, можно применить не только «Ассоциативные правила», но и «Дерево решений», «Линейную регрессию», причем вопрос, как мне кажется, заинтересует многих, работающих в данной области.