Вход
Регистрация

Практика использования Deductor в ННГАСУ

Продолжаем цикл интервью с наиболее активными участниками академической программы BaseGroup Labs.

Нижегородский государственный архитектурно-строительный университет представляет к.ф.-м.н., доцент кафедры прикладной информатики и статистики Прокопенко Наталья Юрьевна (доклад Н.Ю. Прокопенко с III межвузовской конференции преподавателей доступен здесь).

К.ф.-м.н., доцент Наталья Юрьевна Прокопенко

ННГАСУ вступил в академическую программу BaseGroup Labs в 2007 году по инициативе кафедры прикладной информатики и статистики. Информация о кафедре представлена в карточке вуза.

Беседу от BaseGroup Labs ведет Надежда Карпузова.

Наталья Юрьевна, расскажите историю знакомства кафедры с программными продуктами BaseGroup Labs.

Наталья Юрьевна Прокопенко (далее Н.Ю.): Кафедра прикладной информатики и статистики Нижегородского государственного архитектурно-строительного университета с 2007 г. участвует в академической программе BaseGroup Labs.

Понимание необходимости подготовки специалистов в области анализа данных было продиктовано временем. Термины «анализ данных», «методы искусственного интеллекта» все чаще стали появляться в литературе и в Интернете, большое количество русскоязычной литературы стало обращаться к теоретическим и организационно-методическим вопросам разработки и применения интеллектуальных информационных систем в экономике. Термин «искусственный интеллект» был включен в государственный образовательный стандарт Российской Федерации. В учебных планах университетов появились учебные дисциплины, такие как «Интеллектуальные информационные системы», «Интеллектуальные методы анализа данных». В связи с необходимостью введения в учебный план данных дисциплин и организации сотрудничества с соответствующими работодателями кафедрой был приглашён сотрудник Нижегородской компании BIGroup Labs (имела статус партнера BaseGroup Labs), который читал лекции и вел практические занятия со студентами, используя АП Deductor. Благодаря сотрудничеству с этой компанией, появились первые дипломные проекты и научно-исследовательские работы студентов в области анализа данных.

По итогам этой работы в дальнейшем на кафедре было определено в качестве одного из ключевых направлений специализации студентов направление «бизнес-аналитика на базе систем искусственного интеллекта». Для этого в учебные планы бакалавров и магистров были введены специальные дисциплины. Тематика бизнес-аналитики официально закреплена как одна из основных при выборе тем выпускных квалификационных работ.

В это же время компания BaseGroup выступила с академической инициативой: открыла электронный учебный центр, где предложила самые современные курсы по анализу данных и анонсировала свободно распространяемую версию аналитической платформы Deductor Academic, а также организовала возможность электронного обучения и сертификации для преподавателей вузов. В результате в рамках заключенного соглашения о сотрудничестве были получены методические материалы вместе с практическими примерами, необходимые для обучения студентов, был пройден полный курс электронного обучения и получен статус сертифицированного аналитика Deductor.

Как построены учебные планы с точки зрения изучения дисциплин, связанных с анализом данных? В каких дисциплинах используется аналитическая платформа Deductor?

Н.Ю.: Для того чтобы студенты направления «Прикладная информатика» (профиль – Прикладная информатика в экономике) могли свободно пользоваться современными аналитическими информационными технологиями, учебный план составлен так, чтобы последовательно осваивать направление «бизнес-аналитика на базе систем искусственного интеллекта», опираясь как на специальные дисциплины, так и на дисциплины информатики вообще. Для освоения бизнес-аналитики, кроме базовых разделов в дисциплинах «математика» и «теория вероятностей и математическая статистика», введены специальные учебные дисциплины:

  • программные средства статистического анализа,
  • методы искусственного интеллекта,
  • системы поддержки принятия решения,
  • логическое программирование,
  • программирование искусственного интеллекта»,

а также ряд дисциплин для магистров:

  • методы бизнес-аналитики,
  • бизнес-аналитика в практике предприятий,
  • методы и системы анализа и прогнозирования на основе статистической информации.

Главная цель этих дисциплин – получение базовых знаний в области интеллектуальных информационных систем, изучение методов и средств интеллектуального анализа данных, приобретение навыков работы с инструментами Data Mining. Основными задачами являются:

  • знакомство с современными подходами к анализу экономической информации, основанными на концепции извлечения знаний из баз данных;
  • изучение современных методов и технологий, ориентированных на управление знаниями – хранилищ данных, многомерных отчетов, методов и моделей Data Mining;
  • практические приложения методологии интеллектуальных систем для решения экономических задач.

Для обучения студентов направления «Прикладная информатика» в качестве универсальной моделирующей среды для создания прикладных решений в области анализа данных используется Deductor Academic. Первое знакомство с АП Deductor и приобретение базовых навыков работы с ней происходит на втором курсе бакалавриата в рамках дисциплины «Методы искусственного интеллекта». Более углубленное изучение возможностей платформы продолжается на третьем курсе при изучении дисциплины «Системы поддержки принятия решений». Для тех выпускников ННГАСУ, которые хотят продолжить научную карьеру, открыты двери магистратуры по прикладной информатике в аналитической экономике. Магистранты, выполняя задания по предметам «Методы бизнес-аналитики» и «бизнес-аналитика в практике предприятий», используют уже профессиональную версию аналитической платформы (три ключа Deductor Professional были получены нашими студентами за победу в конкурсе выпускных работ).

Возможности профессиональной версии (интеграция с 1С, с различными СУБД, автоматизация выполнения сценариев обработки данных через пакетный режим) способствовали расширению тематики бакалаврских и магистерских выпускных работ, а также позволило студентам участвовать в различных конкурсах и научных конференциях.

При разработке учебных задач многие преподаватели сталкиваются с проблемой поиска исходных данных. Подобные затруднения зачастую возникают и у студентов при написании учебных, научных и выпускных квалификационных работ. Какие источники данных используются на кафедре прикладной информатики и статистики ННГАСУ?

Н.Ю.: Особенностью дисциплин направления «Бизнес-аналитика на базе систем искусственного интеллекта» является то, что практические работы должны быть выполнены на реальных данных. При организации практических и лабораторных занятий используются в наборы данных, специально подготовленные для максимальной демонстрации возможностей методов анализа, предоставленные компанией BaseGroup в рамках академической программы. Кроме того, уже накоплена своя база данных, которые мы используем для разработки индивидуальных заданий для курсовых и дипломных проектов. Это результаты социологических и маркетинговых опросов, базы данных, выгруженные из 1С и других учетных систем, полученные студентами во время прохождения производственной и преддипломной практики, интернет-данные, собранные с использованием технологии парсинга. На новых данных мы разработали методические указания по решению различных задач, в которых используются возможности АП Deductor: ХД, очистка данных, OLAP, Data Mining, а также издали два учебных пособия «Информационные технологии анализа данных (аналитические информационные системы поддержки принятия решений на базе Deductor Studio Academic 5.2)» и «Системы поддержки принятия решений на базе Deductor Studio Academic 5.3».

На ваш взгляд как ученого-математика и преподавателя с большим стажем, каковы основные особенности реализации математических методов в Deductor? Насколько доступны пониманию студентов работа алгоритмов и полученные результаты?

Н.Ю.: Основная особенность Data Mining – это сочетание широкого математического инструментария (от классического статистического анализа до новых методов машинного обучения) и последних достижений в сфере информационных технологий. В технологии Data Mining объединились строго формализованные методы и методы неформального анализа, т.е. количественный и качественный анализ данных.

Изучая в рамках дисциплины «Методы искусственного интеллекта» такие модели, как искусственные нейронные сети, деревья решений, ассоциативные правила, логистическую регрессию, кластеризацию, мы большое внимание на занятиях уделяем именно алгоритмам, используемым в этих моделях. Решаем задачи, на которых студенты разбираются с работой алгоритма обратного распространения ошибок при изучении нейронных сетей, с работой алгоритмов k-средних и k-медианы при кластеризации, как работает алгоритм Apriori при генерации ассоциативных правил; генетические алгоритмы. А вот программную реализацию этих алгоритмов, мы заменяем лабораторными занятиями с АП Deductor. В нем реализованы практически все модели Data Mining и современные технологии анализа структурированных данных. Использование самообучающихся методов и мастеров для настройки позволяют осваивать учебный материал студентам со стандартной математической подготовкой, а множество имеющихся там способов визуализации данных (граф нейронной сети, сети Кохонена, деревья решений, рок-диаграмма, таблица сопряженности и многие другие) значительно облегчают восприятие студентами содержания решаемых бизнес-задач. Благодаря доступности и наглядности методов анализа данных, реализованных в Deductor, студентам остается главным образом творческая работа: изучение предметной области, выбор методов решения, интерпретация результатов.

Расскажите о наиболее интересных проектах, реализованных в Deductor.

Н.Ю.: Уже более десяти лет кафедра активно ведет научно-исследовательскую работу со студентами в области бизнес-аналитики и систем искусственного интеллекта. За это время на основе аналитической платформы Deductor студентами МИЭПМ получены интересные аналитические решения, оформленные в виде выпускных квалификационных работ: «Анализ и прогнозирование макроэкономических региональных показателей Нижегородской области»; «Создание хранилища данных и аналитической отчетности для нижегородской детской областной больницы»; «Разработка системы прогнозирования результатов спортивных состязаний»; «Разработка автоматизированной информационной системы принятия инвестиционных решений на базе АП Deductor»; «Применение современных информационных средств и технологий для решения задач экологического мониторинга Нижегородской области» и много других.

Нашими студентами и выпускниками были получены интересные аналитические решения для ряда нижегородских компаний «Нижегород Металл» и «НПН», ООО «ФорматСервис», нижегородского филиала ОАО «Сады Придонья». Компания «Нижегород Металл» специализируется на оптовой и розничной торговле металлопрокатом. «НПН» – крупнейшая оптово-логистическая структура города Нижний Новгород, специализирующаяся на оптовой реализации автозапчастей для отечественных автомобилей, спецтехники. В рамках реализованных пилотных проектов были решены следующие задачи: оперативный многомерный анализ данных; формирование заказов товарных позиций; автоматическое построение прогнозов. Интеграция аналитической платформы Deductor и учетной системы «1С», используемой в деятельности этих торговых предприятий, позволила получить данные для реализации сценария анализа ассортимента и стабильности продаж.

Помимо непосредственно учебного процесса, как используется Deductor в ННГАСУ? Какие интересные исследовательские и образовательные проекты были реализованы с использованием его возможностей и в сотрудничестве с BaseGroup Labs?

Н.Ю.: В ННГАСУ уделяется большое внимание межкафедральному сотрудничеству, для решения многих задач даже был создан Международный центр междисциплинарных исследований. Одним из реализованных проектов этого центра, где использовалась АП Deductor, был проект, связанный с обработкой результатов анкетирования студентов для определения их приоритетов во время обучения в университете, для определения отношения студентов к научной работе, их понимания места научной работы в формировании профессиональных компетентностей будущих специалистов.

Полученные результаты определи степень мотивации студентов разных факультетов к научно-исследовательской деятельности; позволили выявить заинтересованность студентов к повышению качества учебного процесса, разработать комплекс мероприятий и практические рекомендации по привлечению к НИР заинтересованных в ней студентов.

Также в рамках деятельности Международного центра междисциплинарных исследований в феврале 2013 г. прошла зимняя школа «Современные методы анализа и управления».

Зимняя школа – это возможность для студентов принять участие в интересном и очень полезном событии вне учебного процесса, во время каникул, это возможность узнать нечто большее, выходящее за пределы обычного учебного курса, старт для проектной деятельности, знакомство с замечательными людьми. Там не было преподавателей, читающих предмет, но никогда не занимающихся им «вживую», а еще не было студентов, которые приходят в аудиторию только ради отметки о присутствии. Каждый студент знал, зачем он пришел, что хочет узнать и чему хочет научиться.

Занятия были посвящены знакомству с рядом методов, которые находятся на переднем крае современного управления. Это интеллектуальные методы бизнес-аналитики, методы имитационного моделирования экономических процессов и методы автоматизации управления бизнес-процессами. Кроме этого в отдельных докладах были рассмотрены актуальные вопросы экологического обоснования проектов, управления проектами, а также развития электронного документооборота. Преподавателями школы были сотрудники консалтинговых фирм из Рязани и Москвы, а также доценты ННГАСУ и РАНХиГС.

Контингент аудитории был весьма разнообразен: начиная от второкурсников МФЭПМ, заканчивая аспирантами и преподавателями из вузов Нижнего Новгорода, Москвы и Чебоксар: НГТУ, ННГУ, РГАУ-МСХА, ЧГУ.

Было действительно интересно, обсуждались серьезные практические проблемы и актуальные задачи автоматизации, моделирования, анализа, оптимизации и решение их современными методами.

Особое спасибо хочется сказать руководителю академической программы BaseGroup Labs к.техн.н., доценту Николаю Борисовичу Паклину, который прочитал лекции и провел мастер-классы в рамках секции зимней школы по анализу данных.

Данное мероприятие отмечала замечательная атмосфера, высокий профессионализм преподавателей, хороший уровень организации. Все участники получили сертификаты.

ННГАСУ является одним из самых активных вузов в академической программе BaseGroup Labs. Каковы основные результаты, достигнутые за период сотрудничества?

Н.Ю.: Подводя некоторые итоги десятилетнего опыта сотрудничества кафедры прикладной информатики и статистики и BaseGroup Labs в области образования, можно сказать, что за это время было решено много актуальных задач для целевой подготовки наших бакалавров и магистров, а именно:

  • были разработаны современные образовательные учебные программы по дисциплинам, которые связаны с анализом данных и информационно-аналитическими системами;
  • расширена тематика курсовых и дипломных проектов, которые удалось связать с решением реальных задач нижегородских компаний;
  • появилась возможность привлечения студентов к исследовательской работе в данной области с использованием платформы Deductor.

Была проведена большая совместная работа по формированию имиджа профессии бизнес-аналитика.

Результатом сотрудничества является также издание двух учебных пособий, публикация статей и научных работ преподавателей, студентов и магистрантов в различных научных изданиях.

Кроме этого, такое сотрудничество имеет множество ценных преимуществ для наших выпускников. Теперь студенты, показавшие высокие результаты обучения, получают сертификаты об успешном прохождении курса обучения работе с Deductor. У нас больше 20 студентов уже получили такой сертификат. Получение профессионального сертификата даёт преимущество при трудоустройстве и потому дополнительно мотивирует студентов к изучению бизнес-аналитики.

Также следует отметить, что компанией BaseGroup Labs проводится большая работа по повышению квалификации преподавателей в сфере бизнес-аналитики и интеллектуальных информационных технологий (конференции, бесплатные обучающие курсы с возможностью получения сертификата).

Успешно развиваются также связи с академическими сообществом, благодаря тому, что ваш портал знаний https://basegroup.ru стал открытым ресурсом для преподавателей анализа данных всех вузов страны, ведь там есть блоги специалистов, интервью и презентации с разных конференций, банк сценариев и база примеров реальных внедрений. Думаю, что ученые, вузовские преподаватели, практики могли бы продолжать эту традицию, публично предоставляя интересные примеры для своих коллег, студентов, аспирантов.

Какими Вы видите основные направления дальнейшего использования программного продукта и сотрудничества с компанией?

Н.Ю.: В настоящее время нами решается проблема подбора новых задач для подготовки магистров, так как области применения методов машинного обучения очень разнообразны.

Рассматривается возможность применения технологии e-learning, так как при такой форме обучения значительно увеличивается доля самостоятельной работы студентов, повышается активность и качество обучения.

Ищутся формы взаимодействия с организациями, интересующиеся внедрением современных информационных технологий на основе методов машинного обучения, для того, чтобы готовить специалистов, умеющих использовать полученные знания на реальных задачах.

Ну и конечно, мы готовы осваивать новый продукт компании – аналитическую платформу Loginom 6, который был представлен нам на IV межвузовской конференции в Москве в июне этого года. Ждем специализированных обучающих курсов в электронном учебном центре на сайте компании. В наших планах – непрерывно повышать квалификацию, в том числе путем участия в вебинарах, посещения семинаров и мастер-классов.

А также мы ждем таких форм сотрудничества, как проведение конкурсов ВКР, олимпиад и хакатонов.

Как Вы оцениваете проводимые BaseGroup конференции преподавателей по использованию Deductor в учебном процессе вуза? Насколько полезными, на Ваш взгляд, являются такие мероприятия?

Н.Ю.: Межвузовские конференции по использованию Deductor – это очень значимые для академического сообщества мероприятия, которые собирают преподавателей из разных вузов страны с тем, чтобы поделиться результатами последних прикладных и исследовательских проектов по анализу данных, предложить возможные варианты теоретико-методологических решений, обсудить наиболее актуальные вопросы формирования программ учебных дисциплин, установить партнерские отношения с коллегами, обменяться новыми пособиями.

Я всегда приезжаю на такие конференции, интересно узнавать что-то новое и дальше развиваться в этом направлении. Они являются мостом между академической теорией и реальной практикой. Это уникальная возможность окунуться в среду интересных, творческих, очень увлеченных людей. На конференции создается очень приятная доброжелательная атмосфера, которая позволяет поделиться опытом, представить результаты собственного труда. Ключевым моментом последней конференции стал мастер-класс с демонстрацией решения задач на Loginom.

Очень хорошо организован и досуг – программа включает интересную экскурсию по территории Тимирязевской академии и вечернюю экскурсию на теплоходе по Москве-реке. Спасибо всем организаторам.

В ноябре 2017 г. выходит новая версия аналитической платформы — Loginom. Каковы Ваши первые впечатления от знакомства с ним?

Н.Ю.: Демонстрация нового продукта на межвузовской конференции в июне, а также закрытый вебинар в сентябре уже дают представление о том, что его выход будет несомненно сопровождается расширением и углублением знаний в области анализа данных, что конечно же повлечет изменение и усовершенствование учебных программ и для бакалавров, и для магистров. Мы готовы к дальнейшему тесному взаимодействию с компанией BaseGroup Labs, готовы формировать новое поколение специалистов в области бизнес-аналитики с новыми знаниями, умениями, «компетенциями», с использованием новых возможностей нового программного продукта.

Держать «руку на пульсе» в области современных технологий анализа данных возможно только в теснейшем взаимодействии с ведущими российскими IT-компаниями. И благодаря академической программе BaseGroup Labs, мы получим уникальный опыт применения в учебном процессе полнофункционального программного обеспечения, которое будет уже в скором времени востребовано не только российскими бизнес-заказчиками.

Насколько полезно для современных выпускников изучение технологий и инструментария анализа данных? Каковы, на ваш взгляд, перспективы востребованности этих знаний работодателями?

Н.Ю.: Каждому выпускнику высшего учебного заведения очень важно обладать по окончании обучения именно теми знаниями, которые пригодятся на будущем месте работы. В ННГАСУ построена система обратной связи о качестве подготовки выпускников и востребованности их компетенций. Учитывая, что технологии анализа данных, не привязаны к конкретной предметной среде, студенты направления «прикладная информатика» в ННГАСУ получают универсальные знания, необходимые для эффективного использования в различных областях человеческой деятельности – в экономике, торговле, управлении, образовании и т.д.

К сожалению, наблюдается некоторое опережение темпов развития инструментария анализа данных по отношению к пониманию со стороны работодателей, какую полезную информацию можно извлечь из данных при помощи современных средств обработки и анализа. Но, несомненно, интерес со стороны государственных структур, бизнеса, здравоохранения, образования и др. к современным технологиям и методам анализа данных будет расти, а значит выпускники вузов, владеющие инструментарием анализа данных, будут все более востребованы потенциальными работодателями. В связи с этим необходимость приближения теории обучения к практике использования новых программных продуктов не вызывает сомнений, так как известно, что шансы выпускника вуза на успешную карьеру резко увеличиваются, если кроме теоретических знаний он обладает еще и прочными практическими навыками. Так что наша совместная цель – подготовка грамотных специалистов, понимающих потребности бизнеса и умеющих применить современные информационные технологии и программное обеспечение по анализу данных для их удовлетворения.