«Есть опасения, что в системах обработки больших данных злоумышленник сможет взять под контроль достаточно большой объем этих данных, чтобы ввести в заблуждение пользователей системы», — говорит доктор Дебора Фринке, глава Исследовательской дирекции Управления национальной безопасности США и Центральной службы безопасности (NSA/CSS).
Банки часто оправдывают отказы по кредитам скоринговой системой. По каким критериям банки оценивают скоринговые системы, способные разрушить ваши планы на жизнь? Можно ли обмануть «кредитный детектор»? Корреспондент Банки.ру попыталась проникнуть в некоторые тайны скоринга.
Руководители отделов, занимающихся данными и аналитикой, столкнулись с дилеммой: без специалистов по обработке и анализу данных трудно отважиться на машинное обучение и анализ, а без успешных пилотных проектов убедить предприятия нанять таких специалистов не менее сложно, пишет Gartner.
В блоге Open Data Science на Хабрахабре вышел пост о базовых понятиях машинного обучения на примере одной из самых простых и самых полезных моделей — линейной регрессии. Пост содержит практические примеры реализации и подробный разбор недостатков рассматриваемой модели.
С 15 февраля по 15 марта будет проходить Machine Learning Boot Camp III — третье состязание по машинному обучению и анализу данных от Mail.Ru Group. На портале чемпионата вы можете прочитать обучающую статью для новичков и серьезную задачу для экспертов.
Дмитрий Ветров в ходе лекции в Яндексе рассказывает о преимуществах совмещения Байесовсих методов с технологиями машинного обучения. Как один из примеров приводится учет априорных предпочтений для препятствия излишней настройке параметров в ходе процедуры машинного обучения и, тем самым, частичного решения проблемы переобучения.
На Хабрахабре, в очередной статье из цикла об открытых данных, поднимается очень важный вопрос. Проблема качества данных представляет собой достаточно серьезную тему и не только в связи с их обработкой и анализом. На данных в современном цифровом мире построено множество процессов, в том числе и связанных с безопасностью. Поэтому от того, насколько качественные данные используются в государственных и коммерческих организациях зависит эффективность и результат их работы.
Директор SDSC Оливье Вершер объяснил в эфире телерадиокомпании RTS, что одна из основных задач его подразделения заключается в преодолении пропасти, которая существует сегодня между экспертами в своих областях – например, врачами, которые могли бы использовать данные для выбора способа лечения, наиболее подходящего конкретному пациенту, – и непосредственно учеными, работающими в сфере больших данных.
Росстат, по cловам его главы Александра Суринова, вошел в десятку лидеров по уровню открытости среди госсайтов. Однако чтобы сохранить роль главного источника статданных, необходимо введение централизованной системы обработки данных (ЦСОД), которую служба намерена запустить в этом году.
Не все открытые данные одинаково полезны. Статья на Хабрахабре описывает какие критерии качества существуют и как влияют на результат публикации данных в свободном и бесплатном доступе.
Tinkoff.ru совместно с Boosters приглашает специалистов в области анализа данных принять участие в турнире по машинному обучению. Турнир состоит из двух задач. Общий призовой фонд – 200 000 рублей.
Роботу понадобилась одна секунда, чтобы завершить статью. По словам профессора Пекинского университета Вань Сяоцзюня, который занимался разработкой медиа-робота, Сяо Нань способен писать как короткие, так и достаточно длинные тексты.
Интернет-журнал BroDude составил подборку перспективных и высокооплачиваемых профессий, которые можно освоить не выходя из дома.
Сбербанк в блоге на Хабрахабре описал кейсы практического применения Machine Learning и своё видение профессии Data scientist.
Основатель крупнейшего в мире хедж-фонда Bridgewater Рэй Далио надеется, что через пять лет искусственный интеллект будет принимать три четверти управленческих решений в компании.