Бизнес и финансы

Михаил Левиев: Больше 90% всех мировых данных сгенерировано за последние 2 года

«За нами следят» — с этих слов начинается каждая серия популярного американского сериала «Person of Interest». Речь там идет о фантастической «Машине» — компьютерной системе, созданной правительством США. Ей поставили задачу — предотвращать теракты, анализируя для этого большие данные. Но оказалось, что «Машина» видит и знает абсолютно все.

Реальность мало отличается от вымысла. Взгляните на свежие новости, и вы убедитесь, что анализ больших данных глубоко проник в нашу жизнь. 29 октября 2014 года газета The Guardian писала, что Twitter разработал приложение, выявляющее потенциальных самоубийц среди пользователей. Roem.ru в этот же день рассказал о новом облачном сервисе «1С-Битрикс BigData», который прогнозирует поведение посетителей сайта, основываясь на анализе большого количества информации.

Мы попросили Михаила Левиева, генерального директора компании АлгоМост, специализирующейся на дата-майнинге (data mining — глубокий анализ данных), рассказать о развитии этой индустрии в России.

iBusiness: Что такое big data на самом деле?

Михаил Левиев: Больше 90% всех мировых данных было сгенерировано за последние 2 года. Это говорит о глубокой и глобальной оцифровке мира и процессов, которые в нем происходят. Появились огромные массивы данных, позволяющие узнать больше о наших привычках и пристрастиях. Обработка и анализ таких данных человеческим умом практически невозможны; для этого надо применять инструменты, способные к машинному обучению.

iBusiness: Есть ли в России рынок больших данных?

Михаил Левиев: Условно рынок big data можно разделить на две части:

1. Инфраструктурная часть, аппаратные решения.

Здесь происходит сбор, получение данных.

2. Софт и дата-майнинг, аналитический функционал. Здесь при помощи различного инструментария из собранных больших данных извлекается полезная информация.

Аналитики, оценивая объем рынка, не разделяют эти две части. Поэтому сложно точно сказать, в какой пропорции они формируют рынок big data в России. Однозначно видно, что российский рынок только начинает формироваться. На сегодняшний день на нем есть несколько компаний и подходов. Какие из них приведут к более успешной модели, мы увидим позже. По динамике коллег и своей компании я знаю, что рынок растет не менее чем на 50% в год.

Но данные нам еще необходимо накопить, ведь мы исторически отстаем в этом плане от западных коллег по причине относительно слабой информатизации и не столь качественной автоматизации. И так как мы в начале пути, основная масса возможных участников рынка даже не задумывалась об этом.

Сейчас на российском рынке действительно большими данными обладают лишь немногие компании. В основном это телекоммуникационная, банковская и страховая индустрии, ритейл. При понимании важности работы с big data компании могут привлекать профессиональный консалтинг, в рамках которого мы помогаем правильно развивать инфраструктуру по сбору данных и извлекать информацию из уже имеющихся.

Так или иначе, со временем data-mining трансформируется в big data-mining. Поэтому необходимо изначально правильно строить инфраструктуру, делать анализ уже сегодня, чтобы точно понимать, чего еще не хватает, какие еще данные нужны. Облачные решения несколько притормаживают развитие инфраструктуры big data, поскольку компаниям, пользующимся такими решениями, неинтересно развивать собственный IT-парк.

iBusiness: Торгуют ли big data в чистом виде?

Михаил Левиев: Сама по себе торговля большими данными в чистом виде — это лишь небольшая часть всей индустрии big data. Больший объем все-таки занимают решения по их обработке. Существуют большие данные в открытом доступе, или те, которые несложно добыть. Так, например, одна российская команда создает сейчас скоринговый сервис, основываясь на данных, полученных из социальных сетей и от партнеров.

В американском ритейле можно встретить случаи, когда большие данные докупаются на стороне. В одном из таких случаев компания купила алгоритм, прогнозирующий осадки на пару недель вперед. На основе этого прогноза она построила поставки зонтов в места, где ожидаются дожди, и это дало очень хороший доход.

Среди некоторых аналитиков существует мнение, что не стоит покупать акции Facebook в расчете на долгосрочную перспективу владения ими. Дело в том, что сейчас пользователи бесплатно предоставляют этой компании свои персональные данные, а затем социальная сеть передает их разным брендам для более точного таргетинга рекламных предложений. Вполне возможно, что в скором времени пользователи захотят получать плату за предоставление личных данных, либо у крупнейшей в мире соцсети появится серьезный конкурент, оплачивающий своим пользователям предоставление персональных данных.

Уже сейчас появились проекты, нацеленные на то, чтобы агрегировать персональные данные в правильном виде. Пользователям платят деньги за предоставление личной информации в определенном объеме, а затем продают эти данные компаниям, которым важно понимать, как работать с аудиторией. Но подобные примеры — это завтрашний день индустрии больших данных.

iBusiness: Какие отрасли в России еще недостаточно активны в анализе больших данных, хотя их зарубежные коллеги это уже делают?

Михаил Левиев: Яркий пример можно наблюдать в ритейле. Американский ритейл — это самая активная индустрия, инвестирующая в дата-майнинг. В России это пока очень опосредованно. Тем не менее, наблюдается некий интерес со стороны отечественного ритейла к анализу больших данных.

Для любого ритейлера очень ценно понимать, сколько конкретного товара будет продано в каждом отдельно взятом магазине сети. Ведь это влияет на планы закупок, на остаток товара на полках и так далее. Как правило, данным вопросом в торговых сетях занимаются целые отделы. Когда планы закупок и снабжения магазинов сети составляются на основе анализа данных, это делает один алгоритм и 2 – 3 человека, контролирующие его работу. Таким способом для одного из российских ритейлеров мы на 30% сократили срок, который товар проводит на полке.

Отстает и российский телеком. Западные телеком-компании сверхактивны в плане использования big data-mining. Это позволяет повысить качество услуг и уменьшить отток клиентов. В российском телекоме наблюдается лишь небольшой сдвиг: в одной из компаний недавно появился отдел по анализу больших данных.

Потрясающие кейсы есть в банковской индустрии. Самый простой пример: анализ больших данных позволяет понять, какой объем наличности и в каком банкомате нужно иметь и как часто ее надо менять. Это помогает повысить эффективность обслуживания сети банкоматов. Для клиента отсутствие денег в банкомате — это негативный опыт взаимодействия с банком. В одной из последних работ мы повысили эффективность работы сети банкоматов одного из российских банков на 15%.

iBusiness: Что эффективнее — универсальные или кастомные решения с сфере больших данных?

Михаил Левиев: «1С-Битрикс BigData», например, — это универсальное решение. Суть в том, что компания создала облако, в которое вогнала наработанные базовые стандартные алгоритмы (через свой или партнерский опыт), позволяющие понимать потребителей в целом.

В отличие от универсального, кастомный, то есть индивидуально разработанный алгоритм позволяет понять менталитет потребителей в частности. Он точно работает для конкретной аудитории, позволяет увидеть ее ценность и очень хорошо ее понимает. Эффективность кастомных решений выше примерно на 15 – 20%.

iBusiness: Можно ли построить успешный продукт (товар или сервис), основываясь исключительно на анализе больших данных?

Михаил Левиев: Можно. И продукт будет очень сильным, потому что big data-mining позволяет понять, как сделать, чтобы люди были довольны. Без big data сложно создать современный продукт.

Хороший пример — «Яндекс.Пробки». Он построен исключительно на анализе данных и продает в чистом виде результаты работы алгоритмов. Большинство проектов ФРИИ и «Сколково» так или иначе основаны на анализе данных, либо ведутся с его применением, либо сами являются продуктами для анализа данных.

По моим ощущениям, в этом году бизнес внимательно посмотрел на большие данные и на то конкурентное преимущество, которое они могут дать прямо сейчас. Кто бы мог подумать, но большими данными заинтересовались даже производственные проекты, которым стало очевидно, что это новый инструмент для решения их задач. Хотя это больше ожидалось от телекома, банков и ритейла.

iBusiness: В каких сферах российского госсектора раньше всего обратят внимание на работу с большими данными?

Михаил Левиев: Это им крайне необходимо, но где «выстрелит» — пока неясно. Однозначно будут развиваться отрасли, связанные с Минкомсвязи (пример Ростелекома — прим. ред.). Обретает форму направление на анализ больших данных в Минтрансе (пример РЖД — прим. ред.). Недостаточно внимания отводится big data в медицине, зато не обделена вниманием по этому вопросу энергетическая отрасль. Образование, экономика, здравоохранение, телекоммуникации, военно-промышленный комплекс — повсюду можно ожидать появления интереса государства к индустрии big data-mining.

Эта тема будет обсуждаться 12 ноября с 11:00 на Russian Interactive Week в Экспоцентре. Подробнее: http://riw.moscow

Ссылка на первоисточник

Понравилась статья? Подпишитесь на канал, чтобы быть в курсе самых интересных материалов

iBusiness.ru

Бизнес и финансы

Михаил Левиев: Больше 90% всех мировых данных сгенерировано за последние 2 года