3 апреля 2015

10 интересных и неожиданных проектов, связанных с Большими Данными

Новости Технологии

Технологии больших данных уже давно на слуху, но наверняка не все понимают, какие именно задачи с их помощью можно решать. Мы не могли не поинтересоваться, что же происходит в мире больших данных, а узнав, поняли, что просто обязаны написать о самых веселых и серьезных проектах, связанных с анализом данных для самых разных целей.

10 интересных и неожиданных проектов, связанных с большими данными

Итак, Большие Данные помогают нам…

#0. Найти в Интернете то, что мы на самом деле хотим найти

Возможно, вы никогда об этом не думали, но старые добрые Google или Yandex (а также все остальные поисковые системы) умеют так хорошо искать именно благодаря большим данным. Каждый раз, когда поисковая машина подбирает результаты в ответ на ваш запрос, она работает с огромнейшими массивами информации.

Чтобы научиться качественно определять, что именно ищет пользователь, поисковой системе нужно управиться с триллионами объектов в Сети и проанализировать поведение миллиардов пользователей, уже задававших ей вопросы. Вполне естественно, что за годы работы поисковые гиганты успели накопить колоссальный опыт и теперь одними из первых выпускают разные продукты, связанные с анализом больших данных, в том числе и в режиме реального времени.

#1. Выбрать оптимальный маршрут с учетом пробок

Так, например, компания «Яндекс» отточила навыки в анализе данных на собственном поисковике и перенесла накопленный опыт в другую сферу, создав систему «Яндекс.Пробки». Для тех невероятных счастливчиков, кто не знаком с работой «Яндекс.Пробок», поясним: сервис собирает данные о дорожном движении из массы разных источников, анализирует эту информацию и отображает текущую (а также прогнозируемую) загруженность дорог на собственных картах компании.

В условиях беспощадных столичных пробок подобные решения являются настоящим спасением. Многим московским водителям знаком этот почти остросюжетный сценарий, когда приходится убегать от быстро заполняющего улицы зловещего красного цвета — так на «Яндекс.Картах» отмечаются серьезные заторы на дорогах. Так что, если соберетесь в столицу, обязательно поставьте себе это приложение.

#2. Спасти вымирающих животных

Из костей индийских тигров готовят снадобье, чрезвычайно популярное у некоторых суеверных китайцев. Добывают запрещенный товар хорошо обученные браконьеры, знакомые с каждым ручейком и каждым камнем в зоне обитания редких животных.

Поймать преступников было чрезвычайно сложно, пока активисты и власти не обратились к современным технологиям. Проанализировав данные за 43 года из 605 районов, ученые смогли определить горячие точки, в которые наиболее вероятно заглянут браконьеры.

Большие данные помогают бороться с браконьерами

#3. Сделать мегаполис более зеленым

В Нью-Йорке растет около 2,5 млн деревьев. Жители города очень любят зеленые насаждения, но, как оказалось, без должного ухода те не могут ответить им взаимностью в полной мере: за период с 2009 по 2010 год только в Центральном парке из-за падающих веток пострадали четыре человека. Среди них был и 37-летний разработчик Google.

Впрочем, не бывает безвыходных ситуаций. Проблему ухода, обрезки, удобрения и выбора оптимального времени для корчевания решили с помощью анализа больших данных.

#4. Узнать, чем уникальна индийская кухня

Существует теория кулинарной совместимости: если у ингредиентов похожий вкус и/или запах, то и в рецептах они друг другу подойдут (например, спаржа и сыр). Но статистический анализ огромного массива рецептов показал, что при готовке блюд индийской кухни ни в коем случае не стоит следовать этому правилу.

#5. Помочь справиться с эпидемиями малярии

Для эффективной борьбы со многими глобальными проблемами ученым не хватает данных. Компания Google спонсировала проект по борьбе с малярией в Африке с помощью мобильных телефонов. Проект призван помочь ученым вовремя обнаружить болезнь и лучше контролировать ее распространение.

Большие данные помогают бороться с малярией

#6. Узнать, как вырастить идеальную рождественскую елку

Желая вернуть прежний вид знаменитой фрейзерской елке и больше узнать о селекции растений, исследователи объединили генетическую и физическую информацию, а также данные об окружающей среде из 15 крупных баз данных. Процесс сбора информации оказался весьма технологичным: например, наблюдение за садами и лесами проводилось с помощью дронов. Собранные данные помогут ответить на ряд экологических вопросов, разработать новые методы работы в сельском хозяйстве и лучше решать задачи сохранения видов.

#7. Понять, что языки мира отражают наше стремление к счастью

Ученые проанализировали 100 000 слов из разных текстов на 10 языках и обнаружили интересную особенность: у нас гораздо больше слов для обозначения позитивной оценки, чем негативной. Самыми «счастливыми» языками оказались испанский и португальский.

#8. Сделать спортивные мероприятия еще интереснее для болельщиков

В большом спорте тренеры используют большие данные, чтобы разрабатывать стратегию игры, программы питания и тренировок или планировать шутки и другие виды взаимодействия с болельщиками. Все для наилучших показателей на поле!

#9. Улучшить условия работы

Собираетесь уволиться? Программа, работающая на основе технологии больших данных, позволит вашему боссу понять это еще до того, как вы решите сделать это сами, и посоветует ему, что можно предпринять для того, чтобы удержать работника.

#10. Исправить отношения с близкими

Как оказалось, анализ больших объемов информации может пригодиться не только для решения глобальных или более узких корпоративных задач, но и для частной жизни. Недавно аналитик данных с сайтов знакомств решила применить к себе навыки статистического анализа и по-новому взглянуть на отношения с бойфрендом.

Проанализировав 5,5 тыс. email-сообщений, девушка обнаружила несколько примечательных фактов. Например, ее парень предпочитает общение по телефону почтовой переписке и извиняется гораздо чаще, чем она. Сама героиня истории поняла, что склонна к сквернословию и разговорам на мрачные темы, такие как обсуждение раковых заболеваний или суицидальных наклонностей. Простой анализ переписки заставил ее по-новому взглянуть на отношения и осознать свои и чужие ошибки.

В IDC подсчитали, что 90% данных на серверах компаний лежат мертвым грузом. Эти потенциально полезные, но неиспользуемые (поскольку пока неясно, как это можно сделать) данные получили название «Dark Data». Так что в мире есть масса информации, которая еще только ждет своих пытливых исследователей. На сегодня на этом все, но мы уже готовим следующий материал о больших данных — в нем мы поговорим, как сложный анализ информации спасает жизни и помогает ловить преступников. Оставайтесь с нами!