Наше цифровое будущее зависит от более совершенных алгоритмов

Исследователь из Baidu рассказывает о том, что поисковые системы, Интернет вещей и автоматизированные устройства будут использовать алгоритмы глубокого поиска следующего поколения

Исследователи работают над новой версией алгоритмов, которые обеспечат появление более совершенных поисковых систем и смартфонов, самоуправляемых автомобилей и Интернета вещей.

Алгоритмы глубокого обучения, в общих чертах имитирующие работу мозга, используются для таких передовых технологий, как распознавание речи, обработка естественного языка и автономность роботов.

В данный момент исследователи приступили к созданию следующего поколения этих алгоритмов, которые найдут применение в машинном обучении, искусственном интеллекте и могут стать основой для переломных научно-технических достижений.

Дэн Олдс, аналитик консультационной компании The Gabriel Consulting Group, считает, что если мы хотим увидеть принципиальный прорыв в технологиях – к примеру, самоуправляемые автомобили, которые позволят нам подремать или почитать во время поездки, или летающие автомобили, доставляющие нас в нужное место на автопилоте – то понадобятся усовершенствованные алгоритмы глубокого обучения.

«Функционирование самоуправляемого автомобиля зависит от его способности различать препятствия на дороге и объезжать их. Скажем, чем лучше автомобиль сможет отличать пешехода от дорожного знака, тем проще ему предсказывать потенциальные опасные ситуации, - рассказывает Олдс. – И здесь наше будущее затрагивается не только в цифровом плане, но и в физическом. Что произойдет, если мы сможем доверить таким системам задачу перелета или поездки по стране или миру? Сможем ли мы спокойно поспать на заднем сиденье, пока наша машина везет нас на работу?»

Попросту говоря, хотя большинство людей даже не слышали об алгоритмах глубокого обучения, но если их улучшить, то в нашем будущем будут «умные» дома, а роботы будут ухаживать за нашими родителями и выгуливать собак.

«Данные исследования важны, поскольку дают нам более совершенные способы работы с бесконечно разрастающимся массивом данных Интернета вещей, - рассказывает Патрик Мурхед, аналитик компании Moor Insights & Strategy. – Глубокое обучение является важнейшей частью цифрового мира будущего, пусть большинство людей ничего о нем и не знают».

Эндрю Ын – доцент Стэнфордского университета в области информатики и руководитель исследовательских работ в китайской интернет-корпорации Baidu, известной своей крупнейшей китаеязычной поисковой системой. Совместно с учеными из Стэнфорда и специалистами из Baidu, Ын работает над следующим поколением алгоритмов глубокого обучения. На прошедшей на этой неделе конференции EmTech в Кембридже он сделал доклад, посвященный технологиям будущего и применению глубокого обучения в поисковых системах.

Эндрю обладает необходимым опытом для подобного доклада. Полтора года Ын работал в Google над проектом Google Brain, посвященном глубокому обучению.
Наряду с такими компаниями, как Microsoft, Facebook и Baidu, в Google разрабатывают более совершенные алгоритмы глубокого обучения, поскольку им приходится обрабатывать огромные объемы данных.

В интервью Ын рассказал, чем же прекрасны эти алгоритмы. С увеличением объема входных данных, традиционные алгоритмы начинают, подтормаживать, сбоить и, в конечном итоге, вовсе перестают работать. Все с точностью до наоборот с алгоритмами глубокого обучения. Чем больше вы предоставите им данных, тем лучше они работают.
Человеческий мозг так хорошо работает, потому что он сплошь наполнен огромным количеством нейронов, общающихся между собой посредством электрических импульсов. Алгоритмы глубокого обучения имитируют работу мозга через искусственные нейронные сети.

«Эти модели все эффективнее справляются с большими массивами данных по мере того, как мы создаем все более сложную имитацию мозга. Алгоритмы очень высокопроизводительны», - объясняет Ын.

Модели стремительно развиваются.

Четыре года назад крупнейшая нейронная сеть, т.е. набор алгоритмов глубокого обучения, имела около 10 миллионов связей. Ын вспоминает, что когда он начал работу над проектом в начале 2011 – модель разраслась до 1 миллиарда связей. В прошлом году, в составе исследовательской группы Стэнфордского университета, Ын участвовал в создании модели уже на 10 миллиардов связей.

Часть работы Ына заключается в улучшении алгоритма, а часть в замене традиционных центральных процессоров в модели графическими процессорами. Обнаружилось, что микросхемы, разработанные для обработки компьютерной графики, гораздо лучше подходят для построения больших нейронных сетей, поскольку лучше справляются с подобным типом вычислений.

«Для дальнейшего масштабирования мы создаем новую платформу глубокого обучения с использованием графических процессоров, - рассказывает Ын. – Я и мои сотрудники – первые, кто использует такой подход для моделей подобного масштаба. Другие компании также начали работать в этом направлении, но, насколько мне известно, Baidu первой создала масштабный кластер из графических процессоров для глубокого обучения».

Создание высокопроизводительных алгоритмов позволит совершить качественный рывок в системах распознавании голоса и визуальных образов. А это крайне важно, по мнению Ына.
В Интернете появляется все больше людей из бедных, иногда вовсе необразованных регионов, и, соответственно, будет увеличиваться число пользователей, проговаривающих, а не печатающих свои поисковые запросы. Ожидается также и рост числа запросов по изображению.

«В ближайшие пять лет количество голосовых запросов и запросов по изображению превысят 50% от общего числа. Именно поэтому мы сейчас активно инвестируем в это направление», - говорит Ын.

С улучшением систем распознавания речи водитель, к примеру, сможет надиктовать и отправить сообщение другу о том, что опаздывает на встречу, даже не касаясь телефона, лежащего на пассажирском сиденье.

«Даже несмотря на то, что мобильными телефонами пользуется весь мир, мне кажется, что еще никто не додумался до правильного пользовательского интерфейса, и мы вынуждены медленно набирать сообщения на крохотных клавиатурах наших смартфонов, - полагает Ын. – Системы распознавания речи совершенствуются, но они еще не настолько хороши, как хотелось бы. Когда приемлемый уровень будет достигнут , мне хотелось бы перестроить интерфейс наших мобильных телефонов вокруг голосового распознавания».
Алгоритмы глубокого обучения будут использоваться «умной» бытовой техникой, самоуправляемыми автомобилями и носимыми устройствами – переплетаясь все вместе в Интернете вещей.

Ын заключает: «Думаю, пульты управления исчезнут из наших домов. Если вам захочется послушать музыку, то не придется доставать мобильный телефон, снимать его с блокировки и нажимать кучу кнопок – просто ложитесь на диван и сообщите вашему Baidu-устройству, чтобы оно включило Джастина Тимберлейка. Надеюсь, в будущем внуки будут спрашивать меня, действительно ли было такое время, когда устройства не понимали того, что ты говоришь. Наверняка, они будут озадачены тем, что нам приходилось держать в доме по пять разных пультов управления».

Автор: Шэрон Годен

Оригинал - http://www.computerworld.com/article/2687902/smarter-algorithms-will-power-our-future-digital-lives.html
Перевод: Павел Корнилов