Ученые МИФИ спроектировали новую высокоскоростную систему машинного обучения

января

2016

Коллектив малого инновационного предприятия «Лаборатории анализа данных – МИФИ» решал задачу машинного обучения, которая заключается в том, что у алгоритма есть доступ к обучающей выборке и реальному потоку данных. На основании только лишь данных обучающей выборки надо научиться с минимальными затратами вычислительного времени и максимальной точностью определять существует ли принадлежность события, значения или параметра из реального потока данных к обучающей выборке данных. В качестве данных мы использовали RGB значения пикселей. В качестве обучающей выборки был выбран двумерный массив пикселей с области человеческого носа. Задача заключалась в выделении остальных частей человеческой кожи на всей площади изображения фотографии человека (фото №1)

Задача решалась при помощи статистических классификаторов вычислявших гистограмму двумерного распределения случайной величины двух параметров поданных на вход.

На основе получившихся распределений удалось проверить принадлежность пикселя тому или иному распределению за 1 такт процессора. На иллюстрации выше можно наблюдать как система решает поставленную задачу выделения цвета кожи при помощи 4 самых эффективных классификаторов. Критерий эффективности вводился по соотношению площадей бинаризованных гистограмм двумерных распределений параметров.

Нами было использовано 6 параметров и 40 классификаторов, из которых 36 система самостоятельно распознала как малоэффективные. Полученное решение было устойчиво к смазам изображения из-за смещений камеры и расфокусировке изображения, изменениям размера изображения, поворотам, освещению лица с одного направления настольной лампой и выключению освещения, которое приводило к значительному изменению цвета кожи из-за голубоватого свечения рабочего стола моего монитора.

Разработанная система машинного обучения нами также была успешно применена для решения задачи трехмерной реконструкции человеческого лица по одному фотокадру с обычной вебкамеры (фото №2). В результате реконструкции мы получали 3д модель из ~3000 треугольников и текстуру, которые совместимы с 3д редактором Blender (фото №3,4,5,6,7). Обработка кадра 1280х760 пикселей RGB выполнялась за 20 мс на процессоре intel i5, что позволяет говорить о возможности строить такие реконструкции в реальном времени на скорости 30-40 fps.

Такого плана разработки нам нужны для глубокой модернизации вот этого нашего проекта https://mephi.ru/content/news/1387/98080/

В классическом обучении, гистограммные распределения случайных величин обычно не используются почти никак. С нашей точки зрения, это золотой ключик к унификации и ускорению процесса вычислений. Разработанный алгоритм обладает хорошей устойчивостью работы, он одинаково хорошо выделяет стены, тумбочки, лампочки, темнокожих людей, руки, и вообще все что угодно. Поэтому сейчас мы думаем о переводе вычислений с процессора на оптическую систему.

При наличии должной оптимизации, за счет использования набора инструкций SSE4 на intel i5, можно такие вычисления делать на скорости 3000 кадров в секунду (тут нет опечатки) для fullHD изображений в формате 1280x760 RGB. Такой рост производительности позволит в единицу времени сделать больше анализов, реализовать более сложные и точные системы анализа данных. В качестве решаемой задачи можно рассматривать не только задачу выделения цвета объекта, но и задачи высокоскоростного сопровождения целей, задачи прогнозирования рисков, решать системы эллиптических уравнений и многие другие задачи.

Мы ожидаем, что если разработать систему из массива фототранзисторов соединенных последовательно с лазерами, за которыми установлены инфракрасные двухмерные интерферометры и ЖК матрицы фотошаблонов, то на такой конструкции можно собрать фотонный компьютер пригодный для задач машинного обучения с выигрышем по производительности в миллионы раз и без необходимости бороться за стабильность кубитов. Не секрет, что пока вы читаете этот текст на своем мониторе, ваш процессор тратит 2-3 миллиона рабочих тактов на обновление изображения экрана. В случае перехода на оптическую систему, такая двумерная задача может быть обработана за 1 такт. Классические процессоры возьмут на себя лишь сервисную функцию, для осуществления переключений фотошаблонов и сбора обработанной информации.

Система в такой реализации будет иметь следующие ключевые преимущества:

Наноразмерность измерительных узлов не требуется за счет работы в инфракрасной области.
Систему возможно программировать без больших вычислительных затрат.
Возможно обойтись без использования сверх низких температур.
Вычислительная станция может состоять из типовых модулей, большую часть которых возможно изготовить на морально устаревшем оборудовании.
Существует широкий потенциал по глубокой технологической модернизации отдельных узлов и разработке новых алгоритмов данной вычислительной платформы.

Форма поиска

Ученые МИФИ спроектировали новую высокоскоростную систему машинного обучения

Полезные ссылки