Ученые МИФИ спроектировали новую высокоскоростную систему машинного обучения

20
января
2016

Коллектив малого инновационного предприятия «Лаборатории анализа данных – МИФИ» решал задачу машинного обучения, которая заключается в том, что у алгоритма есть доступ к обучающей выборке и реальному потоку данных. На основании только лишь данных обучающей выборки надо научиться с минимальными затратами вычислительного времени и максимальной точностью определять существует ли принадлежность события, значения или параметра из реального потока данных к обучающей выборке данных. В качестве данных мы использовали RGB значения пикселей. В качестве обучающей выборки был выбран двумерный массив пикселей с области человеческого носа. Задача заключалась в выделении остальных частей человеческой кожи на всей площади изображения фотографии человека (фото №1)

Задача решалась при помощи статистических классификаторов вычислявших гистограмму двумерного распределения случайной величины двух параметров поданных на вход.

На основе получившихся распределений удалось проверить принадлежность пикселя тому или иному распределению за 1 такт процессора. На иллюстрации выше можно наблюдать как система решает поставленную задачу выделения цвета кожи при помощи 4 самых эффективных классификаторов. Критерий эффективности вводился по соотношению площадей бинаризованных гистограмм двумерных распределений параметров.

Нами было использовано 6 параметров и 40 классификаторов, из которых 36 система самостоятельно распознала как малоэффективные. Полученное решение было устойчиво к смазам изображения из-за смещений камеры и расфокусировке изображения, изменениям размера изображения, поворотам, освещению лица с одного направления настольной лампой и выключению освещения, которое приводило к значительному изменению цвета кожи из-за голубоватого свечения рабочего стола моего монитора.

Разработанная система машинного обучения нами также была успешно применена для решения задачи трехмерной реконструкции человеческого лица по одному фотокадру с обычной вебкамеры (фото №2). В результате реконструкции мы получали 3д модель из ~3000 треугольников и текстуру, которые совместимы с 3д редактором Blender (фото №3,4,5,6,7). Обработка кадра 1280х760 пикселей RGB выполнялась за 20 мс на процессоре intel i5, что позволяет говорить о возможности строить такие реконструкции в реальном времени на скорости 30-40 fps.

Такого плана разработки нам нужны для глубокой модернизации вот этого нашего проекта https://mephi.ru/content/news/1387/98080/

В классическом обучении, гистограммные распределения случайных величин обычно не используются почти никак. С нашей точки зрения, это золотой ключик к унификации и ускорению процесса вычислений. Разработанный алгоритм обладает хорошей устойчивостью работы, он одинаково хорошо выделяет стены, тумбочки, лампочки, темнокожих людей, руки, и вообще все что угодно. Поэтому сейчас мы думаем о переводе вычислений с процессора на оптическую систему.

При наличии должной оптимизации, за счет использования набора инструкций SSE4 на intel i5, можно такие вычисления делать на скорости 3000 кадров в секунду (тут нет опечатки) для fullHD изображений в формате 1280x760 RGB. Такой рост производительности позволит в единицу времени сделать больше анализов, реализовать более сложные и точные системы анализа данных. В качестве решаемой задачи можно рассматривать не только задачу выделения цвета объекта, но и задачи высокоскоростного сопровождения целей, задачи прогнозирования рисков, решать системы эллиптических уравнений и многие другие задачи.

Мы ожидаем, что если разработать систему из массива фототранзисторов соединенных последовательно с лазерами, за которыми установлены инфракрасные двухмерные интерферометры и ЖК матрицы фотошаблонов, то на такой конструкции можно собрать фотонный компьютер пригодный для задач машинного обучения с выигрышем по производительности в миллионы раз и без необходимости бороться за стабильность кубитов. Не секрет, что пока вы читаете этот текст на своем мониторе, ваш процессор тратит 2-3 миллиона рабочих тактов на обновление изображения экрана. В случае перехода на оптическую систему, такая двумерная задача может быть обработана за 1 такт. Классические процессоры возьмут на себя лишь сервисную функцию, для осуществления переключений фотошаблонов и сбора обработанной информации.

Система в такой реализации будет иметь следующие ключевые преимущества:

  • Наноразмерность измерительных узлов не требуется за счет работы в инфракрасной области.
  • Систему возможно программировать без больших вычислительных затрат.
  • Возможно обойтись без использования сверх низких температур.
  • Вычислительная станция может состоять из типовых модулей, большую часть которых возможно изготовить на морально устаревшем оборудовании.
  • Существует широкий потенциал по глубокой технологической модернизации отдельных узлов и разработке новых алгоритмов данной вычислительной платформы.
37