Документы



Радиотехника ва телевидение радиотехника и телевидение Применение модифицированного sift алгоритма для распознавания визуальных характеристик лица icon

Радиотехника ва телевидение радиотехника и телевидение Применение модифицированного sift алгоритма для распознавания визуальных характеристик лица

НазваниеРадиотехника ва телевидение радиотехника и телевидение Применение модифицированного sift алгоритма для распознавания визуальных характеристик лица
Дата05.07.2013
Размер81.37 Kb.
ТипДокументы
скачать

РАДИОТЕХНИКА ва телевидение

РАДИОТЕХНИКА и телевидение




Применение модифицированного SIFT алгоритма для распознавания визуальных характеристик лица


М.М. Джалалов (ГУП «UNICON.UZ»), Т.Д. Раджабов (ТУИТ)


Веб камера ёрдамида ва белгиларни ажратишга асосланган юзнинг ифодаларини аниқлаш услуби келтирилган. Биз SIFT алгоритмини янада тезроқ ва эффиктив қилиш мақсадида ўзгартирдик. Ундан ташқари ҳар қандай объектларни аниқлайдиган универсал блок-схема ҳам ишлаб чиқилди. Мазкур мақолада биз Cohn-Kanade маълумотлар базасидан фойдаландик. Шунингдек бизнинг модификация қилинган SIFT алгоритмни оригинал SIFT ва KLT каби алгоритмлар билан таққосладик ва бизнинг SIFT алгоритм яхшироқ натижа кўрсатди.

Представлен метод, основанный на выделении признаков для распознавания выражений лиц человека в режиме реального времени с использованием веб-камеры. Мы модифицировали алгоритм Масштабно-Инвариантной Трансформации Признаков (Scale Invariant Feature Transform, SIFT) для более быстрого и эффективного функционирования. Мы также разработали блок-схему для распознавания любых объектов. В нашем методе мы использовали Базу Данных Выражений лица Cohn-Kanade. Также мы сравнили разработанный нами метод с исходными алгоритмами SIFT и KLT, где наш улучшенный SIFT показал большую точность распознавания.

A features extraction based method for real-time human facial expressions recognition using a web camera is presented. We modified SIFT (Scale Invariant Feature Transform) algorithm for faster and more efficient operations. We also developed framework for any object recognition. In our method, we used Cohn-Kanade database of facial expressions. We also compared our method with the original algorithms SIFT and KLT, where our improved SIFT method showed better recognition accuracy.


Люди обнаруживают и интерпретируют лица и мимику на сцене практически без усилий. Тем не менее, разработка автоматизированной системы, которая выполняла бы эту задачу, довольно сложна. Есть несколько связанных с этим проблем: выявление сегментов изображения как лица, извлечение информации о выражении лица и классификация выражения (например, по категории эмоций). Система, выполняющая эти операции точно и в реальном времени станет большим шагом в достижении схожего с человеческим взаимодействия человека и машины [1].

Последние достижения в области анализа изображений и распознавания образов открывают возможность автоматического обнаружения и классификации эмоциональных и разговорных сигналов лица.

Автор в [2] предложил подход, основанный на признаках SIFT (Масштабно-Инвариантная Трансформация Признаков) по распознаванию лиц. SIFT признаки извлекаются из всех имеющихся лиц в базе данных. Затем, учитывая новые изображения лица, признаки извлеченные из этого лица сравниваются с признаками каждого лица в базе данных. Ближайшим лицом считается лицо в базе данных с наибольшим количеством точек сопоставления, и оно используется для классификации нового лица.

Мы использовали наш модифицированный алгоритм SIFT для различных приложений.

Например, в [3] представлена модификация SIFT алгоритма для извлечения признаков изображения и соответствия. Мы предложили новый метод сопоставления лиц в SIFT алгоритме, который немного быстрее для распознавания объектов. Кроме того, в [4] была представлена структура для системы мониторинга окружения автотранспорта с высоты птичьего полета с использованием метода стыковки, основанного на модифицированном SIFT. Эта структура включает в себя несколько основных этапов (калибровка камеры, удаление искажений и алгоритмы трансформации с высоты птичьего полета), метод стыковки изображений с использованием модифицированного алгоритма извлечения/сопоставления изображений и метод обнаружения препятствий. Для оценки была проведена серия экспериментов и симуляций, где в некоторых случаях наш модифицированный SIFT алгоритм показал лучшие результаты.

^ Описание разработанного метода

В этой части мы представляем наш метод для распознавания выражений лица на основе SIFT. Распознавание в компьютерном видении – это двухэтапный процесс, включающий задачи обнаружения и классификации заданного объекта в изображении или последовательности видеокадров. Сначала предметы локализуются на входящем изображении. Затем эти объекты описываются набором точек интереса (дескрипторов признаков). Для классификации требуется информация о всех классах, с которыми сопоставляется объект на входящем изображении.

Мы разработали метод по распознаванию эмоций лица, основанный на нашем модифицированном SIFT алгоритме. Из описания алгоритма в [5], очевидно, что, в общем, SIFT алгоритм можно понимать как оператор местных изображений, который берет входящее изображение и преобразует его в набор местных признаков.

Сопоставление признаков SIFT дескрипторов двух изображений включает подсчет Евклидового расстояния между каждым дескриптором первого изображения и каждым дескриптором второго изображения в Евклидовом пространстве. В соответствии с процедурой Ближайшего соседа (Nearest Neighborhood, ANN), для каждого ai признака в наборе признаков модельного изображения, соответствующий признак bi необходимо искать в наборе признаков тестового изображения. Соответствующий признак – это признак с наименьшим Евклидовым расстоянием до признака ai. Пара соответствующих признаков (ai, bi) называются подошедшими M(ai, bi).

В случае, если соотношение Евклидова расстояния ближайшего соседа до Евклидова расстояния второго ближайшего соседа превышает предварительно определенный порог, сопоставленный признак отвергается.

Евклидово расстояние – это расстояние ключевых точек в пространстве признака. Все ключевые точки (признаки) из двух изображений трансформируются в многомерное пространство на основании своих градиентов, ориентаций, величины, расположения, яркости и т.д. Каждый признак в пространстве признаков представляет вектор признака:






(1)



где, D(a, b) – Евклидово расстояние между вектором признака a и вектором b, и подошедшие точки будут исключены, если D(a, b) больше установленного порога.

Подсчет расстояния между всеми точками признаков занимает длительное время и представляет собой сложный процесс. Мы предлагаем найти скалярное произведение этих векторов признаков, что более быстро и надежно, нежели нахождение расстояния. Так как расстояние между признаками может быть схожим, результатом может стать неправильное сопоставление, однако, угол всегда разный. Находится скалярное произведение и арккосинус между векторами признака:




(2)



(3)


Затем проверяется, меньше ли угол (θ) ближайшего соседа заранее заданного коэффициента (pred.ratio):



(4)

В предыдущем SIFT только сравнивается расстояние ближайшего соседа до других расстояний и берется наименьшее значение. В модифицированном SIFT мы сравниваем углы между векторами признака (векторы A1 и A2). Мы также используем коэффициент расстояния (DisRatio) для «Отброса постороннего» в целях уменьшения неправильного сопоставления, и берем только положительные значения как показано ниже:



(5)

Нами был протестирован разработанный метод для распознавания выражений лица (рис. 1).





Рис. 1. Наша разработанная структура


Как показано на Рис. 1, структура распознавания выражений человеческого лица включает в себя несколько суб-блоков. В блоке «Выделение признака» с помощью алгоритма SIFT по выделению признаков во временную память выделяются и сохраняются признаки из изображений [3]. Следующий - “Сопоставление признаков”, где все признаки, выделенные из входящего изображения, сопоставляются с изображением-образцом, на основе нашего модифицированного SIFT алгоритма [3] (рис.2). Проверяется, есть ли признаки из изображения-образца во входящих изображениях. И наконец, мы используем блок «Классификация» для распознавания выражений человеческого лица на основе «СК базы данных».





Рис. 2. Этап сопоставления признаков

(глаза, уши, нос, рот сопоставляются с таковыми в базе данных)


База данных выражений лица “Cohn-Kanade AU-Coded Facial Expression Database” [7] используется для проведения исследований в автоматическом анализе изображений лица и синтезе для перцепционных исследований, что включает 486 последовательности из 97 поз. Каждая последовательность начинается с нейтрального выражения и доходит до пикового.

^ Результаты симуляции

Чтобы проверить, хорошо ли работает разработанный нами метод, мы провели несколько тестов и экспериментов. Сначала провели моделирование обнаружения объектов. После этого, на основе нашего улучшенного SIFT алгоритма, мы распознавали такие объекты на изображениях, как лицо, глаза, а из выражений лица «Улыбку» и «Нейтральное».

^ Результаты экспериментального тестирования

Здесь представлен пример для системы распознавания выражений человеческого лица в режиме реального времени (рис.4), написанный в кодировке Matlab. Как показано на рис. 4, когда пользователь улыбается, справа программа выводит статус. Когда пользователь улыбается, программа показывает слово «Смеется», а когда на лице пользователя нет эмоций, программа показывает «Нейтральный».





Рис. 4. Результаты экспериментов по распознаванию выражений лица


^ Результаты сравнения

Мы сравнили свою разработанную структуру на основе улучшенного алгоритма SIFT с исходными алгоритмами SIFT и KLT [6] (Рис. 5), где наш метод показал лучшую точность распознавания.




Рис. 5. Результаты сравнения точности исходного SIFT алгоритма, улучшенного SIFT алгоритма и KLT алгоритма



Таким образом, одним из основных преимуществ разработанной структуры является ее универсальность при использовании в любом приложении, связанном с распознаванием. Автоматизированные системы или Роботы должны понимать объекты, окружающие их до начала каких-либо действий. Для этого нам нужен простой и универсальный метод. Также мы продемонстрировали, что наш метод хорошо работает с меньшим количеством ошибок обнаружения и распознавания.

Наша структура уникальна и до этого такой работы не проводилось. Все предыдущие методы предназначались только для одной конкретной цели. А наш разработанный метод является универсальной и может быть, в соответствии с разными база данными, использован для разных целей. В будущем эту структуру можно использовать и с другими Базами данных, такими как обнаружение транспортных средств и распознавание номерных знаков, идентификация людей на входах и Системе охранного телевидения (CCTV), распознавании множественных объектов и т.д.

Использованная литература

  1. M. Pantic, Leon J.M. Rothkrantz, “Automatic Analysis of Facial Expressions: The State of the Art”, IEEE transactions on pattern analysis and machine intelligence, Vol. 22, No.12, Dec. 2000.

  2. M. Aly, “Face Recognition using SIFT Features”, CNS186 Term Project Winter:1-7, 2006.

  3. Музаффар Джалалов, Тельман Д.Раджабов, “Распознавание объектов с использованием улучшенного метода выделения признаков объекта и сопоставления”, научный журнал “Axborotkommunikaciyalar: tarmoqlar-texnologiyalar-echimlar”, No.2 (18), 2011.

  4. Музаффар Джалалов, Тельман Д.Раджабов, “Top-View Surrounding Monitor System using Modified-SIFT based Stitching method with obstacle detection”, Springer Lecture Notes in Electrical Engineering, Vol. 134, 2011.

  5. Lowe, D. G., “Distinctive Image Features from Scale-Invariant Keypoints”, International Journal of Computer Vision, 60, 2, 2004.

  6. J. Y. Bouguet, “Pyramidal Implementation of the Lucas Kanade (KLT) Feature Tracker Description of the Algorithm”, 2009.

  7. База данных лиц “Cohn-Kanade AU-Coded Facial Expression Database”: http://www.ri.cmu.edu/research_project_detail.html?project_id=421&menu_id=261




Похожие:

Радиотехника ва телевидение радиотехника и телевидение Применение модифицированного sift алгоритма для распознавания визуальных характеристик лица iconДокументы
1. /Д-Радиотехника 12-16.doc
Радиотехника ва телевидение радиотехника и телевидение Применение модифицированного sift алгоритма для распознавания визуальных характеристик лица iconКўриб чиқишга қабул қилинади. Радио ва телевизион
Республикаси босма, радио, телевидение ва интернет ахборот воситаларининг барча ходимлари учун бирдек очиқ
Радиотехника ва телевидение радиотехника и телевидение Применение модифицированного sift алгоритма для распознавания визуальных характеристик лица iconРангли металлар ва уларнинг қотишмалари Режа Рангли металлар Рангли металл қотишмаларнинг турлари
Чунки бу конструкцион материаллар халқ хужалигининг турли сохаларида, масалан, авиация саноати, ракетасозлик, электротех­ника, радиотехника...
Радиотехника ва телевидение радиотехника и телевидение Применение модифицированного sift алгоритма для распознавания визуальных характеристик лица iconРадиосвязь, радиовещание и телевидение радиоалоқа, радиоэшиттриш ва телевидиние Мировой опыт внедрения и развития технологий цифрового звукового радиовещания стандарта
Шу билан бирга кенгрок маънода, рақамли радиоэшиттириш стандартлари dab ва drmларнинг хусусиятлари ва дунёда тадбиқ этилганлик даражаси...
Радиотехника ва телевидение радиотехника и телевидение Применение модифицированного sift алгоритма для распознавания визуальных характеристик лица iconРадиотехника система автоматизации управления радиочастотным спектром А. Р. Гатаулина (гкрч руз), У. М. Азимов, А. А. Кадыров (гуп «unicon. Uz»
В статье рассмотрены вопросы автоматизации управления радиочастотным спектром. Приведен краткий обзор нескольких программных продуктов,...
Радиотехника ва телевидение радиотехника и телевидение Применение модифицированного sift алгоритма для распознавания визуальных характеристик лица iconТелевидение Тестирование абонентских приставок для приема цифрового телевизионного вещания dvb-t
Ушбу мақолада dvb-t стандартидаги ер усти рақамли телевизион эшиттириш сигналларини қабул қилиш учун мўлжалланган абонент приставкаларини...
Радиотехника ва телевидение радиотехника и телевидение Применение модифицированного sift алгоритма для распознавания визуальных характеристик лица icon20. 12. 2004 й. N 592 телерадиоэшиттириш соіасида радиочастота спектридан самарали фойдаланишни таъминлаш чора-тадбирлари тўЈрисида
Белгилаб`єўйилсинки, 2005 йил 1 февралдан бошлаб радиочастоталарни таєсимлаш іамда телевидение кўрсатувлари ва радиоэшиттиришларни...
Радиотехника ва телевидение радиотехника и телевидение Применение модифицированного sift алгоритма для распознавания визуальных характеристик лица iconПерспективы реализации многоцелевого интерактивного телевидения в Республике Узбекистан А. А. Кадыров, Ж. Л. Шарафутдинов, соискатели гуп «unicon. Uz»
В данной статье освещены вопросы по интерактивной телевидение, приведены классификации и рекомендации к реализации многоцелевого...
Радиотехника ва телевидение радиотехника и телевидение Применение модифицированного sift алгоритма для распознавания визуальных характеристик лица iconРадиосвязь, радиовещание и телевидение радиоалоқа, радиоэшиттриш ва телевидиние Об оценке эмс рэс цифрового вещания и мобильной связи Файзуллаев А. Н., Азимов У. М. (Гуп «unicon. Uz»)
В статье рассмотрены вопросы оценки возможности совместного использования полосы частот 790 862 mhz современными средствами цифрового...
Радиотехника ва телевидение радиотехника и телевидение Применение модифицированного sift алгоритма для распознавания визуальных характеристик лица iconГде же сегодня находят широкое применение икт? Прежде всего, на уроке
Где же сегодня находят широкое применение икт? Прежде всего, на уроке. Информатизация начальной школы играет важную роль для достижения...

Разместите кнопку на своём сайте:
Документы


База данных защищена авторским правом ©uz.denemetr.com 2000-2015
При копировании материала укажите ссылку.
обратиться к администрации