Publication:
Comparative lip motion analysis for speaker identification

dc.contributor.departmentDepartment of Computer Engineering
dc.contributor.departmentDepartment of Computer Engineering
dc.contributor.departmentDepartment of Electrical and Electronics Engineering
dc.contributor.departmentN/A
dc.contributor.kuauthorYemez, Yücel
dc.contributor.kuauthorErzin, Engin
dc.contributor.kuauthorTekalp, Ahmet Murat
dc.contributor.kuauthorÇetingül, Hasan Ertan
dc.contributor.kuprofileFaculty Member
dc.contributor.kuprofileFaculty Member
dc.contributor.kuprofileFaculty Member
dc.contributor.kuprofileMaster Student
dc.contributor.otherDepartment of Computer Engineering
dc.contributor.otherDepartment of Electrical and Electronics Engineering
dc.contributor.schoolcollegeinstituteCollege of Engineering
dc.contributor.schoolcollegeinstituteCollege of Engineering
dc.contributor.schoolcollegeinstituteCollege of Engineering
dc.contributor.schoolcollegeinstituteGraduate School of Sciences and Engineering
dc.contributor.yokid107907
dc.contributor.yokid34503
dc.contributor.yokid26207
dc.contributor.yokidN/A
dc.date.accessioned2024-11-09T23:43:31Z
dc.date.issued2005
dc.description.abstractThe aim of this work is to determine the best lip analysis system, thus the most accurate lip motion features for audio-visual open-set speaker identification problem. Based on different analysis points on the lip region, two alternatives for initial lip motion representation is considered. In the first alternative, the feature vector is composed of the 2D-DCT coefficients of the motion vectors estimated within the rectangular mouth region whereas in the second, outer lip boundaries are tracked over the video frames and only the motion vectors around the lip contour are taken into account along with the shape of the lip boundary. Another comparison has been performed between optical flow and block-matching motion estimation methods to find the best model for lip movement. The dimension of the obtained lip feature vector is then reduced by a two-stage discrimination method selecting the most discriminative lip features. An HMM-based identification system has been used for performance comparison of these motion representations. It is observed that the lower-dimensional feature vector computed by block-matching within a rectangular grid in the lip region maximizes the identification performance. /Bu çalışmanın amacı, görsel-işitsel açık set konuşmacı tanıma problemi için en iyi dudak analiz sistemini, dolayısıyla en doğru dudak hareketi özelliklerini belirlemektir. Dudak bölgesindeki farklı analiz noktalarına dayalı olarak, başlangıç dudak hareketi gösterimi için iki alternatif göz önünde bulundurulur. Birinci alternatifte öznitelik vektörü dikdörtgen ağız bölgesi içinde tahmin edilen hareket vektörlerinin 2D-DCT katsayılarından oluşurken, ikinci alternatifte dış dudak sınırları video kareleri üzerinden izlenir ve sadece dudak konturu etrafındaki hareket vektörleri izlenir. dudak sınırının şekli ile birlikte dikkate alınır. Dudak hareketi için en iyi modeli bulmak için optik akış ve blok eşleştirme hareket tahmin yöntemleri arasında başka bir karşılaştırma yapılmıştır. Elde edilen dudak özelliği vektörünün boyutu daha sonra en ayırt edici dudak özelliklerini seçen iki aşamalı bir ayrım yöntemiyle azaltılır. Bu hareket gösterimlerinin performans karşılaştırması için HMM tabanlı bir tanımlama sistemi kullanılmıştır. Dudak bölgesinde dikdörtgen bir grid içerisinde blok eşleştirme ile hesaplanan alt boyutlu özellik vektörünün tanımlama performansını maksimuma çıkardığı görülmektedir.
dc.description.indexedbyScopus
dc.description.openaccessYES
dc.description.publisherscopeInternational
dc.description.sponsoredbyTubitakEuN/A
dc.description.volume2005
dc.identifier.doi10.1109/SIU.2005.1567680
dc.identifier.isbn0780-3923-96
dc.identifier.isbn9780-7803-9239-7
dc.identifier.linkhttps://www.scopus.com/inward/record.uri?eid=2-s2.0-33846625546&doi=10.1109%2fSIU.2005.1567680&partnerID=40&md5=bdb4bf484822bf5745623f03b78dec21
dc.identifier.quartileN/A
dc.identifier.scopus2-s2.0-33846625546
dc.identifier.urihttps://IEEExplore.IEEE.org/stamp/stamp.jsp?arnumber=1567680
dc.identifier.urihttps://hdl.handle.net/20.500.14288/13502
dc.keywordsFeature extraction
dc.keywordsMarkov processes
dc.keywordsMotion estimation
dc.keywordsProblem solving
dc.keywordsVectors
dc.keywordsVideo signal processing
dc.keywordsLip motion analysis
dc.keywordsMotion vectors
dc.keywordsOptical flow
dc.keywordsSpeech analysis
dc.languageTurkish
dc.publisherInstitute of Electrical and Electronics Engineers (IEEE)
dc.sourceProceedings of the IEEE 13th Signal Processing and Communications Applications Conference, SIU 2005
dc.subjectComputer engineering
dc.titleComparative lip motion analysis for speaker identification
dc.title.alternativeKonuşmacı tanıma için karşılaştırmalı dudak devinim analizi
dc.typeConference proceeding
dspace.entity.typePublication
local.contributor.authorid0000-0002-7515-3138
local.contributor.authorid0000-0002-2715-2368
local.contributor.authorid0000-0003-1465-8121
local.contributor.authoridN/A
local.contributor.kuauthorYemez, Yücel
local.contributor.kuauthorErzin, Engin
local.contributor.kuauthorTekalp, Ahmet Murat
local.contributor.kuauthorÇetingül, Hasan Ertan
relation.isOrgUnitOfPublication89352e43-bf09-4ef4-82f6-6f9d0174ebae
relation.isOrgUnitOfPublication21598063-a7c5-420d-91ba-0cc9b2db0ea0
relation.isOrgUnitOfPublication.latestForDiscovery21598063-a7c5-420d-91ba-0cc9b2db0ea0

Files