基于约束非负矩阵分解的图像表示
对于图像的约束非负矩阵分解
摘要:非负矩阵分解(NMF)对于寻找非负数据的块基础和线性表示是一个常用的方法。它已经广泛的应用于各种应用,比如模式识别,信息检索,计算机视觉。但是,NMF本质上是一个非监督方法,不能利用标签信息。在本文中,我们提出一种新的半监督矩阵分解方法,叫约束非负矩阵分解(CNMF),将标签作为附加约束合并进来。特别地,本文显示出结合标签信息能非常简洁地提高矩阵分解的识别能力。我们利用两个函数公式和提供的相应优化问题的更新解决方法来研究所提出的CNMF方法。通过实际数据的评估,我们所提出的方法和最先进的方法相比更有效。
索引词:非负矩阵分解,半监督学习,降维,聚类
1.简介
许多数据分析中一个基础的问题就是寻找一个合适的表示数据[1],[2],[3],[4],[5],[6],[7],[8]。可以应用一个非常有效的方法表示数据之间的潜在结构。矩阵分解技术作为这类数据表示的基础工具已经得到越来越多的注意。运用不同的标准已经得到了大量不同的方法。最流行的技术包括主成分分析(PCA)[9],奇异值分解(SVD)[10],和向量量化[11]。矩阵分解的中心是找到两个或者更多的因子产生原始数据的一个好的逼近。在实际应用中,分解之后的矩阵维数通常远远小于原始数据的维数。这就引起了数据的压缩表示,促进了其他研究比如聚类和分类。
在矩阵分解方法中,非负矩阵分解(NMF)有一个限制即所有的矩阵因子都必须是非负的,即所有的因子必须大于等于零。这个非负性约束使NMF从感觉上只能对原始数据进行加操作不能减。因此,对于图像处理,人脸识别[2][12],文件聚类[13][14]是一个理想的降维方法,它们就是由部分组成整体的。
NMF是一个非监督学习方法。NMF不能应用于许多实际的问题当专家认为是可行的有限知识中。但是许多机器语言的研究发现未标签的数据当与一些少量的标签数据相结合时在研究精确度上会产生相当大的提高[15][16][17]。全标签训练集的处理过程可能会很昂贵,然而少量的标签数据的获得相对便宜。在这种情况下,半监督学习方法就有很大的实用价值。因此,用半监督学习方法研究NMF很有意义。
最近,蔡登等人提出了一种图表正则化NMF(GNMF)方法来编码数据空间的几何信息。GNMF构建一个最近邻图表模拟多种结构。当标签信息可行时,它自然地应用到图表结构中。特别地,如果两个数据点使用同一个标签,大的权重会被分配到边缘连接它们。如果两个数据点使用不同的标签,相应的权重都是0。这就引起了半监督GNMF。这个方法的最大缺点是相同类别的数据点将会一起映射到一个新的表示空间,而且怎样有原则的选取权重并不清晰,这一观点没有理论保证。
本文中,我们提出一种新的矩阵分解方法,叫约束非负矩阵分解(CNMF),将标签信息作为附加的约束。我们算法的中心是相同类别的数据可以在一个新的表示空间中合并。这样,已经获得的部分表示就有和原始数据一致的标签,因此就有多的识别能力。我们方法的另一个优点是参数自由,避免了参数调试来获得更好的结果。这就使我们的算法更容易方便的应用于真实世界应用中。我们还讨论了怎样高效的解决相应的最优化问题。给出最优化收敛性证明。本文贡献如下: 1.标准NMF是一个非监督学习算法不需要结合标签信息。本文中,我们将它扩展为半监督学习算法。此外,我们将标签信息作为约束;这样一来,有相同标签
的数据在新的表示空间里就有相同的坐标。通过这种方法,表示可以有更多的识别能力。
2.以前的研究[18]显示NMF和概率潜在语义分析(PLSA)都是多项式PCA的实例。特别的是,PLSA利用KL[19][20]分解解决NMF问题。为了更深入的探讨,我们将CNMF应用于KL分解公式中并且提供更新规则解决最优化问题。 3.与半监督GNMF不同,我们算法的优点是参数自由。因此不用靠调参来获得更好的结果。CNMF算法更容易方便的应用于真实世界中。实验结果表明,该算法能有效提高聚类性能。
4.就我们目前的知识而言,没有一种方法能直接获得NMF的解决办法。目前最好的方法是使用更新迭代获得目标函数的最优解。因此算法的效率对真实应用很重要。本文中,我们定性的分析算法复杂度并通过实验测试收敛率定量地证明算法效率。
本文结构如下:第二部分,我们简要的介绍了NMF的背景和相关工作;第三部分介绍了NMF约束的相关工作,具体的算法和理论证明在第四和第五部分,第六部分讨论了算法的复杂度。第七部分实验结果,第八部分是总结。
2.相关工作
矩阵分解存在大量方法,如PCA,SVD,每种分解方法都有相应的约束条件,NMF的约束条件是分解因子矩阵元素必须非负。假设矩阵X RN d,行代表样本点,列代表样本维数。NMF的目的是找到满足X UVT的两个非负因子矩阵U,V。逼近质量由代价函数评价,一种是欧式距离平方度量JF,另一种是Kwellback-Liebler散度或相对熵JKL,这两种目标函数都是关于U,V的非凸函数,很难得到J的全局最小值,因此只能用迭代更新算法寻找上述优化问题的局部最小值及局部最优解U和V。
NMF中X在基函数U上的投影值是V,即NMF将d维向量X映射到k维向量V,新空间是由U张成的。因此当k d时,NMF可作为一种降维方法。(可与其他降维方法比较)
NMF没有利用样别标签信息,它是一种无监督的学习方法。
3.半监督NMF思想
设xi,i 1,2, n Rd,其中i 1,2, l的样本标签已知,而i l 1, n的样
本标签未知。设存在c类,我们建立l c矩阵C,当xi的标签是j类时,其元素 Cl c
Cij=1,否则Cij=0.我们建立半监督矩阵A=
0X U AZ
T
0
,令V=AZ,则
In-l n n l c
(硬约束条件A 软约束条件B,奇稀疏表示或后验概率) (Xd n Ud kVk nT,VN K AN N L C Z N L C K) L=N监督NMF
4.最优化问题及更新算法
4.1更新算法
利用F范数,带标签约束的CNMF算法变为最小化下式函数:
OF X UZTAT (1)
其中ui,j,zi,j是非负的。
(1)中U,Z都是非凸的,要想找到OF的全局最小量不切实际。接下来我们用迭代更新算法获得OF。利用矩阵性质Tr AB Tr BA ,目标函数OF重新写作
OF Tr(X UZTAT)=Tr((X UZTAT)(X UZTAT)T) Tr(XX) 2Tr(XAZU) Tr UZAAZU
T
T
T
T
T
2
ij, ij分别是uij 0,zij 0的拉格朗日乘子, ij , ij ,拉格朗日函数L是:
L OF Tr UT Tr ZT
L分别对U,Z求偏导,我们得到:
L
-2XAZ 2UZTATAZ 0 U L
2ATXTU 2ATAZUTU 0 Z
根据Kuhn-Tucker条件 ijuij 0, ijzij 0,可以得到关于uij,zij等式:
XAZ ijuij UZTATAZ ijuij 0,
A
T
XTU zij ATAZUTU zij 0
ij
ij
这些等式带来下面的更新准则:
XAZ ij
, (2) uij uij
TT
UZAAZij
zij zij
AA
T
T
XTU
T
AZUUij
(3)
ij
关于上面的迭代准则有下面的定理:
定理1:(1)中目标函数OF在(2)(3)条件下不会增长。当且仅当U,Z在稳定点时,目标函数不会变化。 4.2收敛证明
为了证明定理1,我们利用一个辅助函数的性质。
引理2:如果存在辅助函数G,满足G x,x' F x 和G x,x F x ,则F在 …… 此处隐藏:7635字,全部文档内容请下载后查看。喜欢就下载吧 ……
相关推荐:
- [外语考试]管理学 第13章 沟通
- [外语考试]07、中高端客户销售流程--分类、筛选讲
- [外语考试]2015-2020年中国高筋饺子粉市场发展现
- [外语考试]“十三五”重点项目-汽车燃油表生产建
- [外语考试]雅培奶粉培乐系列适用年龄及特点
- [外语考试]九三学社入社申请人调查问卷
- [外语考试]等级薪酬体系职等职级表
- [外语考试]货物买卖合同纠纷起诉状(范本一)
- [外语考试]青海省实施消防法办法
- [外语考试]公交车语音自动报站系统的设计第3稿11
- [外语考试]logistic回归模型在ROC分析中的应用
- [外语考试]2017-2021年中国隔膜泵行业发展研究与
- [外语考试]神经内科下半年专科考试及答案
- [外语考试]园林景观设计规范标准
- [外语考试]2018八年级语文下册第一单元4合欢树习
- [外语考试]分布式发电及微网运行控制技术应用
- [外语考试]三人行历史学笔记:中世纪人文主义思想
- [外语考试]2010届高考复习5年高考3年联考精品历史
- [外语考试]挖掘机驾驶员安全生产责任书
- [外语考试]某211高校MBA硕士毕业论文开题报告(范
- 用三层交换机实现大中型企业VLAN方案
- 斯格配套系种猪饲养管理
- 涂层测厚仪厂家直销
- 研究生学校排行榜
- 鄱阳湖湿地景观格局变化及其驱动力分析
- 医学基础知识试题库
- 2010山西省高考历年语文试卷精选考试技
- 脉冲宽度法测量电容
- 谈高职院校ESP教师的角色调整问题
- 低压配电网电力线载波通信相关技术研究
- 余额宝和城市商业银行的转型研究
- 篮球行进间运球教案
- 气候突变的定义和检测方法
- 财经大学基坑开挖应急预案
- 高大支模架培训演示
- 一种改进的稳健自适应波束形成算法
- 2-3-鼎视通核心人员薪酬股权激励管理手
- 我国电阻焊设备和工艺的应用现状与发展
- MTK手机基本功能覆盖测试案例
- 七年级地理教学课件上册第四章第一节