首页>总结报告>零样本总结(热门8篇)

零样本总结(热门8篇)

时间:2024-04-05 12:35:04 总结报告

零样本总结 第1篇

拟合方法基本思想是:类别描述信息可以被当做样本标签看待(构造新实例),首先,通过拟合函数将样本 x i x_i xi​和类别描述信息 t j t_j tj​拟合到一个同一空间P:

零样本总结 第2篇

使用语义空间做拟合空间并且使用回归函数做拟合函数时,会产生枢纽度问题。在拟合空间P中,一些类别描述信息是很多样本的最近邻,而这些样本实际上类别并不相同,这个描述信息就被称为_枢纽(hubs)“,这种现象称为_枢纽度问题(hubness)”。 一些工作为了解决枢纽度问题,采用其他损失函数如rank loss或采用不同的距离度量函数如余弦相似度等。

零样本总结 第3篇

零点学习是一个非常新的研究领域,但毋庸置疑的是,它具有非常大的潜力,是计算机视觉领域的领先研究课题之一。

它可以作为未来许多项目的基础系统。可以利用Zero-Shot学习为视力障碍者开发一个辅助性的嵌入式系统。自然界中的监控摄像机可以使用零点射击学习来检测和计算它们自己栖息地中的稀有动物。

随着机器人领域的发展,我们正试图生产与我们自己相似的机器人。人类的视觉是使我们成为人类的最重要特征之一,我们希望将这一特征转移到机器人身上。我们能够解释和识别一个物体,即使我们从未见过一个样本,至少我们可以推理出那个东西是什么。零点学习法在很多方面与人类视觉系统相似,因此它可以用于机器人视觉。与其在有限的物体上进行识别,使用零点学习法有可能识别世界上所有的物体。

零样本总结 第4篇

根据分类器的构造方法,基于分类器的零样本学习又可分为映射方法,关系方法和组合方法。 首先需要说明的是,基于分类器的方法的主要思想:它是基于**“1对多”的方式来训练N个分类器**(想想为什么要多个分类器,而不是一个?),xxx类别的数量,即它为每个类别单独训练一个分类器,每次训练的时候用属于当前待识别类别的样本做为正样本其他所有样本做为负样本。 因为测试集中的有些类别不在训练集中,所以直接用训练集训练一个分类器,用在测试集上效果会很差。基于分类器方法的主要思想是利用额外知识----类别描述信息(语义空间),具有相似类别描述信息的类别,其分类器也比较相似。比如驴和马,它们之间的类别描述信息很相似,则用驴构成的训练集训练一个二分类模型f来判断样本是否属于驴,则这个二分类模型f利用到马构加粗样式成的测试集上效果也不会很差:用1表示属于(驴)马,0表示不属于(驴)马,则f在驴数据集上训练时**,分类器输出越接近1则越有信息认为它是一头驴**,越接近0则相反;把训练好的f用到马数据集上分类马时,因为马和驴很相似,所以分类器的输出和在驴数据集上的输出相似,于是也大概率能正确分类出马。但是我们不可能只给训练集中出现的类别各自训练一个分类器,因为这样还是无法分类测试集中的具有新类别的样本(因为测试集中的新种类可能有多个,你不知道这个测试样本属于新种类还是训练集中的种类,如果是新种类你也不知道是哪个新种类),所以需要对每个类别(包括已知类别和未知类别)都构建一个二分类器,这样对于每个测试样本,可以采取**“依次带入这些分类器取概率最高的类别做为它的类别**”。通过上述分析我们知道,马和驴的分类器参数应该是相似的,现在的问题是**,模型事先并不知道马和驴是相似的**,所以也就不知道让马和驴的分类器参数相似,所以这时就需要额外信息的加入。通过加入类别描述信息,模型知道了马和驴相似,于是把马的分类器参数训练得和驴相似,也就得到了新类别马的分类器模型。 有了上面的主要思想,则要做的就是如何把类别的描述信息加入模型被模型所感知和利用?于是有了以下的各种方法。

首先针对训练集中的每个类别训练一个二分类器 f i f_i fi​,得到识别每个类别所需要分类器参数 w i w_i wi​.

在测试阶段,对于每个测试样本,带入到每个类别的分类器中,取概率最大的类别作为它的类别。 上述方法是一个最基础的方法,现在研究大多基于以上思想进行了改进,比如上述方法中,类别分类器和映射函数是分开学习的,一个改进的思想是让分类器和映射函数联合学习,以便它们之间彼此促进,这种方法损失函数如下所示:

上述方法只使用了训练样本和训练样本类别的描述信息,而没有使用测试样本和测试样本类别的描述信息,根据前文直推式学习和归案式学习对零样本学习分类,训练过程中也可以使用测试样本和测试样本类别的描述信息,这里不再详细展开。

零样本总结 第5篇

直推式学习和归纳学习是机器学习的基本概念,按直推式学习和归纳式学习的程度,零样本可以分为如下图所示方式: 在训练过程中,如果使用了测试集中的样本,则称为实例直推式,否则称为实例归纳式,如果用到了未知类别的描述信息,则称为类别直推式,否则称为类别归纳式。所以按上述进行分类,零样本的学习过程可以分为上图所示三种:训练过程中利用的信息越多,可能会过拟合,越少可能欠拟合。甚至导致领域漂移,所谓领域票移指的是源领域和目标领域数据差别太大,比如说:已有类别是家具,未知类别是动物,这种情形下采用传统的零样本学习也达不到很好的效果,因为很难根据类别相似来识别新类别

零样本总结 第6篇

现有方法大多是一些启发式的,并没有严格的证明。比如(1)如何选择额外信息(2)哪些来自训练样本的信息对测试样本分类有帮助?(3)如何阻止无关信息迁移和负迁移

比如zero-shot和few-shot相结合;与机器学习方法相结合,比如零样本学习可以做为主动学习之前的步骤来加强主动学习的效果等等。

零样本总结 第7篇

合成方法通过一些生成模型来生成未知类别的样本。未知类别的样本假设服从某些分布,比如高斯分布或均匀分布,首先求出已知类别的分布参数,然后根据未知类别描述信息和已知类别描述信息的关系求出未知类别的关系分布(比如对于高斯分布,参数是均值和方差)。有了未知类别样本的分布,就可以根据生成模型生成一些样本。生成模型比如generative mo-ment matching network (GMMN), denoising autoencoder, adversarial autoencoder, conditional variational autoencoder-based architecture, generative adversarial networks (GAN)等。生成模型的输入通常是未知类别描述信息和符合某一分布的噪音

零样本总结 第8篇

现有的关于零样本学习的研究设定中,训练数据和测试数据一般具有相同的数据类型和语义类型,但在实际应用中,训练集和测试集可以不同,比如训练集和测试集可以分别来自具有不同语义空间的类别在许多应用中,来自不同数据类型或语义类型的数据往往比较容易获取。此外,在当前零样本学习研究中,训练数据对应的可见类往往是预定义的,如果算法能够主动标记训练数据,那数据标注的压力会减小很多。在引入辅助信息后,怎样在模型学习过程中融入辅助信息也很关键。