- 博客(33)
- 收藏
- 关注
原创 SAM阅读
我们首先定义一个可提示的分割任务,该任务足够通用,可以提供强大的预训练目标并支持广泛的下游应用程序。也就是说,我们寻求开发一个可提示的模型,并使用支持强大泛化的任务在广泛的数据集上对其进行预训练。令人惊讶的是,我们发现一个简单的设计满足了所有三个约束:一个强大的图像编码器计算图像嵌入,一个提示编码器嵌入提示,然后将两个信息源组合在一个轻量级的掩码解码器中,以预测分割掩码。在 NLP 和最近的计算机视觉中,基础模型是一项很有前途的发展,它通常可以使用“提示”技术对新的数据集和任务执行零样本和少样本学习。
2024-11-21 22:37:28
393
原创 FFCA-YOLO for small object detection in remote sensing images(遥感图像中的小物体检测FFCA-YOLO)
本文提出了一种高效的检测器,成为特征增强、融合和上下文感知YOLO(FFCA-YOLO)(feature enhancement,fusion and context aware YOLO)。FE-YOLO:在YOLO的neck中使用可变形卷积进行高低特征图的特征融合,消除自上而下的连接对物体造成的寓意空白影响。本文(SCAM):SCAM使用全局平均池化(GAP)和全局最大池化(GMP)指导像素学习空间和通道之间的关系。特征增强模块(FEM)、特征融合模块(FFM)、空间上下文感知模块(SCAM)
2024-09-09 12:06:43
1496
原创 Infrared Small Target Detection with Scale and Location Sensitivity(具有规模和位置灵敏度的红外小目标探测功能)
方法大部分注重设计负责的模型结构来提取判别特征,IRSTD的损失函数未得到充分探索。1)根据目标的预测尺度和地面实况尺度来计算IoU损失的权重。早期的传统方法可以分为基于滤波的方法、基于局部对比度的方法、基于低秩的方法。例如对抗训练的损失、检测目标边缘的边缘损失和目标图和背景图之间的似然损失。2)位置敏感性:根据预测的目标中心点和地面实况中心点来设计位置惩罚。常用的IOU和Dice loss对目标的规模和位置缺乏敏感性。重点是通过更有效的loss但更简单的模型结构来提升检测性能。
2024-09-08 10:10:53
870
原创 Small Object Detection via Coarse-to-fine Proposal Generation and Imitation Learning
锚点:是一些预定义的边界框,它们在图像的不同位置和不同尺度上进行采样,以捕捉可能的目标,完善锚点的过程是对这些预定义的锚点进行调整和优化,使它们更准确地匹配图像中实际目标的大小和位置。1.我们建立了一个名为CRPN的从粗到细的建议生成通道,用于执行从锚点到建议的程序,其中基于区域的锚点挖掘策略和级联回归技术为小实例提供了高质量的建议。2.在高质量实例的监督下,引入了辅助特征模仿(FI)分支,以丰富使模型感到困惑的低质量实例的表征,并通过基于SCL的定制损失函数对这一新颖分支进行优化。
2024-08-28 22:16:35
2197
1
原创 Small Object Detection via Coarse-to-fine Proposal Generation and Imitation Learning
在每一个阶段,之前的区域建议作为输入,在特征图上进行进一步的回归和优化,使得每个阶段的区域建议越来越精确。锚点:是一些预定义的边界框,它们在图像的不同位置和不同尺度上进行采样,以捕捉可能的目标,完善锚点的过程是对这些预定义的锚点进行调整和优化,使它们更准确地匹配图像中实际目标的大小和位置。在被认为具有视觉真实性的达吾提的引导下,解析还原尺寸受限实例的特征。1.我们建立了一个名为CRPN的从粗到细的建议生成通道,用于执行从锚点到建议的程序,其中基于区域的锚点挖掘策略和级联回归技术为小实例提供了高质量的建议。
2024-08-26 22:14:48
1638
原创 小目标检测综述
聚焦检测方法:高分辨率图像中的小物体往往分布不均匀,一般的分割检测方案会在这些空斑块上消耗过多的计算量,导致推理过程效率低下。上下文建模方法:可以利用环境与物体之间的关系或物体之间的关系来对物体和场景的识别。噪声特征表示:小物体外观质量较差,因此学习具有判别力的表征是非常困难的。SCRDet:设计了一种面向对象的检测器,通过对像素注意力和通道注意力进行有监督的训练消除噪声干扰的同时突出小物体区域。面向样本的方法、规模感知方法、基于注意力的方法、特征模仿方法、上下文建模方法、聚焦检测方法。
2024-08-18 16:17:51
859
原创 Oriented RepPoints for Aerial Object Detection
空中目标识别,空中目标探测和识别技术的深入研究是为了将空中打击目标从复杂的背景环境中尽可能地剥离出来,通过知识学习,实现对目标的类型确认,进而完成对目标的威胁评估,为快速打击提供判定和决策依据。4.DRN提出了特征选择模块,以汇总来自不同内核尺寸、形状和方向的非轴对齐信息,并采用动态滤波器生成器来进行进一步的回归。物体检测中的样本分配方法是指在训练目标检测模型时,如何将训练图像中的候选区域分配给不同的类别以及政府样本的过程。1.在轴对齐的Rols上采用空间变换,并在定向边界框的监督下学习非轴对齐的标识。
2024-07-24 16:48:40
502
原创 5-4-2知识图谱推理-基于规则学习的知识图谱推理
.ΛBn表示规则的body部分,有n个原子(atom)组成,H表示规则的head部分,由一个原子组成,每个原子A可以表示为A=r(x,y)形式,r表示原子包含的关系,x,y表示变量。如果规则中的所有变量替换为具体的实体并保证每个实例化后的atom都存在图谱中,这样规则实例化后的结果成为规则的一个grounding。利用Embedding可以非常简便的计算关系的关系,也就是规则。基于思想:将连接两个实体的路径作为特征来预测其间可能存在的关系。规则与嵌入表示的迭代学习:IterE。可微规则学习:RuleE。
2024-07-24 09:54:52
638
原创 5-4-1知识图谱推理-基于嵌入学习的知识图谱推理
元关系学习:在只有少量样本的情况实现知识图谱推理-Few-shot Reasoning。wRAN:利用关系对抗网络提升长尾部分的关系推理和补全的效能。另外一种知识图谱嵌入模型:DistMult,线性变换嵌入模型。其他推理模型框架:强化学习-基于强化学习的知识图谱路径推理问答。BetaE:基于Beta嵌入的知识图谱多跳逻辑推理。知识图谱嵌入模型:TransE的问题。知识图谱嵌入模型:Analogy。知识图谱嵌入模型:ComplEx。知识图谱嵌入模型:ConvE。基于嵌入学习的知识图谱推理。
2024-07-23 14:11:54
662
原创 5-3-2知识图谱推理-基于规则的推理
由原子构成,其中H是头部原子, B1,B2...Bm是体部原子,如has_child(X,Y):-has_son(X,Y)也可以写成(Student name:x)=>ADD(person name :x)如果有一个学生名为x那么向事实集中加入一个事实,表示有一个名为x的人。.cn):- 没有体部且没有变量的规则,如:has_child(Alice,Bob):-原子(Atom):p(t1,t2,...tn),其中p是谓词,n是目数,ti是项(变量或者常量),如has_child(X,Y)
2024-07-22 11:10:13
765
原创 5-3知识图谱推理-基于Ontology的推理
提供了更多的描述类和属性的表达构建。全称量词->∀R.C->{x|∀y.∈R->y∈C}->∀ has_child.Doctor。包含关系推理是定义在Tbox上面的推理,一般基于Tbox中的Axiom推断两个概念之间是否存在包含关系。存在量词→∃R.C→{x|∃y.∈R∧y∈C}→∃has_child.Male。Tableaux算法的基本思想是通过一系列规则构建Abox,以检测知识库的可满足性。三元组:subject(主)->predicate(谓)->object(宾)
2024-07-18 11:55:27
808
原创 5-2知识图谱推理-知识图谱推理简介
Tbox语言:定义引入概念以及关系的名称;Abox语言:概念新言-表示一个对象是否属于某个概念;关系新言-表示两个对象是否满足特定关系;向量表示(Implicit Representation):易于表示隐式知识,缺乏可解释性。基于图神经网络的推理模型RGCN;符号表示(Explicit Representation):局限于显示表示,可解释性强。基于向量的规则学习,如IterE;基于图结构,如PRA系列;演绎推理:更多依赖显示的知识描述和知识推导。
2024-07-17 14:26:21
427
原创 5-1知识图谱推理-什么是推理
是一种Bottom-up logic:通过观察客观事实进而总结归纳抽象知识的推理过程。箱子里有20个球,抽四个,三个白,一个黑,则归纳概括出15个白,5个黑。人口P的比例具有A属性,x是P的成员,因此推出x也具有该比例的A属性。从已知事实(Konwn Facts)到未知事实(New Facts)的过程。如:天鹅都是白色的得出天鹅都是白色的(归纳推理不一定都是正确的=>近似正确)符号表示出所有的本体描述以及所有事实性描述,可以用机器模拟人脑来完成推理。将抽象的知识与观察现象相结合得到可能原因的推理过程。
2024-07-16 16:33:11
563
原创 4-6知识抽取技术前沿
引入了混合注意力机制:Instance-Level Attention;零样本学习(ZSL):基于可见标注数据集及可见标签集合,学习并预测不可见数据集结果。方法:转换问题设定;学习输入特征空间到类别描述的语义空间的映射。终身知识抽取(存在知识遗忘问题)基于实体关系原型网络的少样本知识抽取。基本范式:N-way-K-shot。基于表示对齐的终身关系抽取。
2024-07-15 10:41:25
208
原创 4-5知识抽取-事件识别与抽取
知识图谱领域事件的定义:事件是发生在某个特定时间点或时间段、某个特定的地域范围内,由一个或者多个角色参与的一个或多个动作组成的事情或者状态的改变。模版的产生完全基于人工标注语料,学习效果高度依赖与人工标注质量。b.事件元素周围语句中包含了事件元素在事件中的角色描述。a.事件元素首次提及之处即可确定该元素与事件间的关系。2.分类要素的角色:参与事件的实体在事件所扮演的角色。形态时态没有明显的变化。1.识别触发词:体现发生事件的核心词语。1.识别事件要素:参与事件的实体。2.分类事件类型:比如离职事件。
2024-07-15 10:40:43
437
原创 4-4知识抽取-概念抽取
实体与概念,概念与概念之间的关系术语自然语言处理中的语言上下位关系。isA关系、subclassOf关系两种。概念可以更好的理解自然语言;概念可以用于解释现象。Hearst Patterns:基于固定的句型可以抽取isA关系。概念抽取并构建成无环图的过程又被称为Taxonomy。通常称A是 B的下位词,B是A的上位词。实体概念通常基于词汇进行表达。从半结构化数据中获取上下文关系。从大量文本中获取概念知识。
2024-07-15 10:39:46
229
原创 4-3-2知识抽取-关系抽取与属性补全(二)
利用句子的依赖解析树构成图卷积中的邻接矩阵,以句子中每个单词为节点做图卷积操作,如此就可以抽取句子信息,再经过池化层和全连接层即可做关系抽取的任务。远程监督的基本假设:两个实体如果在知识库中存在某种关系,则包含该两个实体的非结构化句子均可能表示出这种关系。图神经网络在图像领域的成功应用证明了以节点为中心的局部信息聚合同样可以有效的提取图像信息。抽取输入文本中的字词,组成预测的属性值,预测出的属性值一定要在输入侧出现过。属性补全:对实体拥有的属性及属性值进行补全。半监督学习:基于远程监督的关系抽取。
2024-07-15 10:39:06
354
原创 4-3-1知识抽取-关系抽取与属性补全(一)
扩展:多元关系抽取;实体和关系的联合抽取;基于对抗学习、强化学习、元学习;基于预训练模型的抽取方法。预先定义好关系的类别->人工标注一些数据->设计特征表示->选择一个分类方法(SVM、nn)->评估结果。At-least-one Hypothesis:把关系抽取定义为一个分类问题。Bootstrap;从文本中抽取出两个或多个实体之间的语义关系。领域:封闭域关系抽取;基于递归神经网络的关系模型。基于CNN的关系抽取。基于触发词匹配的关系抽取。基于BILSTM关系抽取。基于依存句法的关系匹配。
2024-07-15 10:38:39
268
原创 4-2知识抽取-实体识别与分类(二)
条件随机场进一步假设马尔科夫随机场只有X和Y两种变量,X一般是给定的,而Y一般是在给定X的条件下输出的。马尔科夫随机场假设机场中某个位置的赋值仅与它相邻位置的赋值有关,和不相邻位置的赋值无关。Pointer Network(指针网络)随机场包含多个位置,每个位置按某种分布随机赋予一个值,其全体就叫做随机场。解决给定训练好的模型,给定一句话,预测每个词对应的实体标签。模型参数的估计与学习-鲍姆韦尔奇算法-EM算法。常见序列预测模型:CRF条件随机场。CRF是无向图模型。
2024-07-15 10:38:04
136
原创 4-2知识抽取-实体识别与分类(一)
其中,特征有:词本身特征:边界特征、词性、依存关系等;前后缀特征:姓氏、地名;字本身的特征:是否是数字、是否是字符。缺点:需要大量语言学知识;需要谨慎处理规则之间的冲突问题;构建规则的过程费时费力,可移植性不好。确定标签体系->选择模型->定义特征->模型训练。基于模版和规则:将文本与规则进行匹配来识别出命名实体。优点:准确,有些实体识别智能依靠规则抽取。从文本中识别实体边界及其类型。
2024-07-15 10:37:08
383
原创 4-1重新理解知识工程与知识获取
知识工程是以知识为处理对象,研究知识系统的知识表示、处理和应用的方法和开发工具的学科。概念抽取、实体抽取、关系抽取、事件抽取、规则抽取。获取全体人类的知识,靠人工编码是无法完成的。从语料中发现多个单词组成的相关术语。如何从句子中抽取一组实体之间的关系。知识图谱是新一代的知识工程,知识图谱≠专家系统。怎样从文本中抽取事件。智能的本质是符号的操作和运算。人工智能源于数理逻辑。感知层面->认知层面。知识图谱工程:简化的知识工程。
2024-07-15 10:36:35
258
原创 知识图谱课程学习-3-3原生图数据库实现原理浅析
原生图是指采用免索引邻接(Index-free adjacency)构建的图数据库引擎,如AllgroGraph,Neo4j等。这种微索引比起全局索引在处理图遍历查询时非常廉价,其查询复杂度与数据集整体大小无关,仅正比与相邻子图的大小。采用免索引邻接的数据库为每一个节点维护了一组指向相邻节点的引用,引用本质上可以看做相邻节点的微索引。
2024-07-03 11:07:39
434
原创 知识图谱课程学习-3-2基于原生图数据库的知识图谱
互联网的开放世界和假设要求数据模型满足高动态和去中心化的扩增数据的能力。关系模型对于表结构的范式要求限制了Schema层的动态性。自然表达:图是非常自然的描述事物关系的方式,更加接近于人脑对客观事物的记忆方式。对于包含大量离群数据的场景,关系模型将造成大量表连接、稀疏行和非空处理。关系数据库的局限性:知识图谱需要更加丰富的关系语义表达和关联推理能力。Neo4J:属性图是图数据库 Neo4J实现的图结构表示模型。复杂的关联表达:图模型易于表达复杂关联逻辑的查询。原生图数据库:利用图的结构特征建立索引。
2024-07-03 11:07:08
487
原创 知识图谱课程学习-3-1基于关系型数据库的知识图谱存储
性能最好的存储方式是基于全索引结构的存储,典型的包括RDF-3X,Hexastore等。图数据库存储并非必须,例如Wikidata项目后端是Mysql实现的。知识图谱的存储需要综合考虑知识结构、图的特点、索引和查询优化等问题。典型的知识图谱存储引擎分为基于关系数据库的存储和基于原生图的存储。二元表也称为垂直划分表。基于关系数据库实现的。Property Tables:属性表存储。最简单的存储:Triple Store。基于传统关系数据库实现。图上的查询语言:SPARQL。知识图谱的各种存储方式。
2024-07-03 11:06:37
371
原创 知识图谱课程学习-2-4知识图谱的向量表示方法
每一个维度都是有数值的,维度远远低于词库大小,通过语料统计学习出来的。称为低维稠密的向量表示,也叫词的嵌入表示。文档向量表示,词出现的次数作为数值,词典大小为文档的大小。缺点:无法表示词的语义。测试三元组(h,r,t):尾实体预测(h,r,?CBow:wordtoword的模型,前几个词和后几个词预测中间的词。通过统计词上下文语义规律,并通过词的上下文计算词的分布式规律。每个词的大小就是词典的大小。词是符号化的,词的语义由它被使用的上下文确定。Skip-gram:中间词预测前后的几个词。
2024-07-03 11:05:57
259
原创 知识图谱课程学习-2-3知识图谱的符号表示方法
关系也可以具有属性,边属性,可以通过在关系上增加属性给图算法提供有关边的元信息,如创建时间等。属性图是由顶点(Vertex)、边(Edge)、标签(Label),关系类型还有属性(Property)组成的有向图。在属性图中节点和关系是最重要的实体,节点上包含属性,属性可以以任何键值形式存在。属性图的缺点是缺乏工业标准规范的支持,由于不关注深层次的语义表达,不支持逻辑推理。属性图是图数据库Neo4J实现的图结构表示模型,在工业界有广泛的应用。属性图的优点是表达方式灵活,如支持为边添加属性。
2024-07-03 11:05:24
442
原创 知识图谱课程学习-2-2人工智能历史发展长河中的知识表示
框架理论的基本思想:认为人们对现实世界中事物的认识都是以一种类似于框架的机构存储在记忆中,当面临一个新事物,就从记忆中找出一个合适的框架,并根据实际情况对其细节加以修改、补充,从而形成对当前事物的认识。描述逻辑是跟知识图谱最接近的表示方法,描述逻辑是一阶谓词逻辑的可判定子集,主要用于描述本体概念和属性,对于本体知识库的构建提供了便捷的表达形式。原子Atoms:P(t1,t2...tn),P是谓词,ti是项(变量或者常量),例如has_child(X,Y)优点:接近自然语言,容易被接受,且易于表示精确知识;
2024-07-03 11:04:57
388
原创 知识图谱课程学习-2-1什么是知识表示
基于离散符号的知识表示:符号表示的缺点:显示知识(不易于刻画隐式知识)、强逻辑约束(依赖于知识表述的精确性)、易于解释、推理不易扩展。基于连续向量的知识表示:用参数化的向量来表示实体与实体间的关系。易于捕获隐式知识,弱逻辑约束、不易解释、对接神经网络。KR不是数据格式、不等同于数据结构、也不是编程语言,对于人工智能而言,数据与知识的区别在于KR支持推理。知识表示:简单而言,知识表示(KR)就是用易于计算机处理的方式来描述人脑的知识的方法。传统的知识表示方法以符号为主。知识的向量表示:促进多种模态的融合。
2024-07-03 11:04:08
312
原创 知识图谱课程学习-1-4知识图谱的技术内涵
知识图谱抽取:概念(Concept)、实体(Entities)、关系(Relation)、事实(Facts)、事件(Events)、规则(Rules)(优点:具有可解释性;问句->语义解析->语义表示(基于符号的表示方法or基于分布式的表示方法)->语义匹配、查询、推理->知识图谱。知识图谱最基本的组成单元是三元组:subject、predicate、object(主、谓、宾)基于图结构或表示学习的方法:PRA、AMIE、TransE、Analogy、表示、存储、抽取、融合、推理、问答、分析、其他。
2024-07-03 10:55:48
465
原创 知识图谱课程学习-1-3知识图谱的价值
辅助视觉理解:知识图谱将视觉识别出的对象链接到外源的知识图谱可以辅助图像语义关系抽取和视觉语义的深入理解。语义搜索、智能问答、推荐系统、辅助大数据分析、辅助视觉理解、语义辅助设备互联。阿里新零售知识图谱、中医药语义网络、大规模故障诊断知识图谱、金融知识图谱。
2024-07-03 10:54:58
291
原创 知识图谱课程学习-1-2知识图谱起源
语义网络(1960)→本体论(1980)→Web(1989)→从超文本链接到语义链接(1998)→链接数据Linked Data(2006)->知识图谱(2012)WordNet:最著名的词典知识库,由普林斯顿大学认知科学实验室研发。Freebase(早期的语义网项目):被谷歌收购。YAGO:德国马普研究所研制的链接数据库。BabelNet:多语言词典知识库。DBpedia:早期的语义网项目。OpenKG.CN:中文知识图谱。WIKIDATA:维基基金会。Schema.org:谷歌。
2024-07-03 10:53:55
260
原创 知识图谱课程学习-1-1知识图谱概论
利用图结构建模、识别和推断事物之间的复杂关联关系和沉淀领域知识,是实现认知智能的重要基石。总结:语言与知识的向量化表示以及利用神经网络实现语言与知识的处理是重要的人工智能技术发展趋势。人类的自然语言,绘画,音乐,数学语言,物理模型,化学公式都是知识的表示形式。抽取技术:从文本中抽取实体、关系、复杂的逻辑结构等。人类心智的最本质特征是获取、表示和处理知识的能力。知识图谱:为每个实体和关系学习一个向量表示。文本预训练:BERT文本知识隐藏在向量中。符号主义:认知,语言,知识->知识图谱。
2024-07-03 10:52:50
270
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人