自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(43)
  • 收藏
  • 关注

原创 A Survey on Multimodal Large Language Models

(多模态幻觉问题)是指当不同感官的信息(如视觉、听觉、触觉等)相互作用时,可能导致个体产生不准确或扭曲的感知。例如,在某些情况下,看到某种物体的同时听到与之不相关的声音,可能会影响我们对该物体的理解或判断。代表“多模态内联学习”,旨在结合多种感知模式(如文本、图像、音频等)来提升模型的学习能力和性能。仅编码器模型,也称为自动编码模型,是使用掩码语言模型进行预训练的,在此过程中,输入序列中的某些。是“基于大语言模型的视觉推理”,将大型语言模型与视觉数据结合,帮助进行视觉推理。此外,还提到了多模态幻觉问题(

2025-02-19 15:44:12 956

原创 RWKV: Reinventing RNNs for the Transformer Era

可以利用 RWKV 的状态(或上下文)来提高序列数据的可解释性、可预测性和安全性。RWKV 架构并不完美,可以通过修改公式或实现更大的内部状态等方面进行改进。更大的状态可以增强模型对先前上下文的记忆,并提高在各种任务上的性能。RWKV 所使用的机制可以应用于编码器-解码器架构,潜在地替代交叉注意力机制。状态的方式来增加模型的表达能力(expressivity),同时保持效率。,从而在训练过程中并行计算,并在推理过程中保持恒定的计算和内存复杂度。W: 权重,表示位置权重衰减向量,是模型中的一个可训练参数。

2025-02-17 17:16:57 397

原创 Image as a Foreign Language: BEIT Pretraining forAll Vision and Vision-Language Tasks

只有后面Feed Forward Network不一样,根据不同的Modality训练不同的Vision、Language、Vision Language三个不同的Expert,然后通过调整不同的Input Modality去选择模型分支。模型用了Multi-Way Transformer,前面的自注意力全都是。可能遮住了图像,可能是遮住了文本,模型训练学习去恢复它就可以。Mask Data Modeling目标函数。

2025-02-16 22:23:13 166

原创 BEIT: BERT Pre-Training of Image Transformers(ICLR 2022)

提出自监督BEiT的self-attention机制可以学习区分semantic regions(语义区域)和object boundaries(对象边界),即使是无标注数据。预训练机制,以明确鼓励模型生成全局图像表示,缩小补丁级预训练和图像级表示聚合之间的差距。预训练BEiT,并应用到下游任务图像分类和语义分割中(下游任务数据集中微调BEiT)。得到图像的视觉标志之后,我们使用这个视觉标志作为预训练模型的训练目标。这么做的目的是将图像映射到一个离散的语义空间,然后模型通过学习每个掩码。

2025-02-16 22:20:18 430

原创 VLMO: Unified Vision-Language Pre-Training withMixture-of-Modality-Experts

注:self-attention层是权重共享,也就是不论图像、文本还是图像文本信号,输入任何的token sequence,self-attention的model weights都是一样的,这个也是transformer架构的优势,目前有很多工作证明,同样的self-attention weights可以用来做不同的图像文本音频视频任务,不需要重新去训练自注意力参数。层做交互,然后每个模态走自己的专家模型,这在既可以进行深层交互,也可以在推理时支持单模态的前向过程。的预训练方法的实验结果。

2025-02-13 16:00:04 560

原创 BLIP: Bootstrapping Language-Image Pre-training forUnified Vision-Language Understanding and Genera

为了去除 VLP 文本监督信号的杂音,Salesforce 的研究者们在预训练完成的 MED 基础上引入了 CapFilt,它包括 Captioner 和 Filter 两个模块:Captioner 用于生成文本标注,Filter 用于去除文本噪声。BLIP 是一个全新的 VLP 框架,统一了视觉语言任务的理解与生成功能,并且通过嵌入 Captioner 和 Filter 去除网络资源中的文本噪声,提高了模型在下游视觉语言任务上的性能。但在本文中表明,噪声网络文本对于视觉语言学习来说是次优的。

2025-02-12 14:10:26 868

原创 Align before Fuse: Vision and LanguageRepresentation Learning with Momentum Distillation

Image Text Matching,属于一个二分类任务,就是给定一个图片,给定一个文本,图像文本通过ALBEF的模型之后输出一个特征,在这个特征之后加一个分类头,也就是一个FC层,然后去判断I和T是不是一个对,这个loss虽然很合理,但是实际操作的时候发现这个loss太简单,所以这个分类任务,很快它的准确度就提升得很高无法进一步优化。:生成的伪标签被用作训练数据中的软标签,提供额外的监督信号。)是一种技术,通过将一个复杂的大模型(教师模型)的知识迁移到一个较小的模型(学生模型),来提升学生模型的性能。

2025-02-10 14:58:03 605

原创 ViLT: Vision-and-Language TransformerWithout Convolution or Region Supervision

ViLT是针对视觉-语言任务(如图像字幕生成、视觉问答等)的一种模型。传统的视觉-语言模型通常使用复杂的视觉特征提取网络(如卷积神经网络)和语言处理网络(如Transformer),然后将这两部分的特征融合。ViLT的设计目标是简化这个过程,提高效率。1.1 抽取视觉特征的三种方式 现有的VLP模型(Vision-and-Language Pre-training,视觉文本多模态模型)抽取文本特征基本上都使用 pre-trained BERT的 tokenizer来得到text embeddi

2025-02-09 17:42:27 754

原创 Swin Transformer

在Swin Transformer中使用了Windows Multi-Head Self-Attention(W-MSA)的概念,例如在下图的4倍下采样和8倍下采样中,将特征图划分成了多个不相交的区域(Window),并且Multi-Head Self-Attention只在每个窗口(Window)内进行。论文的实验部分针对不同的任务,不同规模的模型,不同编码模式进行了详细的讨论,在不同的任务上都取得了不错的效果。模型在处理视觉数据时的效率和效果。在不同的视觉任务上取得了。领域的缺点,具有替换掉。

2025-02-09 17:14:59 393

原创 IPT:Pre-Trained Image Processing Transformer[CVPR 2021]

由于ImageNet基准中的图像具有高度多样性,其中包含来自1000个不同类别的100多万张自然图像。这些图像具有丰富的纹理和颜色信息。可以微调后应用于超分辨率、图像去噪、图像去雨等,整个网络由多对对应于不同任务的头部和尾部以及单个共享体组成。本文提出了一个基于transformer的预训练通用模型,针对。、去噪任务在不同噪声水平的原始图像中加入高斯噪声生成带噪图像。、超分辨率任务通常采用双三次下采样生成低分辨率图像,作者使用著名的ImageNet作为基线数据集,,并针对不同的任务使用各种降级模型。

2025-02-08 11:35:38 289

原创 Multimodal Deep Learning Vision Transfomer

上面通过Transformer Encoder后输出的shape和输入的shape是保持不变的,以ViT-B/16为例,输入的是[197, 768]输出的还是[197, 768]。在ViT中,LN是在每个Transformer block的输入处应用的,它可以更好地适应序列数据的统计特性,例如序列长度的变化和特征之间的相关性。- 在ViT中,LN通过调整每个特征的缩放和偏移,有助于提高模型的泛化能力和训练效果,特别是在面对不同尺度的输入数据时更为有效。)是一种用于处理视觉数据的深度学习模型,它是基于。

2025-02-08 11:30:40 560

原创 Multimodal Deep Learning 深度残差网络ResNets

原因:类似于上述的原因,假如都是大于1的时候,那么浅层的网络的梯度过大,更新的参数变量也过大,所以无论是梯度消失还是爆炸都是训练过程会十分曲折的,都应该尽可能避免。,虽然解决了梯度问题,但是深度加深了,却带来了另外的问题,就是网络性能的退化现象,可以简单的理解为,随着网络层数的增加,网络的效果反而下降了。的形式,而这样如果都是小于1的,这样的话,浅层网络参数值的更新就会变得很慢,这就导致了深层网络的学习就等价于了只有后几层的浅层网络的学习了。”,极大的消除了深度过大的神经网络训练困难问题。

2025-02-07 18:17:01 749

原创 Multimodal Deep Learning 注意力机制&Transfomer

它的主要目的是让模型能够在处理输入数据时,动态地分配不同部分的注意力或权重,以便更好地捕捉输入数据中重要的部分。在某些情况下,注意力输出也会作为输入提供给解码器(与通常的解码器输入一起)。1.输入和输出的关系:在序列到序列的任务中,输入序列通过编码器(Encoder)进行编码,然后解码器(Decoder)使用注意力机制来 获取编码器输出的不同部分的信息,以生成输出序列。深度学习中的注意力机制和人类视觉的注意力机制类似,就是在更多信息中把注意力集中放在重要的点上,选出关键信息,而忽略其他不重要的信息。

2025-02-07 17:38:10 597

原创 数字图像处理实验报告 实验一:图像处理基本操作

1、熟悉并掌握MATLAB工具的使用;2、实现图像的读取、显示、存储、平移、镜像、放大、缩小及旋转操作;3、掌握常用的插值方法,并了解其优缺点。

2025-01-05 16:31:27 1554

原创 数字图像处理实验报告 实验四:图像分割

OTSU(大津法或最大类间方差法)使用的是聚类的思想,把图像的灰度数按灰度级分成2个部分,使得两个部分之间的灰度值差异最大,每个部分之间的灰度差异最小,通过方差的计算来寻找一个合适的灰度级别来划分。④Otsu算法:也叫最大类间差法,取一个最优阈值把原图像分为前景色(A部分)与背景色(B部分),两部分的类间方差越大,说明两部分差别越大,便能有效的分割图像。⑤最大熵阈值分割法:计算所有分割阈值下的图像总熵,找到最大的熵,将最大熵对应的分割阈值作为最终的阈值,图像中灰度大于此阈值的像素作为前景,否则作为背景。

2025-01-05 16:14:20 899

原创 多模态大语言模型综述

本文综述了多模态大型语言模型(MLLMs)的最新进展,探讨了其基本架构、训练策略、评估方法以及面临的挑战和未来研究方向。MLLMs结合了大型语言模型(LLMs)和大型视觉模型(LVMs)的优势,通过模态编码器、预训练LLM和模态接口实现多模态信息的接收、推理和输出。文章强调了MLLMs在细粒度支持、模态支持、语言支持和特定场景应用方面的扩展。同时,指出了MLLMs在处理长上下文信息、遵循复杂指令、技术改进以及开发具身代理方面的挑战,并强调了模型安全性的重要性。最后,文章总结了MLLMs的研究进展,并对未来的

2025-01-05 15:56:33 1832

原创 基于深度学习的智能水果分类系统设计

4、模型测试和模型训练基本一致,只是在模型加载的部分,直接调用保存好的模型即可,不在进行模型参数的调整,以CNN模型的测试为例,首先加载数据,然后加载模型,最后使用model.evaluate方法对模型进行测试。通过分析水果的外观特征,如颜色、形状、表面纹理等,系统可以评估水果的成熟度和新鲜度,帮助用户选购优质的水果。系统识别过程,通过UI界面的按钮上传图片进行识别,对图片进行统一的预处理操作, 生成可供系统识别的矩阵信息,然后调用已生成的模型进行识别并显示结果。

2024-06-29 22:45:33 1440 1

原创 数字图像处理实验报告 实验二:熟悉基于单像素空域图像增强方法

其中,c是一个常数,f是浮点数。对数变换可以将图像的低灰度值部分扩展,显示出低灰度部分更多的细节,将其高灰度值部分压缩,减少高灰度值部分的细节,从而达到图像偏暗的图像增强的目的,其逆变换可以强调高灰度。图像的对数变换主要的作用是压缩动态范围,原因是对数曲线在像素值较低的区域斜率大,在像素值较高的区域斜率较小,所以图像经过对数变换后,较暗区域的对比度将有所提升,所以就可以增强图像的暗部细节。当 gamma<1 的时候,低灰度区域的动态值变大,进而图像对比度增强,高灰度值区域,动态值变小,图像整体变亮。

2024-06-28 17:06:00 1105

原创 数字图像处理实验报告 实验五:形态学图像处理

之后,根据图像边界的周长,判断哪些圆是互相接触的,哪些圆没有互相接触。根据图像的边界,可以根据图像边界的周长判断哪些圆是独立的,哪些圆是与另外的圆互相连通的。(7)利用形态学算法提取出只包含边界接触的圆时,先提取出这些圆的边界信息,利用边界的周长信息判断哪些连通域属于不同的圆连通在了一起,并认为周长大于等于200的连通域属于不同的圆连通在了一起。形态学的闭操作就是用结构元素对原图像先进行膨胀操作,后进行腐蚀操作,使得轮廓变得光华,但与开操作相反,用于消除狭窄的间断和鸿沟,消除小的空洞,填补轮廓线中的断裂。

2024-06-24 18:07:58 1133

原创 数字图像处理实验报告 实验三:空域频域图像去噪与锐化

(8)利用拉普拉斯算子,对图1的输出图像进行锐化, ,使用掩膜 ,得到锐化后的新图,可以明显看出人物的轮廓像是被描粗了一遍,比平滑后的图像更为明显,人物与原图效果较为接近。2、了解了图像空域和频域图像增强方法,理解并掌握常用平滑和锐化方法,了解了空域和频域的滤波方法实现平滑处理和锐化处理,对理解并掌握常用平滑和锐化方法有了更深的认识。均值滤波是线性滤波器。在频域空间中也可以设置滤波器,常用的平滑滤波器是低通滤波器,低通滤波器保留了低频率的成分,丢失了高频率的成分,使得图像保留了颜色等特征而丢失了部分细节。

2024-06-23 15:20:35 1201

原创 大数据与云计算

最后,我们展望了大数据和云计算的未来发展趋势,我们预测随着5G、物联网、人工智能等新技术的发展,大数据和云计算将进一步深入到各个领域,并带来更多的机遇和挑战。(4)弹性计算:弹性计算是云计算的核心特性之一,它指的是根据应用需求的变化,动态调整计算资源的能力。云计算技术具备低成本、高灵活性、高效能等多种优势,随着技术的不断成熟发展,其逐步实现了存储、信息、计算、网络的服务虚拟化,可以实现多种技术彼此融合的优化组合,然后在此基础上满足不同用户的需求,信息服务的透明度也得到了显著性的提升[4]。

2024-05-06 10:05:49 1123 1

原创 数字图像处理课程设计:基于MATLAB的车牌识别系统设计与实现

本文主要解决了以下问题:1、在背景的图像中如何定位牌照;2、将定位的牌照区域中的字符分割;3、对分割下来的牌照字符提取具有分类能力的特征,并对汉字、字母及数字均进行识别。在车辆牌照字符识别系统的研究领域,近几年出现了许多切实可行的识别技术和方法,从这些新技术和方法中可以看到:单一的预处理和识别技术都无法达到理想的结果,多种方法的有机结合才能使系统有效识别能力提高。在本系统的设计时,也汲取了以上一些算法的思想,结合实际,反复比较,综合分析。根据车牌特点,一般采用的车牌定位算法有:1、边缘检测定位算法;

2024-05-06 09:56:14 8977 21

原创 学生在校管理大数据平台

本系统主要是应用于学生各类信息的管理,总体任务是实现学生信息关系的系统化、规范化、自动化,其要任务是统计学生各类信息进行日常管理,如查询、修改、增加、删除、以及学生选课、成绩的查询等功能设计的管理系统。包括学生姓名、性别、出生日期、家庭住址、本人电话、本人QQ、家长电话、家长姓名、身份证号码、毕业学校、是否为应届生、所属班级、学号、进校时间、离校时间、所学专业、记录时间、最后一次更新时间、状态。包括学号、姓名、住宿费、学费、班费、水卡费、军训服装费、其他费用、缴费状态。学生子系统:实现学生账号管理、分配。

2024-04-30 09:08:54 316 3

原创 数据挖掘课程实验 4:k-Means 算法

通过本次数据挖掘的K-means聚类算法实验,了解了k-means算法的实现过程及基本方法。k-means算法的优点为原理易懂、易于实现,当簇间的区别较明显时,聚类效果较好。缺点为当样本集规模大时,收敛速度会变慢;对孤立点数据敏感,少量噪声就会对平均值造成较大影响;k的取值十分关键,对不同数据集,k选择没有参考性,需要大量实验。

2024-04-21 09:44:07 1087 2

原创 数据挖掘课程实验3: Apriori算法

本次实验我使用Python掌握并实现了Apriori关联关系挖掘算法, 这是一种非常简单且符合直觉的数据挖掘算法, 能够非常客观准确的找出数据中项目之间关系紧密的那部分数据, 对其的实现难度并不高但需要细心, 在生成K + 1项集时要注意特判生产出来的项集大小不等于K + 1的特殊情况, 并将其continue掉,。

2024-04-18 10:13:53 1000

原创 数据挖掘课程实验 2:决策树算法实验

通过本次数据挖掘的决策树分类实验,了解了决策树算法的实现过程及基本方法。决策树和其他模型相比有以下优点:生成的规则可理解;效率高,决策树只需要一次构建,反复使用,每一次预测的最大计算次数不超过决策树的深度;决策树算法的时间复杂度较小,为用于训练决策树的数据点的对数。决策树的目标函数是最小化损失函数,损失函数是正则化最大似然函数。分类树采用叶子节点里概率最大的类别作为当前节点的预测类别。回归树输出采用的是用最终叶子的均值或者中位数来预测输出结果。附:源代码#加载数据。

2024-04-17 08:31:33 1376 1

原创 数据挖掘课程实验 1:数据预处理

通过本次数据挖掘的预处理实验,了解了数据预处理的方法和主要步骤,依靠在教材的基础上查询网上的资料,学习了相关数据预处理的算法过程,并完成了对数据预处理方法的具体案例实现,基本掌握了数据预处理的主要过程,为未来的数据挖掘提供准备过程。附:源代码(1)缺失值处理#查看缺失值2、删除缺失值dropna# 删除缺失值 - dropna3、填充/替换缺失数据 - fillna、replace#用0来填补缺失值#用缺失值之前/之后的数填充# method参数:# padffill → 用之前的数据填充。

2024-04-07 12:02:18 3671

原创 BP算法训练单隐层前馈神经网络

BP神经网络的一般结构如图2.1所示。人工神经网络(Artificial Neural Network,ANN)简称神经网络(NN),是基于生物学中神经网络的基本原理,在理解和抽象了人脑结构和外界刺激响应机制后,以网络拓扑知识为理论基础,模拟人脑的神经系统对复杂信息的处理机制的一种数学模型。通常神经网络的学习和训练需要一组输入数据和输出数据对,选择网络模型和传递、训练函数后,神经网络计算得到输出结果,根据实际输出和期望输出之间的误差进行权值的修正,在网络进行判断的时候就只有输入数据而没有预期的输出结果。

2024-02-24 20:20:22 982

原创 粒子群优化算法求解TSP问题

从上述结果可知,针对14个城市的TSP问题,粒子群优化算法求解得出的最短路径值为42.0138。粒子群算法是基于概率的随机自搜索算法,同遗传算法一样都是不稳定的,每次的搜索结果都不尽相同。需要不断修改粒子群大小与演化次数来获取最优值。但是,每次运行的结果不会相差很大,最短距离基本都在42-45之间,上面仅给出了四次结果。粒子群算法在计算最优解会出现陷入局部最优的情况,但是它的运行效率高,在实际的应用中有很好的效果。

2024-02-22 19:10:22 4180 3

原创 编译技术课程设计

在此次编译技术的课程设计中,实现了一个小型的编译程序,对输入的高级语言源程序进行词法分析、语法分析和语义分析生成四元式程序。由于时间原因没能去思考完选做部分的汇编语言的翻译程序。在课设中,通过阅读实验指导书,以及上网查找相关资料,我了解了关于如何将一个高级语言程序翻译成四元式输出。这其中贯穿了编译程序的总体结构,通过源程序的输入,对其进行词法分析得出该程序的二元式,然后在此基础上进行语法分析,采取LR分析法,这是一种“移进—归约”的自底向上语法分析方法,选取SLR(1)分析表进行分析;

2024-02-21 10:29:44 1684 3

原创 基于 BP 神经网络的分类实验

掌握 BP 神经网络的结构和运行机制,设计实现 BP 神经网络实现分类任务。

2024-02-20 10:10:59 2228

原创 A*算法求解八数码问题实验

熟悉和掌握启发式搜索的定义、估价函数和算法过程,并利用A*算法求解N数码难题,理解求解流程和搜索顺序。

2024-02-18 07:57:42 2800 1

原创 Python数据分析实战-链家北京二手房价分析

1、查看北京二手居民住房的分布价格情况,Part 1- 数据读取和预处理;2、理解变量、数据选取、重复值缺失值处理,Part 2 - 北京市房源分布;3、数量、单价、总价,Part 3 - 各城区房源分布,Part 4 - 各城区房价分布;4、单价分布、总价分布、高价Top15小区、低价Top15小区,Part 5 - 各城区房源面积分布;5、全市平均面积分布、各城区平均面积分布、各城区总面积分布,Part 6 - 房价与房源特性的关系;6、房价与户型、楼层、朝向、建筑年代的关系。

2024-02-17 10:10:51 1505 4

原创 大数据算法之遗传算法

利用遗传算法求解最短路径问题,例如,一个商品推销员要去若干个城市推销商品,该推销员从一个城市出发,需要经过所有城市后,回到出发地。应如何选择行进路线,以使总的行程最短。

2024-02-02 19:37:53 754

原创 操作系统实验四 驱动调度

在本次实验中,模拟了在磁盘调度过程中,有若干个要求访问磁盘的输入输出请求等待处理,系统采用电梯调度算法,尽可能按最佳次序执行要求访问磁盘的诸输入输出请求。因而,程序的结构可参考图4-1。在实际的系统中必须把等待访问磁盘的进程排入等待列队,由于本实验模拟驱动调度,为简单起见,在实验中可免去队列管理部分,故设计程序时可不考虑“进程排入等待队列”的工作。(3)“驱动调度”进程的功能是查“请求I/O”表,当有等待访问磁盘的进程时,按电梯调度算法从中选择一个等待访问者,按该进程指定的磁盘物理地址启动磁盘为其服务。

2024-01-31 21:58:00 1192 1

原创 操作系统实验三 虚拟存储器

通过本次关于模拟分页式存储管理中硬件的地址转换和缺页中断,以及选择页面调度算法处理缺页中断的实验,我了解并掌握了在分页式存储管理系统中的通过页号以及存储标志查找其在页表中的绝对地址的过程,以及页面中发生缺页中断时,如何调用置换算法来页面中存储的内容来避免中断。当访问的页在主存时,则形成绝对地址,但不去模拟指令的执行,而用输出转换后的地址来代替一条指令的执行。主存中的页面数M为4;其中,标志----用来表示对应页是否已经装入主存,标志位=1,则表示该页已经在主存,标志位=0,则表示该页尚未装入主存。

2024-01-30 18:52:21 1517 2

原创 操作系统实验二 同步机构

模拟实现用同步机构避免并发进程执行时可能出现的与时间有关的错误。进程是程序在一个数据集合上运行的过程,进程是并发执行的,也即系统中的多个进程轮流地占用处理器运行。我们把如干个进程都能进行访问和修改地那些变量成为公共变量。由于进程是并发执行的,所以,如果对进程访问公共变量不加限制,那么就会产生“与时间有关”的错误,即进程执行后,所得到的结果与访问公共变量的时间有关。为了防止这类错误,系统必须要用同步机构来控制进程对公共变量的访问。一般说,同步机构是由若干条原语——同步原语——所组成。

2024-01-29 13:17:47 1968

原创 操作系统实验一 处理器调度

本实验目的是模拟在单处理器情况下处理器调度,加深了解处理器调度的工作。要求是从优先级调度和时间片轮转法调度算法中选取一个进行实验。

2024-01-27 15:56:11 1256 1

原创 《操作系统》课程设计 进程/线程通信

通过实验了解和熟悉了Linux支持的信号量机制和共享存储区机制的基本原理和基本概念。同时Linux提供了一组精心设计的信号量接口来对信号进行操作,它们不只是针对二进制信号量,包含多个操作函数这些函数都是用来对成组的信号量值进行操作的。Linux内核的信号量用来操作系统进程间同步访问共享资源,借助相关的操作函数可以很轻松的实现多个进程或是线程之间的通信。通过对阅览室问题的模拟运行结果,实现了多个进程之间的通信,以及注册与注销的互斥操作,了解到了进程的各种机制以及处理方法。

2024-01-26 11:12:33 2033 1

原创 基于产生式的小型专家系统

1、遇到的问题在本次实验中最大的问题就是第一步对于规则库的信息的整理和之后如何在匹配这些规则,开始使用了元组和集合,但是都难以进行多次匹配,于是想到了Python本身的字典的“键值对”属性,并且参考了相关文献,对信息做了拓扑排序。2、解决方法首先,对规则信息通过字典的格式存入相应的“RD.txt”文件中,然后对当中的信息进行相应的拓扑排序。3、总结。

2024-01-25 11:39:18 1984 6

基于深度学习的智能水果分类系统设计

基于深度学习的智能水果分类系统需要满足以下设计需求: 1、数据集收集和划分:系统需要具备数据集收集和划分的功能,收集包含各种水果的图像数据,并对这些图片进行划分,分为训练集和测试集。 2、模型选择和训练:系统需要选择适合水果分类任务的深度学习模型,并使用标注好的数据对模型进行训练。模型训练需要考虑到准确性和效率,以便在实时应用中提高系统的响应速度。 3、特征提取和分类:系统需要实现对水果图像的特征提取和分类功能。通过提取水果图像的特征表示,并通过分类器将特征映射到具体的水果类别,实现水果的自动分类。 4、用户界面设计:系统需要拥有一个用户友好的界面,并展示水果的分类结果和相关信息。 5、可扩展性和稳定性:系统需要具备良好的可扩展性,以便适应未来不断增加的水果品种和新的特征。同时,系统需要具备高效的计算能力和稳定的运行环境,保障用户体验。 通过满足以上设计需求,基于深度学习的智能水果分类系统将能够准确、快速地为用户提供水果分类和相关信息。 ———————————————— 版权声明:本文为博主原创文章,遵循 CC 4.0 BY-S

2024-06-30

模式识别大作业,该作业是数字图像处理课程的大作业,主要内容为基于matlab的车牌识别系统,可以实现对车牌图像的提取和识别

在交通管理过程中,通常采用视频监控方式对闯红灯和超速等违章车辆进行监督。对违章车辆,需要自动检测车牌信息,提取车牌号码,以便查找车主信息和监督管理。国内常用的一般车牌通常是是蓝底白字,长宽比3:1。 1、对车牌图像进行预处理,然后进行车牌定位; 2、进行字符分割; 2、对车牌中的数字、字母和汉字进行提取和识别; 3、要求自行设计方案、编写代码实现上述功能,并设计车牌识别的软件界面。

2024-04-30

Python数据分析实战-链家北京二手房价分析.zip

Python数据分析实战-链家北京二手房价分析 分析目标 1、查看北京二手居民住房的分布价格情况,Part 1- 数据读取和预处理; 2、理解变量、数据选取、重复值缺失值处理,Part 2 - 北京市房源分布; 3、数量、单价、总价,Part 3 - 各城区房源分布,Part 4 - 各城区房价分布; 4、单价分布、总价分布、高价Top15小区、低价Top15小区,Part 5 - 各城区房源面积分布; 5、全市平均面积分布、各城区平均面积分布、各城区总面积分布,Part 6 - 房价与房源特性的关系; 6、房价与户型、楼层、朝向、建筑年代的关系。

2024-02-17

基于STM32的多功能电子钟嵌入式设计

已实现的功能 1、表盘、日历、时间、内部温度显示在LCD上; 2、整点报时; 3、通过按键或者串口调试助手设置时钟时间:时、分; 4、通过按键或者串口调试助手设置日历:年、月、日; 5、闹钟设置,可以同时设置三个闹钟,可以随意修改闹钟的时间或者取消;

2024-01-22

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除