自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(16)
  • 收藏
  • 关注

原创 (二)开启深度学习动手之旅:先筑牢预备知识根基

通过对这些概念的深入理解,你可以更系统地掌握深度学习的预备知识,并为后续学习深度学习模型和算法打下坚实的基础。数据预处理的目的是将原始数据转化为适合模型训练的形式,提高模型的性能和泛化能力。线性代数提供了深度学习中数据表示和操作的数学工具,是理解模型结构和算法的基础。也是深度学习框架自动计算梯度的技术,极大地简化了模型训练过程中的梯度计算。数据操作是深度学习的基础,包括数据的创建、索引、切片、运算等操作。广播机制允许形状不同的数组进行运算,较小的数组会在较大的数组上广播。

2025-05-29 16:11:43 767

原创 (一)从理论到实践:开启深度学习动手之旅

随着计算机技术和数学理论的不断发展,人工神经网络的研究逐渐深入。然而,早期的人工神经网络由于计算能力有限、数据量不足等问题,发展相对缓慢。直到近年来,随着大规模数据集的出现、计算能力的显著提升(如 GPU 的广泛使用)以及深度学习算法的不断创新,深度学习才取得了爆炸性的进展,成为人工智能领域的热门研究方向。第1章引言部分主要帮助读者对机器学习和深度学习有一个初步的了解,为后续章节的深入学习奠定基础。这些例子表明,机器学习已经在很大程度上改变了人们的生活和工作方式,提高了效率和便利性。

2025-05-28 17:34:01 1104

原创 (八)知识图谱之维护与更新

fill:#333;color:#333;color:#333;fill:none;是是否数据错误需求扩展数据监控有更新?增量抽取版本控制质量评估合格?更新知识图谱人工干预修正数据用户反馈收集问题分类触发审核流程调整知识建模知识图谱的维护是一个“动态监控-质量检测-人工干预-持续优化”的闭环过程,需结合自动化技术与人工经验,确保图谱始终准确、完整、可用。1. 维护流程核心环节与逻辑fill:#333;color:#333;color:#333;fill:none;是是。

2025-05-26 17:28:28 1012

原创 (七)知识图谱之知识应用

知识图谱通过将领域知识结构化,为智能应用提供了强大的语义理解和推理能力。从简单的问答到复杂的决策支持,其核心在于**“实体-关系-属性”的灵活建模与多模态数据的深度融合**。随着AIGC(如ChatGPT辅助生成知识)和联邦学习(隐私保护下的跨机构建模)的发展,知识图谱将在更多垂直领域(如精准医疗、智能交通)发挥关键作用,推动人工智能从“感知”向“认知”迈进。

2025-05-26 17:15:31 1048

原创 (六)知识图谱之知识推理

通过“机器代替部分人类思考”,让企业从“经验驱动”转向“知识驱动”,在降本增效的同时挖掘数据的隐藏价值。将实体和关系“翻译”成低维向量(如100维数字数组),通过向量空间的数学运算(如加法、距离计算)预测缺失关系,类似“图谱的单词嵌入(Word2Vec)”。通过这一过程,知识图谱从“一堆散落的知识点”升级为“能思考、会推理的智能体”,为问答系统、推荐引擎等应用提供更强大的支撑。知识推理是知识图谱的“灵魂”,它让静态的知识图谱从“一本厚重的百科全书”蜕变为“一个会思考的智能体”。

2025-05-26 16:15:59 858

原创 (五)知识图谱之知识存储

知识图谱以图结构(节点-边-属性)存储实体、关系及属性信息,图数据库的选择需综合考虑数据规模、查询需求、业务场景等因素。

2025-05-25 23:13:15 1274

原创 (四)知识图谱之知识融合

在实际应用中,单一方法往往难以应对复杂的数据源差异(如命名歧义、属性缺失、语义多样性等),而混合方法通过融合不同技术,能够更灵活地处理各类对齐挑战。然后利用GNN模型,结合客户的地址、联系方式等属性,预测不同数据源中的客户是否为同一实体,解决“同一企业不同语言名称”(如“华为”与“Huawei”)的对齐问题。在电商平台的百万级商品对齐中,首先用预训练模型过滤掉90%的明确匹配/不匹配对,剩余10%的模糊对通过主动学习算法筛选出最具信息量的1%样本,由人工标注后用于微调模型,最终实现95%以上的对齐准确率。

2025-05-24 20:25:56 1227

原创 (三)知识图谱之知识抽取

知识抽取的质量控制需贯穿“数据预处理→模型抽取→人工校验→迭代优化”全流程,通过。

2025-05-23 15:11:08 932

原创 (二)知识图谱之数据获取

在构建知识图谱时,数据获取是关键环节,涉及多源异构数据的收集与整合。首先,明确数据需求,如列出电影、演员、导演等实体的核心字段,并评估数据源的可行性与优先级。常用的数据源包括TMDB、IMDb、豆瓣电影和维基百科等。通过API调用(如TMDB API)获取结构化数据,并进行清洗与映射。对于IMDb等公开数据集,下载并解析TSV文件,整合电影、评分和人物信息。对于半结构化数据(如豆瓣电影评分),通过网页爬取技术提取评分、评分人数等字段。最终,将多源数据整合,为知识图谱的构建提供高质量的数据基础。

2025-05-22 21:41:17 1130

原创 (一)知识图谱之知识建模

知识建模是构建知识图谱的核心步骤,主要用于定义数据结构、实体类型、属性及关系。

2025-05-22 21:20:07 1174

原创 知识图谱构建方法

知识图谱的构建是一个“迭代优化”的过程,需结合领域特点选择合适的技术方案,并在实践中不断调整建模逻辑、优化抽取算法、提升数据质量。知识图谱的构建是一个复杂的系统性工程,涉及知识建模、数据获取、知识抽取、知识融合、知识存储、知识推理、知识应用及维护等多个环节。知识图谱的数据来源多样,需根据实体和关系类型收集相关数据,并处理数据的异构性(如结构化、半结构化、非结构化数据)。知识建模是构建知识图谱的第一步,旨在确定知识图谱的结构和语义,定义实体、关系、属性及其层次体系。

2025-05-21 22:54:35 1187

原创 使用PaddleOCR读取pdf内容,输出txt文本

使用PaddleOCR将PDF内容转换为TXT文本的流程包括以下步骤:首先,安装必要的依赖库,如PaddleOCR、PyMuPDF和Pillow。接着,将PDF文件转换为图像,使用PyMuPDF提取每页内容并保存为JPEG格式。然后,通过PaddleOCR对图像进行文本识别,提取文字并保存为TXT文件。整个过程涉及PDF解析、图像处理和OCR识别,最终实现PDF内容的文本化输出。

2025-05-19 22:28:18 1307

原创 基于当前主流技术框架,AI 大模型涉及的核心技术点分类整理

以上技术点覆盖了 AI 大模型从理论基础、模型架构、训练工程到伦理安全的全链条。实际应用中,不同领域(如 NLP、CV、多模态)会有技术侧重,且技术迭代速度极快(如 2023-2025 年 MoE、稀疏架构、量子-经典混合计算等方向发展迅速)。AI 大模型涉及的核心技术点分类整理(基于当前主流技术框架)。

2025-05-19 21:58:47 967

原创 使用PaddleOCR提取图片中的文字

PaddleOCR是基于PaddlePaddle深度学习框架的OCR工具,支持多语言文本识别。使用PaddleOCR提取图片中的文字主要包括以下步骤:首先安装PaddleOCR及其依赖项,然后在Python脚本中导入并初始化OCR模型。加载图片后,使用PaddleOCR进行文字识别,识别结果包含每行文字及其位置信息。可以通过解析结果获取文字内容和置信度,并将结果保存到文件中。此外,PaddleOCR还支持处理多张图片,通过循环遍历图片列表实现批量识别。通过这些步骤,用户可以轻松提取图片中的文字并进行后续处理

2025-05-14 10:39:15 562

原创 windows11 安装PaddleOcr 的正确方式

本文介绍了如何在Windows 11上安装PaddleOCR,并解决安装过程中可能遇到的源问题。首先,通过pip命令安装PaddleOCR时,若使用默认源报错,可切换至国内镜像源(如清华源)进行安装。安装完成后,可通过简单的Python代码验证PaddleOCR是否成功安装。此外,PaddleOCR可能需要额外依赖库如OpenCV,可通过pip安装。文章还提供了一个简单的PaddleOCR示例代码,用于识别图片中的文字,并可视化识别结果。

2025-05-12 17:04:37 399

原创 Windows 11上安装PaddlePaddle的常见问题。

在Windows 11上安装PaddlePaddle时,可能会遇到环境配置、版本匹配和安装命令错误等问题。首先,确保系统环境满足PaddlePaddle的要求,包括Python版本(3.6到3.9)。使用正确的安装命令,如python -m pip install paddlepaddle==2.4.2 -i https://mirror.baidu.com/pypi/simple,并注意升级pip版本和更换源以解决安装错误。

2025-05-12 11:31:14 508

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除