自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

谷哥的小弟

坚持原创,热衷分享;积累知识,沉淀技术

  • 博客(1603)
  • 资源 (21)
  • 收藏
  • 关注

原创 十载寒冰,难凉热血——2020CSDN年度博客之星Top10心路历程

十多年前,我刚开始学软件编程的时候,遇到问题就到处找答案,看别人的文章;再从文章中拷贝代码粘贴在自己的项目里看看是不是能解决问题。解决了最好,要是没有解决的话就继续再找。这种状态持续了很久:不停地四处找代码借以解决自己的项目需求和技术难点。在这个过程中自己的进步微乎其微,而且遇到以往类似的问题依然不清楚该怎么解决,于是只有再次去找代码,复制,粘贴……如此循环。在这样的循环下,开始有些麻木了,甚至心安理得地觉得:写代码原本就是这样的,大家也都是这样做的。直到有一天,我觉得这是在为自己开脱,其实是在心底隐蔽..

2021-02-04 22:49:46 18001 46

原创 前端HTMX技术详细解释

HTMX 作为一种新兴的前端开发工具,凭借其轻量级、无依赖、易扩展的特性,在前端开发领域展现出了独特的优势和广阔的应用前景。它通过在 HTML 中引入自定义属性,实现了 AJAX 请求、CSS 动画、WebSockets 等现代交互功能,极大地简化了前端开发流程,降低了开发门槛,尤其适合后端开发人员和对性能要求较高的简单交互性项目。

2025-05-10 11:07:35 1130

原创 Server-Sent Events(SSE)技术详解

Server-Sent Events(SSE)是HTML5标准中的一项技术,通过单向HTTP长连接实现服务器向客户端的实时数据推送,适用于股票行情、新闻订阅等场景。SSE的核心优势包括:1)简单易用,基于文本格式和EventSource API,开发者可快速实现数据接收;2)高效连接维护,通过长连接减少轮询开销,降低服务器资源消耗;3)强大的数据传输能力,支持JSON等结构化数据的高效解析;4)自动重连和状态恢复机制,确保数据传输的连续性与完整性;5)良好的兼容性,可在大多数现代浏览器中使用,并通过Poly

2025-05-10 11:06:00 776

原创 SpringBoot框架名字的由来

在计算机启动时,BIOS/UEFI会执行一段称为“Bootloader(引导程序)”的代码。它的任务极其简单却至关重要:用最基础的指令,逐步加载更复杂的系统组件,最终启动完整的操作系统。这一过程被称为“Booting(引导)”,其本质是通过最小化的初始操作,触发系统的自我构建能力。

2025-05-10 10:42:20 1309

原创 文心一言开发指南13——文心一言API两种调用方式的区别

至于到底选择使用SDK调用还是HTTP调用ERNIE-4.0-8K取决于项目的具体需求、开发团队的熟悉程度、系统的整体架构以及性能和安全等方面的考虑。在需要快速集成、深度整合、性能优化和一致开发体验的场景下,使用SDK调用可能更为合适;而在需要轻量级、灵活性、跨语言支持、自定义交互过程或避免依赖与兼容性问题的场景下,使用HTTP调用可能更为合适。需要注意的时,都需要确保遵循API的使用规范和安全性要求,以确保应用的稳定性和安全性。

2025-05-05 16:01:33 869

原创 文心一言开发指南12——千帆大模型平台文生图API

文心一言开发指南,千帆大模型平台文生图API。

2025-05-05 16:01:12 427

原创 文心一言开发指南11——千帆大模型平台对话API

在此,介绍在本地IDEA中利用代码实现单轮对话。

2025-05-05 01:15:00 819

原创 文心一言开发指南10——千帆大模型平台计费

如果选择按量后付费,系统会根据实际的输入及输出总和tokens数量,每小时对您的百度智能云账户进行扣费。对于个人开发者而言,通常选择按照量后付费或Tokens量包预付费;本教程使用ERNIE-4.0-8K模型,故开通其付费;

2025-05-05 00:30:00 245

原创 文心一言开发指南09——千帆大模型平台获取AccessToken

在日后的API调用中会频繁使用AccessToken,所以我们先了解如何获取AccessToken。刚好,也借此机会熟悉千帆大模型平台推理API最基本的使用。至于如何获取AccessToken,请详细阅读官方文档;图示如下:

2025-05-05 00:15:00 608

原创 文心一言开发指南08——千帆大模型平台推理服务API

百度智能云千帆平台提供了全面的推理服务API,涵盖了多种功能。具体而言,它支持对话Chat API,可用于发起一次对话;续写Completions API,允许用户发起一次续写请求,但需注意它不支持多轮会话;向量Embeddings API,能够根据输入内容生成对应的向量表示;重排序Reranker API,用于重新排序向量模型返回的top-k文档,从而优化语义搜索结果;此外,平台还支持HuggingFace Transformer架构的自定义大模型导入,用户可以将自定义模型发布为服务,并通过相关API进行

2025-04-29 20:29:31 1010 1

原创 文心一言开发指南07——千帆大模型平台创建应用

在您使用百度智能云千帆大模型平台前,需要您提前注册一个百度智能云的官网主账号;官方链接:https://login.bce.baidu.com/new-reg在完成注册后请登录,登录后将跳转至智能云控制台;图示如下:

2025-04-28 01:15:00 307

原创 文心一言开发指南06——千帆大模型平台新手指南

千帆大模型平台为新手用户提供了一个全面的入门指南,以便用户能够快速熟悉平台的操作和功能。千帆大模型平台通过提供详细的新手指南,确保用户能够顺利开始他们的AI大模型训练和部署之旅。平台提供了详细的操作手册和视频教程,帮助用户逐步熟悉每一个操作步骤。另外,平台提供了丰富的API接口和SDK支持,用户可以通过编程快速接入和使用平台服务。

2025-04-28 00:15:00 361

原创 文心一言开发指南05——千帆大模型平台费用说明

千帆大模型平台提供了一系列基础服务,包括数据集管理、模型训练、服务发布与监管等,这些服务是平台运行的核心。对于这些基础服务,平台会根据用户的具体使用情况来收费。收费模式多样,包括按量计费和订阅服务。按量计费通常针对资源密集型服务,如模型训练和批量预测,根据用户实际使用的计算资源、存储资源或调用次数等计费。而订阅服务则适用于长期使用的功能,用户可选择按月、按季度或按年订阅,享受固定的服务内容和价格。平台确保计费的透明度,明确展示各项服务的收费标准、计费详情和使用量统计。

2025-04-21 00:30:00 1433

原创 文心一言开发指南04——千帆大模型平台常用概念

在利用千帆大模型平台进行AI开发之前,有必要了解千帆大模型平台的常用概念。在单轮对话中,通常只涉及一个核心问题,对话的双方只需要针对这个问题进行回答和交流,不需要对之前的回答进行进一步的追问或解释。这种对话形式通常适用于一些简单的交流场景,如咨询信息、请求服务等。在多轮对话中,对话的双方需要在一系列问题中进行多次交流和回答,每次回答都可能引出下一个问题。这种对话形式通常适用于一些复杂的交流场景,如咨询专家意见、解决问题等。

2025-04-21 00:15:00 346

原创 文心一言开发指南03——千帆大模型平台产品优势

千帆大模型平台作为百度智能云推出的企业级大模型一站式平台,具有显著的产品优势。千帆大模型平台以其基础强大、流程完善、运行稳定和安全可靠的产品优势成为企业构建AI应用的首选平台。通过该平台企业可以快速构建高效的大模型应用提高业务流程的自动化水平和效率降低成本并创新应用场景打造差异化的竞争力和品牌优势。

2025-04-14 19:27:09 793

原创 文心一言开发指南02——千帆大模型平台介绍

百度智能云千帆大模型平台(简称千帆或千帆大模型平台)是面向企业开发者的一站式大模型开发及服务运行平台。千帆不仅提供了包括文心一言底层模型和第三方开源大模型,还提供了各种AI开发工具和整套开发环境,方便客户轻松使用和开发大模型应用。千帆大模型平台支持数据管理、自动化模型SFT以及推理服务云端部署的一站式大模型定制服务,助力各行业的生成式AI应用需求落地。

2025-04-14 01:45:00 353

原创 文心一言开发指南01——官方文档综述

文心一言是百度智能云推出的一款大模型产品,而千帆大模型平台是百度智能云为开发者和企业提供的一个平台,用于构建、训练和部署各种大模型,包括但不限于文心一言。千帆大模型平台提供了一个更广泛的环境,支持用户利用百度的技术和资源来开发和部署自己的大模型,而文心一言则是这个平台上的一个成熟的大模型实例,用户可以直接使用或作为参考来构建自己的模型。它可以根据用户的输入生成各种类型的文本,如诗歌、故事、对话等,并广泛应用于文学创作、商业文案创作、数理逻辑推送、中文理解、多模态生成等多个领域。

2025-04-14 01:30:00 490

原创 大模型上下文协议MCP详解(4)—应用场景

在医疗领域,病历系统是患者医疗信息的核心存储库,其数据的准确性和完整性对于诊断和治疗至关重要。通过 MCP 协议,AI 医生能够与病历系统无缝连接,快速获取患者的病史信息。例如,当 AI 医生接收到一个患者的诊断请求时,它可以通过 MCP 协议调用病历系统,获取患者的既往病史、过敏史、手术记录等关键信息。这种连接方式不仅提高了数据获取的效率,还确保了数据的准确性和实时性。据统计,使用 MCP 协议连接病历系统后,AI 医生获取病历信息的时间减少了约 50%,同时数据错误率降低了 20%。此外,MCP 协议还

2025-04-14 00:45:00 1020

原创 大模型上下文协议MCP详解(3)—主要优势

MCP 协议的出现,正是为了应对 AI 领域中日益增长的集成需求。随着 AI 技术的快速发展,AI 模型需要与各种外部资源进行交互,以获取数据、调用工具或执行任务。然而,传统的集成方式通常需要为每个模型和数据源单独开发接口,这不仅增加了开发成本,还可能导致安全漏洞和维护问题。MCP 协议通过标准化的客户端-服务器架构,将 AI 模型与外部资源的交互过程简化为一个统一的接口,使得开发者可以更高效地构建和部署 AI 应用。

2025-04-14 00:15:00 939

原创 大模型上下文协议MCP详解(2)—核心功能

MCP(Model Context Protocol)通过标准化的接口,为 AI 模型提供了强大的实时数据接入能力,使其能够快速获取和处理来自不同数据源的实时信息。例如,在金融领域,MCP 可以使 AI 模型实时查询股票价格、交易量等数据,为投资决策提供即时支持。根据相关研究,使用 MCP 接入实时数据后,金融 AI 模型的决策效率提升了约 30%,准确率提高了 15%。在气象领域,MCP 支持 AI 模型实时获取天气数据,为气象预测和灾害预警提供更准确的依据,数据更新频率可达到每分钟一次,显著提高了预测的

2025-04-11 23:15:00 797

原创 大模型上下文协议MCP详解(1)—技术架构与核心机制

MCP(Model Context Protocol,模型上下文协议)是由Anthropic公司于2024年11月推出的开放标准协议。它旨在解决AI大模型与外部工具、数据源及API之间的标准化交互问题,为AI智能体提供类似“万能插头”的统一接口,简化复杂集成流程,推动AI生态的互操作性和可扩展性。具体而言,其目标是打破AI系统与数据之间的孤岛状态,让模型能够更高效、更安全地获取上下文信息,从而生成更准确、更相关的回答。

2025-04-11 17:55:14 1284

原创 大模型知识蒸馏核心技术(5)—— 多教师蒸馏

多教师蒸馏的核心在于利用多个教师模型的集成知识来指导学生模型的学习。这些教师模型可以具有不同的架构、训练数据或任务目标,从而提供多样化的知识。例如,不同的教师模型可能在某些特定任务上表现出色,而多教师蒸馏能够将这些优势整合起来,使学生模型能够学习到更全面的特征表示和决策逻辑。通过这种方式,学生模型不仅能够继承教师模型的优势,还能避免单一教师模型可能存在的局限性和偏见。

2025-03-16 15:14:04 1381

原创 大模型知识蒸馏核心技术(4)—— 关系型知识蒸馏

大模型知识蒸馏的核心技术旨在将教师模型的知识高效迁移至学生模型。其中,样本间关系建模(RKD,Relational Knowledge Distillation)是一种重要的方法,它通过迁移样本间的距离或角度关系,增强学生模型的泛化能力。

2025-03-10 00:45:00 372

原创 大模型知识蒸馏核心技术(3)—— 中间层知识迁移

特征匹配是中间层知识迁移的一种重要方式,通过对齐师生模型的中间层特征来实现知识的传递。具体来说,教师模型和学生模型的中间层特征图或激活值被提取出来,然后通过某种损失函数来衡量它们之间的差异,并进行优化。常用的损失函数包括L2损失和余弦相似度等。

2025-03-10 00:30:00 1929

原创 大模型知识蒸馏核心技术(2)—— 损失函数设计

教师模型的复杂度与性能、软标签输出以及知识丰富性为其提供了高质量的知识来源,而学生模型的结构与复杂度、学习能力、泛化能力以及训练效率则决定了知识迁移的效率和最终性能。例如,大型Transformer模型作为教师模型能够学习到丰富的语言特征,而轻量级的MobileNet作为学生模型则更适合在移动设备上部署。蒸馏方法的分类进一步丰富了知识迁移的实现方式。输出层蒸馏简单高效,适合分类任务;中间层蒸馏能够实现更深层次的知识迁移,提升学生模型在复杂任务中的性能;注意力机制蒸馏则让学生模型能够学习到教师模型对输入数据的

2025-03-10 00:15:00 990

原创 大模型知识蒸馏核心技术(1)——知识表示与迁移

知识蒸馏能够有效压缩模型大小、降低计算复杂度,提升推理速度。例如,在计算机视觉领域,通过知识蒸馏将大型卷积神经网络(如ResNet50)的知识迁移到小型网络(如MobileNet),可以在保持较高准确率的同时,显著减少模型参数和计算量,满足在移动设备或嵌入式系统上的部署需求。在自然语言处理领域,对BERT模型进行知识蒸馏得到的轻量级模型,如TinyBERT,在保持较高准确率的同时,推理速度大幅提升,能够高效完成多种语言任务。

2025-03-03 12:36:13 2046

原创 大模型知识蒸馏技术(10)——伦理约束与性能平衡难题

在性能平衡方面,知识蒸馏虽然显著降低了计算成本,提升了模型的部署效率,但学生模型在复杂推理能力和领域覆盖广度上可能有所牺牲。尽管多教师蒸馏、架构设计优化和数据增强等技术手段能够在一定程度上缓解这一矛盾,但在实际应用中,仍需在效率与能力、能耗控制与性能提升之间找到最佳平衡点。未来的发展方向中,合规性蒸馏、联邦知识蒸馏以及模型水印、数据溯源等技术手段的探索与应用,将为知识蒸馏技术的健康发展提供新的思路和解决方案。合规性蒸馏能够确保 AI 模型在遵守法律法规的前提下高效运行,联邦知识蒸馏则在隐私保护的基础上促进了

2025-03-03 01:15:00 1921

原创 大模型知识蒸馏技术(9)——主流深度学习库的蒸馏实现方案

Transformers 库通过集成多模态模型(如 CLIP、Vision Transformer 等),支持多模态任务的蒸馏。例如,在视觉问答任务中,教师模型可以是一个复杂的多模态模型,学生模型则是一个轻量级的多模态模型。通过 Distiller 类,教师模型的知识可以有效地迁移到学生模型中,使得学生模型在保持较高性能的同时,显著降低了计算复杂度。

2025-03-03 00:15:00 1685

原创 大模型知识蒸馏技术(8)——知识蒸馏应用场景

知识蒸馏技术显著提高了模型的推理效率。学生模型由于结构更简单、参数更少,在推理时所需的计算资源和时间也更少。例如,在图像分类任务中,经过知识蒸馏优化后的学生模型,其推理速度比教师模型提高了5倍以上。这使得模型能够在更短的时间内完成任务,提高了系统的整体效率。在实际应用中,这种效率提升尤为重要。例如,在自动驾驶场景中,模型需要在极短的时间内对路况进行准确判断,知识蒸馏后的轻量化模型能够快速处理传感器数据,为自动驾驶决策提供支持。此外,在实时推荐系统中,知识蒸馏优化后的模型能够更快地生成推荐结果,提升用户体验。

2025-03-01 18:25:33 3444

原创 大模型知识蒸馏技术(7)——知识蒸馏关键技术

KL 散度损失用于衡量学生模型与教师模型软目标的分布差异。通过最小化 KL 散度,学生模型能够学习到教师模型的隐式知识,例如在自然语言处理任务中,学生模型可以学习到教师模型对不同语义的区分能力。实验表明,使用 KL 散度损失的学生模型在语义理解任务中的准确率比仅使用交叉熵损失的模型提高了约 20%,这表明 KL 散度损失在传递教师模型的深层知识方面具有显著优势。

2025-03-01 18:16:38 3053

原创 大模型知识蒸馏技术(6)——自蒸馏

自蒸馏是一种特殊的知识蒸馏方式,其核心在于学生模型不需要一个预先训练好的教师模型,而是通过自身的中间层特征或输出来指导自身的训练。这种方式类似于学生模型在自我学习过程中不断优化自身知识结构。在自蒸馏中,学生模型的中间层特征或输出被用作“软目标”,指导自身的训练。例如,在一个自蒸馏的文本分类任务中,学生模型的中间层特征被用作软目标,通过设计合适的损失函数,使得学生模型在训练过程中能够学习到更深层次的文本特征。这种方式使得学生模型能够在没有外部教师模型的情况下,通过自我学习实现知识的提升。

2025-02-24 00:15:00 1336

原创 大模型知识蒸馏技术(5)——在线蒸馏

在线蒸馏是一种知识蒸馏方式,其核心特点是教师模型和学生模型的参数在训练过程中同时更新,整个蒸馏框架是端到端训练的。这种方式允许教师模型和学生模型相互影响、共同学习,能够更高效地实现知识迁移,动态适应数据变化和任务需求。

2025-02-21 17:23:29 2750

原创 大模型知识蒸馏技术(4)——离线蒸馏

离线蒸馏是知识蒸馏中最早被提出且最为常见的实现方式,其核心在于教师模型和学生模型的训练是分阶段进行的。具体而言,教师模型首先在训练集上进行充分训练,直至收敛,然后利用教师模型的输出(通常是软目标)来指导学生模型的训练。

2025-02-18 21:45:00 2037

原创 大模型知识蒸馏技术(3)——教师模型与学生模型

知识蒸馏技术是一种模型压缩方法,其核心在于将教师模型的知识迁移到学生模型中。教师模型通常是大型、复杂的高性能模型,能够学习到丰富的特征表示和复杂的模式,但计算成本高,难以在资源受限的环境中部署。学生模型则是一个小型、轻量级的模型,设计目标是在有限的计算资源和存储空间下实现高效的推理。知识蒸馏的目标是通过教师模型的指导,让学生模型学习到教师模型的输出(如软目标)和特征表示,从而在减少参数量的同时,尽可能继承教师模型的性能。

2025-02-08 20:18:16 2506

原创 大模型知识蒸馏技术(2)——蒸馏技术发展简史

2006年,Hinton的研究团队开始探索如何将复杂的集成模型压缩成更小、更高效的模型。他们发现,通过训练一个简单的神经网络来模拟复杂模型的行为,可以在不显著损失性能的情况下大幅减少模型的存储和计算需求。这一研究为后续知识蒸馏技术的发展提供了重要的理论基础。

2025-01-30 22:22:49 2072

原创 大模型知识蒸馏技术(1)——蒸馏技术概述

知识蒸馏的概念最早可以追溯到2006年,当时 Geoffrey Hinton 等人的研究已经蕴含了知识迁移和模型压缩的初步思想。然而,知识蒸馏这一概念正式被提出是在2015年,Geoffrey Hinton、Oriol Vinyals和Jeff Dean在论文《Distilling the Knowledge in a Neural Network》中首次明确提出了知识蒸馏的概念。他们提出可以通过让一个小模型(学生模型)学习大模型(教师模型)的输出分布,来获得与大模型相近的性能。在这一过程中,引入了“软标签

2025-01-30 12:27:47 2685

原创 HBuilderX构建Vue项目

HBuilderX是一款专为开发者设计的高效开发工具,致力于提升开发者的编码效率和体验。HBuilderX既适合追求极致效率的极客,也适合希望简化工作流程的懒人开发者。HBuilderX支持Windows等操作系统,让开发者在不同平台上都能享受到一致的开发体验。近年来,HBuilderX以其高效、友好的特点吸引了众多开发者的关注。

2025-01-26 19:51:43 2261

原创 解决npm报错:sill idealTree buildDeps

使用 npm 安装依赖时报错:sill idealTree buildDeps

2025-01-04 23:03:39 2442

原创 解决HBuilderX报错:未安装内置终端插件,是否下载?或使用外部命令行打开。

在HBuilderX中执行npm run build总是提醒下载插件;图示如下:

2025-01-04 22:36:27 1529

原创 通义千问API KEY操作指南

阿里云百炼官方地址https://bailian.console.aliyun.com/,请点击开通服务;图示如下:

2025-01-04 21:34:24 3246

DependencyInjection

Martin Fowler的经典论文《Inversion of Control Containers and the Dependency Injection pattern》的中文翻译。In the Java community there's been a rush of lightweight containers that help to assemble components from different projects into a cohesive application. Underlying these containers is a common pattern to how they perform the wiring, a concept they refer under the very generic name of "Inversion of Control". In this article I dig into how this pattern works, under the more specific name of "Dependency I

2023-09-05

curl-7.76.1-win64-mingw.zip

curl-7.76.1-win64-mingw.zip

2021-10-03

软件开发英语词汇测试.doc

软件开发英语词汇测试.doc

2021-04-07

轻松解决PowerDesigner 15 License Key失效的问题

轻松解决PowerDesigner 15 License 失效的问题。

2020-11-12

javascript网页开发-张孝祥

javascript网页开发pdf,作者:张孝祥。大家一起学习javascript。

2017-10-02

看透springMvc源代码分析与实践 高清 pdf 带书签

看透springMvc源代码分析与实践 高清 pdf 带书签

2017-08-05

Java_Web开发内幕-高级特性 pdf 带书签

张孝祥老师 Java_Web开发内幕-高级特性 pdf 带书签

2017-07-25

Java虚拟机精讲 高清 带书签

Java虚拟机精讲 高清 带书签!!!

2017-07-15

深入理解Java虚拟机:JVM高级特性与最佳实践(第2版)

深入理解Java虚拟机:JVM高级特性与最佳实践(第2版)高清!! 无码!! 带书签!

2017-07-15

Android系统源代码情景分析

《Android系统源代码情景分析》随书光盘

2017-04-03

Java编程思想第四版完整高清版

Java编程思想第四版完整高清版pdf

2017-03-26

layout部分源码

源代码。

2016-05-26

仿QQ获取设备中APK并分享

2016-04-30

深入Java虚拟机(第二版)

以前在csdn下了一个,但是用不了。现在找到一个好的,传上来。

2010-04-30

网络协议仿真教学系统(通用版)CHM版本

网络协议仿真教学系统(通用版),好像是吉林大学的。方便实用,内容很全,重要的协议都包括了。

2010-04-08

《计算机网络(第四版)》课后答案

《计算机网络(第四版)》的课后答案 电子工业出版社

2010-04-08

java编程思想第四版中文版

java编程思想第四版中文版,翻译不错。大家学习,~~

2010-04-06

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除