自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 收藏
  • 关注

原创 InternLM——Tutoria 第四期【Linux使用】

创建了intern的conda虚拟环境,并安装gradio的python包即可将示例代码进行运行。我采用的是使用公钥生成,并利用vscode客户端进行连接到开发机内部。我们甚至也可以去修改html代码,展示我们想要展示的前端页面。

2024-10-31 14:23:37 149

原创 GPT-5 一年半后发布?是时候迎接AI技术变革了

GPT-5的到来无疑将带来巨大的机遇和挑战。它可能彻底改变我们的工作方式、学习方式和生活方式。面对这一技术变革,我们需要保持开放和适应的心态,积极准备,以充分利用AI带来的机遇,同时应对潜在的风险和挑战。让我们携手共创一个人类与AI和谐共处、共同进步的美好未来!现在就请分享您的看法:您认为GPT-5会给您的工作和生活带来哪些变化?您对AI赋能的未来有什么期待?我们又应该如何为这个新时代做好准备?欢迎在评论区留下您的想法!

2024-06-25 17:16:01 682

原创 Multi-Modal RAG 多模态检索如何实现呢?

许多文档包含混合内容类型,包括图像和文本。然而,在大多数 RAG 应用程序中,图像中捕获的信息丢失了。随着多模态LLMs(如 GPT4-V、LLaVA 或 FUYU-8b)的出现,值得考虑如何在 RAG 流程中利用图像。在 RAG 中利用多模态模型的选项很少Option 3在这里我们将实现3。

2024-06-25 17:05:00 1263 1

原创 大模型高效微调(PEFT)技术

该研究探索了 "Prompt Tuning" 这一简单而有效的方法,通过对 GPT-3 等大型预训练模型进行软提示调整(Soft Prompt Tuning),从而学习特定任务的提示。这种方法的核心思想是,通过引入任务特定的软提示向量,来指导预训练模型在下游任务中的表现。P-Tuning v2 是在 P-Tuning 基础上优化和改进的一种方法,旨在使提示调整(Prompt Tuning)在不同规模的预训练模型上,针对各种下游任务都能达到类似全面微调(Fine-tuning)的效果。

2024-06-21 18:13:14 785

原创 快速入门多向量检索器

有时摘要可以更准确地提炼出一个片段的内容,从而提高检索效果。这里我们展示如何创建摘要,然后嵌入这些摘要。chain = (符号表示管道操作符,这是一种流式处理数据的方法。每个步骤的输出会成为下一个步骤的输入。这种语法通常出现在某些特定的库或框架中,表示数据处理链中的各个步骤。提取文档内容:从输入对象中提取文档的内容。生成聊天提示模板:将提取的内容传递给聊天提示模板。执行聊天模型:将提示模板传递给 OpenAI 聊天模型进行总结处理。解析输出:将聊天模型的输出传递给字符串输出解析器进行解析。

2024-06-15 20:03:00 1570

原创 微调对所有人来说都很有趣!

微调(Finetuning)技术在大语言模型(LLM)优化中至关重要。LoRA(低秩适应)作为一种参数高效微调方法,通过减少可训练参数和GPU内存需求,大幅提升了微调效率,同时保持推理延迟不变,且模型准确性仅略低于完全微调。微调过程包括确定任务、收集和生成数据、微调小模型、调整数据量和评估模型性能等步骤。

2024-06-14 11:51:59 1054

原创 提高检索增强生成(RAG)系统性能的 10 种方法

例如,您可以使用基于关键字的索引来处理与特定产品相关的查询,但依赖嵌入来进行一般的客户支持。我见过的一个更有创意的方法是使用LLM创建所有提供作为上下文的文档的摘要。相反,我的目标是概述一些在尝试改进您的检索增强生成应用程序时可能考虑和尝试的事项。您希望嵌入能够更多地基于您的领域特定术语来判断相似性,比如“知识产权”或“违约”,而较少基于像“协议”这样的通用术语。这两个框架都有有用的调试工具,可以让您定义回调,查看使用的上下文,检索来自哪个文档等。是一个提供可视化界面的工具,可以帮助你构建复杂的代理。

2024-06-13 09:37:50 1664

原创 RAG 和父文档检索器

使用 PDR,文档首先被识别并标记为“父文档”。将这些视为全面的来源或“大局”。但是,PDR 并没有试图将这些庞大的内容压缩到一个嵌入中,而是将这些父文档进一步细分为“子文档”。这些子段表示总体父文档中存在的更具体的主题或主题。

2024-06-12 18:44:58 1183 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除