自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(32)
  • 收藏
  • 关注

原创 31.1K+ Star!Upscayl:一个免费开源的AI图像放大工具

Upscayl[1]是一个免费且开源的AI图像放大工具,支持Linux、MacOS和Windows操作系统。它使用先进的AI算法来放大和增强低分辨率的图片,而不损失质量,效果几乎像魔法一样!

2024-11-13 08:02:38 700

原创 35.3K+ Star!PhotoPrism:一款基于AI的开源照片管理工具

是一个为去中心化网络设计的AI照片应用,它利用最新技术自动标记和查找图片,实现自动图像分类与本地化部署,你可以在家中、私有服务器或云端运行它。

2024-11-12 07:58:43 2675

原创 35.3K+ Star!MockingBird:一个AI拟声工具, 5秒内克隆你的声音并生成任意语音内容

是一个AI拟声项目,能够在5秒内克隆你的声音并生成任意语音内容,实现实时语音合成。该项目支持中文普通话,并在多个数据集上进行了测试。

2024-11-10 17:30:07 1209

原创 31.7K+ Star!AgentGPT:一个在浏览器中运行的Agent

是一个可以让你在浏览器中组装、配置和部署自主AI代理的项目。你可以为你的自定义AI命名,并让它去实现任何你想象中目标。它将尝试通过思考要执行的任务、执行它们并从结果中学习来达成目标。

2024-11-08 08:16:57 905

原创 1.6K+ Star!Ichigo:一个开源的实时语音AI项目

Ichigo[1]是一个开放的、持续进行的研究项目,目标是将基于文本的大型语言模型(LLM)扩展,使其具备原生的“听力”能力。可以将其视为一个开放数据、开放权重、设备上的 Siri。该项目采用了早期融合技术,灵感来源于Meta的Chameleon论文。

2024-11-07 07:30:43 1635

原创 1.6K+ Star!GenAIScript:一个可自动化的GenAI脚本环境

是一个 JavaScript-ish 环境,提供了便捷的工具用于文件摄入、提示开发和结构化数据提取。它允许用户以编程方式组装大型语言模型(LLM)的提示,并通过单一脚本协调 LLM、工具和数据。

2024-11-06 07:28:45 1467

原创 4.5K+ Star!Docling:一个文档解析工具

Docling[1]是一个文档解析工具,它能够轻松快速地将文档导出为所需的格式。可以帮助用户从各种文档中提取信息,并将其转换为更易于处理的数据格式。

2024-11-05 08:00:58 2193

原创 11.6K+ Star!Plate:一个基于AI的富文本编辑器

Plate[1]是一个由 AI 驱动的富文本编辑器,为用户提供一个强大且易于使用的编辑体验。它支持多种功能,包括但不限于代码高亮、自动保存、协作编辑等,并且可以通过插件系统进行扩展,以满足不同用户的需求。

2024-11-03 16:22:14 1285

原创 18.9K+ Star!Frigate:一个基于Docker的NVR(网络视频录像机)系统

Frigate[1]是一个为IP摄像头设计的具有实时本地目标检测功能的网络视频录像机(NVR),支持视频流处理和物体检测。它专为Home Assistant[2]设计,并使用OpenCV和TensorFlow进行实时目标检测。

2024-11-01 07:36:06 3615

原创 3.2K+ Star!OpenLLMetry:一个开源的LLM应用可观测性工具

是一个基于OpenTelemetry的开源可观测性工具,专为LLM(Large Language Models,大型语言模型)应用设计。它提供了一套扩展,可以帮助开发者全面监控和管理他们的LLM应用。

2024-10-31 07:17:21 609

原创 1.2K+ Star!DocETL:一个强大的文档处理和ETL工具

DocETL[1]是一个用于创建和执行数据处理流水线的工具,特别适合复杂文档处理任务。它提供了一个低代码、声明式的YAML界面来定义基于LLM的操作,以处理复杂数据。适用于需要语义处理、复杂map-reduce任务、不确定如何表达任务以提高LLM准确性、处理长文档或需要验证标准的用户。

2024-10-30 08:09:18 443

原创 8.5K+ Star!Skyvern:一个基于LLMs和计算机视觉自动化浏览器工作流的工具

Skyvern[1]一个使用大型语言模型(LLMs)和计算机视觉自动化浏览器工作流程的工具。它通过API端点提供服务,能够在无需定制代码的情况下自动化多个网站上的手动工作流程。Skyvern利用计算机视觉和LLMs实时解析视口(viewport)中的项目,规划交互并执行操作。它具有适应网站布局变化、在未知网站上操作的能力,并能利用LLMs处理复杂交互情况。

2024-10-29 07:59:37 1797

原创 13.6K+ Star!Phidata:一个开源的AI智能体框架

Phidata[1]是一个用于构建具有记忆、知识、工具和推理能力的智能代理的框架。这些代理可以执行复杂的任务,如网络搜索、财务数据分析等,并且能够以团队的形式协同工作。Phidata 还提供了一个用户界面,允许用户与代理进行交互,以及监控和调试工具,以便开发者可以跟踪代理的性能并进行优化。

2024-10-25 08:25:18 1497

原创 13.4K+ Star!DeepFace:一个轻量级人脸识别和面部属性分析库

是一个用于 Python 的轻量级人脸识别和面部属性分析(年龄、性别、情绪和种族)库。DeepFace 利用深度学习进行人脸识别和分析,它通过封装多种先进的人脸识别模型,提供了一个简单易用的接口。用户无需深入了解背后的复杂过程,只需通过简单的函数调用来实现面部识别和属性分析。它是一个混合型人脸识别框架,集成了多种最新的模型,如 VGG-Face、FaceNet、OpenFace、DeepFace、DeepID、ArcFace、Dlib、SFace 和 GhostFaceNet。

2024-10-22 09:07:01 1045

原创 168K+ Star!AutoGPT:一个构建、部署和运行AI代理的强大平台

AutoGPT[1]是一个强大的平台,它允许用户创建、部署和管理持续运行的AI代理,以自动化复杂的工作流程。该项目的使命是提供工具,让用户能够专注于重要的事情。

2024-10-21 21:06:39 841

原创 8K+ Star!Screenpipe:一个AI屏幕与音频记录专家

是一个开源项目,它提供了24/7的本地AI屏幕和麦克风录制功能。它允许开发者构建具有完整上下文的AI应用程序。Screenpipe与Ollama兼容,是Rewind.ai的替代品。它强调开放性、安全性,并且用户拥有自己的数据。

2024-10-20 10:04:32 1303

原创 3.6K+ Star!AlphaCodium:一个创新的代码生成方法

是一个创新的代码生成方法,它通过一个基于测试的、多阶段的、以代码为中心的迭代流程,来提升大型语言模型(LLMs)在代码问题上的性能。与传统的自然语言处理任务不同,代码生成需要精确匹配目标语言的语法,识别最佳路径和边缘情况,关注问题规范中的众多细节,以及解决其他代码特有的问题和需求。

2024-10-19 18:32:51 1021

原创 5.3K+ Star!llmware:一个构建企业级RAG管道的统一框架

llmware[1]提供了一个统一的框架,用于构建基于大型语言模型(LLM)的应用,例如RAG(Retrieval-Augmented Generation)和多步骤代理工作流(Agent)。它使用小型、专门的模型,这些模型可以私有部署,安全地与企业知识源集成,并针对任何业务流程进行成本效益的调整和适应。

2024-10-18 08:19:50 1373

原创 69.5K+ Star!Whisper:一个开源的通用语音识别模型

Whisper[1]是一个由 OpenAI 开发的通用语音识别模型,它通过大规模弱监督学习训练而成。这个模型不仅能够进行多语言语音识别,还能进行语音翻译和语言识别,是一款多功能的语音处理工具。

2024-10-17 08:46:21 1096

原创 8.7K+ Star!Swarm:一个多智能体协同框架

Swarm[1]是一个由 OpenAI Solution 团队管理的实验性框架,用于探索多智能体系统的协同工作。它提供了一个轻量级、高度可控的平台,适合开发者学习和实验多智能体协同的模式。注:它目前处于实验阶段,不推荐在生产环境中使用,因此没有官方支持。

2024-10-15 22:57:56 335

原创 14.4K+ Star!GPT Researcher:一个基于AI的智能研究助手

是一个基于大型语言模型(LLM)的自动化智能体,目标是对任何给定主题进行在线全面研究。该智能体能够生成详细、事实和无偏见的研究报告,并提供定制化选项,以关注相关资源和大纲。GPT Researcher的设计灵感来源于最新的Plan-and-Solve和RAG论文,目标是解决错误信息、速度、确定性和可靠性问题,通过并行化智能体工作而不是同步操作,提供更稳定的性能和更快的速度。

2024-10-14 09:17:24 939 2

原创 1.5K+ Star!assistant-ui:一套构建AI聊天界面的组件库

是一套用于构建AI聊天界面的React组件库。它集成了多种模型提供商,如OpenAI、Anthropic、AWS、Google等,并支持自定义API集成。它旨在简化AI聊天界面的开发过程,使开发者能够快速构建出功能丰富的聊天应用。

2024-10-12 14:14:33 1407

原创 1.9K+ Star!gptme:你的终端个人AI助手

gptme[1]是一个运行在终端的个人AI助手,它配备了本地工具,可以编写代码、使用终端、浏览网页以及进行视觉识别。gptme旨在协助各种知识型工作,尤其是编程工作,通过一个简单但功能强大的命令行界面。

2024-10-11 08:33:23 586

原创 32.1K+ Star!LLaMA-Factory:一个大模型开发工具集

是一个用于高效微调100多种大型语言模型(LLMs)的统一平台,该项目在2024年的ACL会议上进行了展示。它支持多种模型和微调方法,包括全参数微调、局部冻结微调、LoRA和量化LoRA(QLoRA)等先进的算法和技术。

2024-10-10 08:16:20 699

原创 RD-Agent:一个基于AI的自动化研究与开发工具

是一个开源的R&D(研究与开发)自动化工具,通过人工智能技术推动数据驱动的AI研发过程。该项目专注于数据和模型这两个R&D的核心方面,以自动化高价值的通用R&D流程。

2024-09-27 23:46:36 1443

原创 2.7K+ Star!LlamaParse:一个为RAG和代理打造的文档解析神器

是一个专为生成式人工智能(GenAI)设计的文档解析器,能够解析复杂的文档数据,以适应任何下游大型语言模型(LLM)的使用场景,如检索增强生成(RAG)或智能代理。它能够解析多种复杂的文件类型,包括 PDF、PPTX、DOCX、XLSX 和 HTML,并且支持表格识别、多模态解析和自定义解析。

2024-09-26 22:12:18 838

原创 2K+ Star!Unstract:一个基于 LLM 的无代码智能文档处理平台

一个无代码平台,它利用大型语言模型(LLM)来自动化机器间的交互,通过简单的无代码方法,可以启动API和ETL(Extract, Transform, Load)管道,将非结构化文档转化为结构化的JSON数据。它不仅支持API的部署,还能从多种云文件或对象存储系统中读取复杂文档,并将结构化数据写入流行的数据仓库和数据库。

2024-09-25 22:05:53 1360

原创 12K+ Star!Taipy:一个快速将数据和AI算法转化为Web应用的工具

Taipy[1]是一个为数据科学家和机器学习工程师设计的,用于构建数据和AI Web应用的工具。它能够让用户无需学习新语言,只需使用Python,就能专注于数据和AI算法,而无需担心开发和部署的复杂性。它的核心优势在于简化了开发流程,使得用户可以专注于算法本身,而不是技术实现的细节。

2024-09-24 23:24:30 737

原创 55.4K+ Star!AppFlowy:一个基于AI的开源协作工作空间

一个结合了项目、wiki和团队的AI协作工作空间,它是一个开源的替代Notion的工具。AppFlowy的开发团队认为现有的协作工具存在局限性,如数据安全性和移动端兼容性问题。AppFlowy旨在打破这些限制,提供一个更加灵活、安全和易于使用的协作平台。

2024-09-16 09:28:16 1434

原创 28.5K+ Star!Langflow:一个用于构建 RAG 和多代理 AI 应用的低代码应用构建工具

一个用于构建 RAG(Retrieval-Augmented Generation)和多代理 AI 应用的低代码应用构建器。

2024-09-16 09:23:05 790

原创 7.2K+ Star!Follow:下一代信息浏览器

是一个集成了AI、区块链和社交功能的下一代信息浏览器,旨在为用户提供一个现代、快速、便捷的一站式信息中心。它支持多种平台,包括Windows、macOS、Linux、浏览器以及即将推出的Android和iOS移动版本。Follow利用AI技术提供个性化的信息服务,如翻译、总结、推荐和基于订阅的AI报告。此外,它还使用区块链技术激励活跃用户和优秀内容创作者,并通过社交功能允许用户分享订阅和发现新内容。

2024-09-13 23:02:01 3192 3

原创 2.7K+ Star!Crawl4AI:一个为大型语言模型(LLMs)和AI应用设计的网页爬虫和数据提取工具

是一个开源的、为大型语言模型(LLMs)和AI应用设计的网页爬虫和数据提取工具。它简化了网页爬取和数据提取的过程,使其更加易于访问和使用。

2024-09-13 22:57:09 2648

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除