tencent__open-CSDN博客

转载腾讯混元开源翻译模型1.5，端侧可部署，效果超越商用API

技术方面，HY-MT1.5-1.8B能够用小尺寸实现大尺寸模型的效果，得益于On-Policy Distillation（大尺寸模型蒸馏）策略的引入，让 HY-MT1.5-7B 作为 Teacher，实时引导 1.8B 的 Student 模型，让其避免死记硬背标准答案，通过纠正在预测序列分布时的偏移，让小模型从错误中学习，切实提升能力。用户可通过简单配置导入术语库，模型将在翻译过程中优先采纳用户定义的标准术语，从而提升专业文档、技术手册、合同文本等内容翻译的可靠性与权威性。

2026-01-01 09:06:30 19

原创 11支团队用开源模型定义“耳朵经济”新范式——混元AI播客挑战赛放榜！

团队提供了“主题生成”、“RAG文档生成”和“混合模式”三种方式，特别是后两者能够基于用户提供的文档和链接进行内容生成，有效利用外部知识减少“幻觉”，符合评审专家对事实性和溯源能力的要求。腾讯混元AI播客于2025年8月正式上线，支持将文本、网页、文档一键转化为自然流畅的双人对谈式音频，它能把原本晦涩难啃的内容，变成一场有逻辑、有节奏的对话。针对音频合成速度远慢于文本生成的瓶颈，团队采用了“流式生成”方案，将脚本切分后分段合成音频并实时追加，以期让用户感觉不到等待，实现了“边生成边听”的效果。

2025-12-31 20:43:40 503

转载腾讯开源Kuikly框架能力、生态再升级，诚邀你携手，共筑跨端技术新生态

我们欢迎并鼓励所有形式的贡献，无论是代码PR、组件封装、技术分享，还是文档完善，你的每一份参与都让Kuikly。在社区不断壮大的过程中，从项目维护到社区治理，Kuikly团队将持续扮演“协调者”与“润滑剂”的角色，积极推动社区建设。为构建可持续、高活力的 Kuikly 开源生态社区，凸显每一位贡献者的参与价值，参照成熟开源社区的运行机制，我们制定了贡献者持续、深度参与的激励机制。为降低组件贡献门槛，Kuikly 社区提供了清晰便捷的贡献渠道与流程，同时配套完善的适配教程，助力开发者快速上手。

2025-12-30 15:24:54 15

转载薪火相传，共筑生态！OpenTenBase两大赛项圆满落幕，获奖名单荣耀揭晓！

在点评中表示，OpenTenBase多模态分析开发挑战赛参赛团队背景多元，既包括在校的博士生、硕士生和本科生，也有来自产业一线、从业多年的技术专家，整体竞争十分激烈。无论你擅长代码开发、技术测试，还是热衷于文档撰写、社区运营，这里都将为你提供展示自我的舞台、交流学习的平台、协同创新的沃土。让我们以此次大赛为契机，秉持“开放、协作、共赢”的开源精神，分享技术、碰撞思想、攻克难题，将个人成长融入社区发展，用集体智慧推动OpenTenBase技术持续迭代、生态不断完善。两大赛项决赛路演在深圳腾讯滨海大厦顺利。

2025-12-29 15:30:51 15

转载一键部署！OpenCloudOS 多项开源技术打造 “开箱即用” 的 AI 支撑底座

面对这一挑战，OpenCloudOS 社区确立了“重心在OS，延展至AI”的技术原则，以及“成为' AI时代最好用的OS'” 的目标，聚焦打磨OS内核、调度器、驱动兼容性、安全模块等传统优势领域，为AI工作负载提供独特的OS层价值，通过三大关键举措和多项技术创新，显著降低触及和利用异构算力的门槛，让开发者或企业能更专注于算法与模型的创新。用户在选择 HAI 服务时，可直接选用该镜像，瞬间获得一个稳定、高性能、无需手动配置的 AI-ready 云服务器，极大简化了云上AI应用流程。

2025-12-11 14:08:07 28

原创把20页论文“聊”给你听？这不是 AI 播客的终点

这不是科幻片段，而是像腾讯混元播客这样的 AI 播客正在做的事，试图成为你的“一对一学习搭子”，把复杂信息变成一段更容易消化的对话。当前技术常由一个模型扮演所有对话角色，导致“教授”和“学生”的对话缺乏真正的立场差异、知识背景和观点碰撞，听起来更像同一个人在自言自语。一位研究者告诉我们，在完成论文后，他会“听”一遍 AI 播客的版本，试图让多位不同“人生阅历”的角色，来。，是推动 AI 播客从“有趣”走向“好用”的关键，也是当前人机交互和 AIGC 领域共同探索的前沿。：“这个观点有数据支持吗？

2025-12-08 12:01:07 795

转载 WeKnora 开源重磅升级，ReACT Agent 智能任务驱动

本次升级采用 RAG + Agent 双驱动模式，并全面进化至基于 “推理-行动-观察”（Reasoning-Action-Observation）循环的新智能体架构，让AI能够像人类一样“边思考、边行动、边调整”，通过动态交互环境解决复杂任务。支持调用内置工具、MCP工具和网络搜索，通过多次迭代和反思，自主规划、拆解任务并提供全面总结报告，显著提升复杂任务处理的容错性和可解释性。随后，Agent开始自动调用知识库检索、联网搜索等工具，按规划逐步收集信息，进行深度对比分析。

2025-12-05 17:01:09 31

转载 OpenTenBase深耕PG技术生态，获年度开源影响力大奖！

始终在架构与生态两个维度持续拓展新的可能性：在架构层面，从集中式、云原生存算分离到分布式架构不断演进，以应对数据规模增长带来的挑战；在生态层面，则从原生。同时积极参与全球开源协作，推动数据库与人工智能的深度融合，让开源技术真正成为产业数智化转型的。、企业用户及开源爱好者，通过主旨演讲、专题研讨等形式，打造了一场兼具技术深度与社区温度的年度盛会。函数，实现文本生成、图像分析、情感识别等场景的库内关联分析，真正打通数据与智能的。，既是行业对其技术创新力与产业落地价值的认可，也是对开源生态共建的激励。

2025-12-03 08:45:34 29

原创行业级镜像性能难题？开源社区 OpenCloudOS 这样解！

在实现技术上，早期方案多依赖于 fuse（用户态文件系统），它虽然灵活，但也存在明显的短板：性能开销大，且一旦用户态进程崩溃，整个文件系统都可能不可用，稳定性堪忧。OpenCloudOS 诚挚邀请每一位关注基础软件发展的开发者，扫码了解入围团队的技术方案亮点，并持续关注决赛的后续角逐，共同见证下一代容器镜像标准的雏形诞生。在 AI 算力需求弹性极高的今天，这一问题被急剧放大。这就好比，大家都在一条年久失修的路上想办法跑得更快，有的给车换零件，有的自己修路，但始终无法从根本上解决道路本身的问题。

2025-12-02 17:30:27 564

转载下一代 AI 底座，需要怎样的 OS？｜2025 OpenCloudOS 操作系统大会全日程发布，席位有限，速来报名！

为主题，聚焦 AI 时代下的 OS 生态协同、技术创新与应用实践，汇聚全球操作系统生态的技术专家与行业伙伴，通过技术碰撞、成果发布与合作对接，共同打造更智能、更稳定、更安全的下一代操作系统底座。AI X OS 技术前沿：聚焦 AI Agent、多元算力优化、RISC-V、软硬件协同、供应链安全等热门技术，解锁 AI 时代 “底层技术必修课”可复用的最佳实践：腾讯云、中科院计算所、AMD、安谋科技等领先企业专家解析案例，带来可落地、可复用的实战经验。即刻报名，抢先入席，见证操作系统的下一次飞跃！

2025-11-28 15:09:36 101

转载混元OCR模型宣布开源，参数仅1B，多项核心能力SOTA

包括：德语、西班牙语、土耳其语、意大利语、俄语、法语、葡萄牙语、阿拉伯语、泰语、越南语、印尼语、马来语、日语、韩语翻译成中/英文，以及。HunyuanOCR 精通多语种复杂文档解析，同时兼具文字检测和识别能力，在票据字段抽取、视频字幕识别、拍照翻译等场景得到广泛应用。文字检测和识别能力，在自建覆盖了9大应用场景（文档、艺术字、街景、手写、广告、票据、截屏、游戏、视频）的基准上，大幅度领先。在文字检测和识别能力上，模型对文档、艺术字、街景、手写、广告、票据、截屏、游戏、视频等场景上表现卓越。

2025-11-26 17:56:14 96

转载腾讯云开源DeepSeek量化部署方案：性能最高提升3.9X！

实现TP并行需要设计一套新的权重加载逻辑，能够正确识别需要切分的权重（如专家MLP层的权重矩阵），并按照TP的策略（如行切分或列切分）将其均匀地切分到多个GPU上。EP并行时，每个 GPU 负责一部分专家（Experts），不同 GPU 上的专家各不相同，而TP并行是将单个专家（例如 MLP 的权重矩阵）在多 GPU 之间做切分，共同计算。，只对普通路由专家权重做 4-bit量化，可以在降低一半模型体积的同时，尽可能减小模型运行时精度损失，并且提升了权重读写带宽，进而加快了推理速度。

2025-11-19 15:29:31 60

原创腾讯开源百亿参数模型KaLM-Embedding，斩获MTEB多语言榜单全球第一！

随着全球化进程推进，多语言嵌入模型在多个关键场景中展现出重要价值，可支撑如跨境电商、跨国企业知识管理、多语言学术检索及AI应用国际化等实际需求，为技术落地提供底层语义理解保障。（检索增强生成）等主流架构中，Embedding模型能够从海量知识库中精准检索语义相关信息，动态构建高质量上下文，有效提升大模型生成结果的准确性与可靠性，抑制“幻觉”现象。借助更大规模语言模型，开展更丰富的数据合成与筛选工作，并通过训练蒸馏等技术路径，持续提升Embedding的表达能力与效率。

2025-11-12 14:52:45 328

转载开源实践：我的技术成长加速器 | 对话 OpenCloudOS 优秀贡献者黄振业

“在整个项目推进中，振业最让我印象深刻的，是他将 AI 技术与系统问题深度结合的创新意识，以及面对技术卡点时‘追根溯源’的钻研态度。让我们一同走进他的开源故事，聆听他的实践经历与技术感悟。同时，要学会利用开源社区的资源，不仅要‘用开源’，更要尝试‘为开源做贡献’，在这个过程中，你收获的不仅是技术能力，还有更广阔的视野和更紧密的行业连接。这次项目让我把 AI 技术和实际的系统问题结合起来，不再是单纯学习 AI 理论，而是学会了如何用 AI 解决具体的工程问题，这对我后续的研究和实践都很有帮助。

2025-11-10 14:35:56 49

原创多端开发背景下，腾讯的应对方式和效果如何？

在鸿蒙场景中，Kuikly 鸿蒙版对齐Android版高性能表现，与原生打开速度基本一致，对比 React Native 社区适配版快 6 倍，且内存占用更低。这主要得益于Kuikly将跨端Kotlin代码编译为各平台的原生产物，对接到各平台原生渲染，从而实现了多端原生级别的性能体验。目前在腾讯，Kuikly 已有20+业务深度使用，包括 QQ、腾讯新闻、QQ 音乐、搜狗输入法、QQ 浏览器等，服务业务的页面数1500+，日活用户超5亿，满足了这些业务在众多场景下的各类复杂需求。同时得益于其高性能表现，

2025-10-31 10:30:52 855

转载 OpenTenBase亮相中国软博会：展示新版本技术突破

博览会搭建起技术展示、协同创新与产业对接的核心平台，既让全球97%软件开发者依赖开源工具的行业共识得到具象呈现，更推动了开源技术从研发到落地的全链条贯通。正如开放原子开源基金会所践行的，开源通过共享与合作构建起数字世界的“人类命运共同体”，而软博会正成为这一共同体生长的重要土壤。新版本引入一系列强大的新特性，包括在线秒级改列、并行DDL（数据定义语言）、基于Undo的闪回查询、主备BP同步、异步大表删除、透明列压缩、列加密等，以满足业务生产中对线上变更、低成本和数据安全等多方面的需求。

2025-10-23 11:10:42 42

转载 11月1日，相约OpenTenBase城市行成都站

齐聚一堂，深度拆解OpenTenBase 5.0的新架构逻辑、解读实用新特性，还会分享真实场景下的实践应用案例，更将共同展望社区未来发展方向，干货满满，不容错过！而现在，与前沿技术面对面的机会来了——11月1日下午，OpenTenBase城市行将走进成都！我们特别邀请多位数据库领域资深专家，与成都的开发者朋友。下方附上本次活动具体日程，席位有限，想抢占与专家交流、获取一手技术动态的机会？AtomGit专区：https://opentenbase.atomgit.com。，它带来了全面升级的。

2025-10-21 17:30:33 46

转载个性化AI音乐触手可及：腾讯升级SongGeneration并开源自动化数据工具SongPrep

长序列建模能力：基于创新的LLM-DiT融合架构和超低比特率编解码技术，模型能够有效处理长序列音乐数据，确保长歌曲的结构连贯性与情感一致性。秉承腾讯开源精神，本次更新同步开源了高质量音乐数据生成方案SongPrep，解决了音乐AIGC领域高质量数据稀缺的核心痛点。内存优化机制：采用分层注意力架构和智能内存卸载策略，在保持48kHz高清音质的同时，大幅降低长序列生成的内存需求。这一方案可以将极大降低音乐AI领域的研究门槛，让更多开发者和研究团队能够基于高质量数据工具构建自己的音乐生成模型。

2025-10-17 17:31:03 91

转载 Angel强化工业级图平台，开启图大模型新篇章

Angel 是腾讯研发并开源的面向企业级应用的高性能分布式机器学习平台，功能特性涵盖了特征工程、模型构建、参数训练、AutoML、模型服务Serving等全栈机器学习服务，提供机器学习、深度学习、图神经网络等多种算法，支持级万亿级超大规模参数模型的训练，已在生产业务系统中大规模部署。，用于异构图的表示学习。在Angel中实现了归纳式学习范式 GATNE-I模型，后面都用GATNE来表示，异构图能够较好的处理更真实的业务场景，融合多多种类型的节点与边，在业务中取得较好的效果。

2025-10-15 17:23:22 82

转载 Youtu-Embedding 正式开源：腾讯优图推出高性能通用文本嵌入模型

在 RAG（Retrieval-Augmented Generation）场景中，高质量的文本嵌入模型可以为大语言模型（LLM）提供更准确、更上下文相关的外部知识，使生成的答案更加精确、可控与可解释。: 在权威的中文文本嵌入评测基准 CMTEB 上，以 77.46 的高分荣登榜首（截至2025年09月），证明了其强大的表征能力。通过开源共享，我们希望携手开发者，共同推动语义检索与 RAG 技术的普及，让每个团队都能轻松拥有强大的文本理解与检索能力。这一机制让模型能够基于。

2025-10-14 14:31:55 255

转载 tRPC-Agent-Go：构建智能AI应用的Go语言Agent框架

例如，当用户询问"帮我制定一个旅行计划"时，Agent会首先分析需求（PLANNING），然后推理最佳路线（REASONING），接着查询具体信息（ACTION），最后提供完整的旅行建议（FINAL_ANSWER）。支持创建自主Agent和半自主Agent，具备推理能力、工具调用、子Agent协作和长期状态保持能力，为开发者提供构建智能应用的完整技术栈。tRPC Agent的Callbacks模块还提供了一套完整的回调机制，允许在Agent执行、模型推理和工具调用的关键节点进行拦截和处理。

2025-10-11 18:04:44 304

原创告别AI音乐“塑料感”！腾讯开源模型SongBloom实现精度与质感的双重越级

另一类是基于自回归（AR）框架的方法，通常借助大规模语言模型，将生成过程拆分为语义阶段和声学阶段，先预测离散的语义token，再映射为声学表示，这种方式能够较好地保持歌词与旋律的时序一致性，但由于离散token在建模中不可避免地丢失细粒度声学信息，最终生成的歌曲在音色质感等方面容易出现质量下降。同时，模型具备极强的歌词 follow 能力，大幅减少 “幻觉生成”（生成内容与歌词不匹配）现象，显著降低了音素错误率（PER），让歌词准确性达到行业新高度。作为一款聚焦歌曲生成的创新模型，SongBloom。

2025-10-10 17:35:34 431

原创分布式KVCache多级缓存架构 - FlexKV正式开源！

当新请求到达时，GlobalCacheEngine 将比对各级存储中已缓存的 token 数量，智能决策是否从 SSD 或远端扩展存储拉取数据，并通过内存中转至 GPU，实现最优访问路径。负责初始化并管理三级缓存（内存 / SSD / 扩展云存储），保持与 GPU 内部 KV 形状（shape）完全一致，通过 block ID 快速计算物理偏移。，可将多个网络层（layer）的 KV 缓存合并为更大粒度的 block，提升 I/O 传输效率，降低单位访问开销。

2025-10-09 17:31:11 600

转载腾讯专有云企业版TCE Terraform Provider 正式开源！

这是一个基于基础设施即代码（Infrastructure as Code）工具 Terraform 开发的开源插件，旨在为 TCE 用户提供。以下示例展示如何使用 TCE Terraform Provider 创建一台 CVM 虚拟机、一块 CBS 云硬盘，并将云硬盘挂载到虚拟机上。我们诚邀广大开发者下载使用，探索 TCE 基础设施即代码的最佳实践，并欢迎社区贡献代码、提出建议与反馈。Provider，即可使用声明式配置高效、一致地管理 TCE 上的各类资源，的增、删、改等操作。帮助企业在多云架构下，

2025-09-29 17:31:08 111

转载混元图像3.0正式发布：开源，免费使用

背景是一片广阔的水域，水面平静，呈现出深邃的蓝色。提示词：新中式产品摄影风格，主体为带有 “环保茶” 等雅致文字与简约图案的浅绿色方形茶叶盒，场景设定在充满自然禅意的小景中，地面覆盖质感细腻的翠绿苔藓，搭配造型天然的枯树枝，周围点缀着花瓣柔美、绽放的白色茉莉花；你是一个小红书穿搭博主，请根据模特穿搭生成一张封面图片，要求： 1.画面左侧是模特的OOTD全身图 2.右侧是衣服的展示，分别是上衣深棕色夹克、下装黑色百褶短裙、棕色靴子、黑色包包风格：实物摄影，要求真实，有氛围感，秋季美拉德色系穿搭。

2025-09-28 15:00:30 726

转载名单揭晓｜2025腾讯犀牛鸟开源人才培养计划开源issue实践&开源课题考试获奖名单公布！

腾讯开源课题实战：完成腾讯问卷报名&入围腾讯开源课题实战阶段，参与并完成课题的学生及开发者将获得纸质版《优秀学生证书》（或《优秀开发者证书》）及腾讯周边好礼；完成课题且表现卓越的学生将获得纸质版《腾讯开源贡献者证书》（目前全球仅发放50+张）。腾讯开源issue实践：完成腾讯问卷报名&加入研学基地，认领并完成issue的同学，获得腾讯颁发的《腾讯开源实践》电子证书；腾讯开源基础课程：完成腾讯问卷报名&完成线上考试的同学，获得腾讯颁发的《腾讯开源研学结课》电子证书。获得《腾讯开源研学结课》电子证书。

2025-09-19 18:44:22 125

转载给大模型生图“去油”，混元这个新研究火了

SRPO（Semantic Relative Preference Optimization，语义相对偏好优化）通过在线调整奖励偏好，优化早期生成轨迹等手段很好的解决了这个问题。腾讯混元生图团队最近发布的工作SRPO受到了社区的热烈欢迎，项目在9月10日发布之后登上了HuggingFace热度榜榜首，定量指标达SOTA水平，人类评估的真实度和美学优秀率提升超过3倍，训练时间相比DanceGRPO降低75倍。该工作主要提供了文生图模型的强化算法，解决了开源文生图模型Flux的皮肤质感“过油”的问题，

2025-09-17 21:56:02 146

转载名单揭晓｜2025腾讯犀牛鸟开源人才培养计划开源课题实战获奖名单公布！

腾讯开源课题实战：完成腾讯问卷报名&入围腾讯开源课题实战阶段，参与并完成课题的学生及开发者将获得纸质版《优秀学生证书》（或《优秀开发者证书》）及腾讯周边好礼；完成课题且表现卓越的学生将获得纸质版《腾讯开源贡献者证书》（目前全球仅发放50+张）真实项目中不断提升专业技术能力，顺利完成项目任务，贡献着自己的力量。电子证书将于10月发放完毕，相关纸质证书及周边礼品将于30个工作日内邮寄发放，继续关注腾讯开源项目&贡献你的力量，期待明年能看到你们更精彩的表现！深度参与项目实战的同学们，在。同学获得对应的任务奖金。

2025-09-15 23:04:48 259

转载腾讯优图开源Youtu-GraphRAG：让图检索答案更准确，成本更划算！

比如，在企业知识库中，不仅能记录「产品A发布时间」（属性），还能清楚表示「产品A由团队B研发」（关系），并在此基础上形成关键词索引，最后自动聚合成社区结构。，主打大语言模型+GraphRAG模式，把知识组织成「图谱」，再交给大语言模型去检索和推理，帮助大模型在处理复杂问答类任务时减少「胡言乱语」，回答更精准、更可追溯。2）按照.env.example格式创建配置文件，创建并复制API key，`Youtu-GraphRAG`项目的`.env`文件中的llm部分中设置。，两步即可搭建智能体。

2025-09-12 18:12:50 396

原创不蒸馏也超强？揭秘端到端文档OCR模型 POINTS-Reader

因此，一个大的 ViT（视觉 Transformer）可能会成为一个显著的吞吐量瓶颈，这也是我们选择一个中等规模 ViT（POINTS1.5 中使用的 6 亿参数的 NaViT）的原因。然而，这一方案的成败严重依赖于训练数据的质量和规模，而这恰恰是其最大的瓶颈。从上图可以看出，随着迭代的进行，数据的质量在持续的提升（F1-score 不断增加），但是增长的数据变缓了。可以发现，在这个阶段对模型生成的数据从各个维度进行过滤，例如表格、公式，可以显著提升数据的质量，从而提升模型的性能。

2025-09-11 19:58:21 695

转载腾讯混元生图2.1开源！可写字、更高清、更一致、更可玩！

清晰的线条，扁平化的色彩。它的皮肤是与叶片完全相同的绿色，并带有浅绿色的纹理细节，实现了完美的伪装，几乎与背景融为一体。本次，混元还带来了一个开源的混元文本改写模型（PromptEnhancer）——这是业内首个系统化、工业级的中英文改写模型，能够对用户的文本指令进行结构化优化，丰富视觉表达，使改写后的文本生成图像的语义表现得到大幅提升。一幅超现实主义风格的悟空手办，人物漂浮在半空，身体部分化为液态银色金属，眼神锐利，手拿着金箍棒，背景是一条巨龙在云雾中盘旋，鳞片闪烁光芒，场景充满力量感，空中有闪电。

2025-09-10 17:38:33 202

转载再度加码AI编程，腾讯发布AI CLI并宣布CodeBuddy IDE开启公测

的“CodeBuddy IDE”则为独立IDE产品，在代码助手已有能力上进一步丰富，主打“对话即编程”，用户“无需一行代码”，仅需用自然语言对话就能实现应用从产品构想、设计、开发部署的全流程，让非技术背景的从业者也能快速实现创意，大幅提升软件开发效率。腾讯云开发者产品总经理刘毅表示：“全球范围内同时支持这三种形态的AI编程工具较少，而CodeBuddy不仅覆盖全场景，更融合腾讯的云原生能力与开发者生态，并通过底层技术打通了三者间的模型与能力协同，满足开发者‘随时随地、按需切换’的高效需求。

2025-09-10 17:38:33 301

转载 60W奖金花落谁家：腾讯云数据库技术创新解密与赛项解析会，邀你参加！

OpenTenBase 多模态分析交流群。OpenTenBase TXSQL交流群。欢迎进群获取报名攻略。

2025-09-09 19:17:22 55

转载 50W奖金花落谁家：混元赛项解析会，邀你参加！

欢迎进群获取参赛攻略。

2025-09-08 18:09:00 56

转载混元游戏2.0正式发布，全面开放使用

（体验网址为https://hunyuan.tencent.com/game/，腾讯混元官网-创作者社区-行业专区-游戏-立即体验）这是依托混元大模型打造的首个工业级AIGC游戏内容生产引擎，大幅优化游戏资产生成与游戏制作流程，让游戏美术设计效率提升数十倍。9月5日，"混元游戏"（腾讯混元游戏视觉生成平台）发布全新2.0版本，新增。针对游戏美术设计场景进行深度优化，让模型更懂游戏美术、更能理解游戏美术的。等生成能力，专项优化游戏场景、游戏道具物品、游戏角色。动态内容生成、风格定制化、细节优化等痛点，

2025-09-07 11:01:24 203

转载 20W奖金花落谁家：OpenCloudOS操作系统赛项解析会，邀你参加！

赛题详情点击“阅读原文”欢迎添加小助手了解更多。

2025-09-05 18:13:42 52

转载拿下30个第1名的腾讯混元翻译模型，开源！

自2023年亮相以来，腾讯混元积极拥抱开源，通过开放自研技术，推动大模型技术的共享和突破，在推出翻译模型之前，已经陆续开源了业界领先的文生文、文生图、视频生成和3D生成能力和相关工具集插件，提供商业模型性能的模型服务，相关模型多次登顶开源社区热度榜榜首。其次是部署友好性，Hunyuan-MT-7B能够在更多样化的硬件环境中部署，从高端服务器到边缘设备都能良好运行，并且模型的部署成本、运行成本和维护成本都相对更低，在保证翻译质量的前提下，为企业和开发者提供了更具吸引力的解决方案。

2025-09-04 18:03:57 234

转载混元世界模型上新，综合能力问鼎WorldScore排行榜

另一方面，直接生成3D形式的世界场景，虽具备更好的空间结构的一致性和交互应用的拓展性，却受限于3D训练数据稀缺与3D表征内存效率低下等问题，无法泛化到更多的类别和更大场景中。同时，在输入端加入3D条件保证画面视角精准，输出端直接生成3D点云，适配多种应用场景。的特性，与此前已开源的混元世界模型 1.0 高度适配，可进一步扩展 1.0 模型漫游范围，提升复杂场景的生成质量，并可对生成的场景做风格化控制和编辑。此前，混元已陆续开源业界领先的文生图、视频生成和3D生成能力，提供接近商业模型性能的开源模型，

2025-09-02 18:30:46 165

转载 OC Auto-POC 正式开源！一键搞定OS深度测试，释放系统潜能

目前 Auto-POC 脚本可用于执行一系列的系统测试任务，包括用户管理、系统配置、YUM 操作、磁盘 I/O 测试、内存稳定性测试、CPU 稳定性测试以及 UnixBench 测试。请在可以访问 OpenCloudOS 镜像站的机器中构建，构建机的系统需要是 OpenCloudOS 8 及以上版本（需要用到新版 dnf 包管理器）。由于构建 tar 包的系统与待测试系统的系统版本和架构很有可能不同，因此需要注意在。3）依次执行测试套件中指定的测试项（如基础功能、完整性）。

2025-08-31 11:01:03 143

转载混元开源又+1：视频音效可以自动生成了

例如，当输入一段包含海浪、沙滩人群及海鸥的视频，且文字描述为 “海浪声” 时，HunyuanVideo-Foley 不仅能精准生成与海浪画面同步的波浪音效，响应文本需求，还能捕捉视频中人群交谈的声音、海鸥盘旋的鸣叫声，甚至根据场景氛围自然融入轻柔的背景环境音，形成层次丰富的复合音效。这种对文本描述与视频细节的双重响应，避免了 “顾文失画” 的问题，让生成的音频与整体场景高度契合，显著提升视频观看的沉浸感。当前AI生成视频的能力越来越强，但视频音效生成仍然跟不上节奏，现有的音频生成技术。

2025-08-28 15:02:39 203

Spark on Angel：Spark机器学习的核心加速器

空空如也