logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

AI 算力的科学衡量与计算方式

在这些应用中,对于一些实时性要求较高的任务,如图形渲染、音视频处理等,单精度浮点数能够提供足够的精度,并且在存储和计算上更加高效,能够满足实时性和资源限制的需求。我们知道,计算机是以 0 和 1 构成的二进制数字进行运算的,比如在基础的二进制里,1 就是 1,2 就变成了 “10”,3 是 “11”。算力(Computational Power):指计算机系统的运算能力,涵盖了 CPU、GPU、T

文章图片
#人工智能
Cursor 编程实践 — 开发环境部署

为了更方便地向 LLM 提供上下文信息,Cursor 内设了 @ 注记符,使用 @ Add Context 注记符能够方便地注入对应的上下文信息到 Chat 对话框中。Cursor IDE 是 VS Code 的一个分支,所以如果你已经在本地使用了 VS Code,那么可以直接导入 vscode 配置到 Cursor IDE 使用。例如:我现在有关于银行客户的数据样例,主要想做“银行信用:对银行客

文章图片
#人工智能
GPU/CUDA 发展编年史:从 3D 渲染到 AI 大模型时代(上)

要彻底搞明白 GPU 和 CUDA 的运行原理并不容易,而回顾技术的发展历史则是知其然且知其所以然的一个好方法,所以本文会使用篇年纪的方式进行写作。

文章图片
#3d#人工智能#单片机
隐私计算 — 联邦学习 — Overview

随着计算机算力的提升,机器学习作为海量数据的分析处理技术,已经广泛服务于人类社会。传统的机器学习算法需要用户将源数据上传到高算力的云服务器上集中训练,这种方式导致了数据流向的不可控和敏感数据泄露问题。简而言之,机器学习技术的发展过程中面临两大挑战:为了解决以上问题,谷歌提出联邦学习(FL, federated learning)技术,其通过将机器学习的数据存储和模型训练阶段转移至本地用户,仅与中心

#人工智能#深度学习#机器学习
GPU 超级节点:AWS Trainium UltraServer

Trainium1 于 2020 年发布,使用 NeuronCore-v2 核心,是一款用于专注于 AI/ML 训练的加速芯片,支持 BF16 和 FP32 进行高精度训练,以及支持 TF32、FP16 和 INT8 以提高效率,还配备了专用的集合通信库芯片。可用于训练数十亿参数的大模型。2024 年,AWS 宣布了下一代 Trainium3 芯片,采用 3nm(纳米)制程,预计将比 Traini

文章图片
#aws#云计算#人工智能
人工智能发展史 — 物理学诺奖之 Hopfield 联想和记忆神经网络模型

约翰·霍普菲尔德(John Hopfield)文学士、物理学博士,研究领域横跨物理学、分子生物学、神经科学、计算机科学,是一名以推动跨学科交叉融合而闻名于世的科学家,其推动了物理学与生命科学、人工智能的交叉融合,被誉为 “扩展统计物理学边界的先驱”,获得了 2024 年的物理学诺贝尔奖。霍普菲尔德早期是理论物理学家,专注于固体物理和量子力学,研究电子行为与能量状态,在激化子、长程电子输运等方面有极

文章图片
#人工智能#神经网络#深度学习
人工智能发展史 — 物理学诺奖之 Hinton 玻尔兹曼机模型

因此,Geoffrey Hinton 等人在 1985 年发表论文《A learning algorithm for boltzmann machines》,提出了受限玻尔兹曼机(RBM),通过限制隐藏单元之间和可见单元之间的连接,简化了玻尔兹曼机的架构,即:隐藏单元本身之间没有连接,可见单元本身之间也没有连接。1958 年,大卫·考克斯提出了逻辑回归模型,这是一种广义的线性分类模型,数据公式与感

#人工智能
大规模 RDMA AI 组网技术创新:算法和可编程硬件的深度融合

对于上述问题,HPCC 的核心思想是利用 INT(In-Network Telemetry,在网遥测)技术来提供精确的链路负载信息,并以此来计算出准确的 Sender 速率更新数值,并且实践发现 HPCC 在大多数情况下仅需要 Sender 更新一次速率,而无需迭代更新。TIMELY 算法的核心思想是通过测量报文的 RTT(端到端往返时间)来动态调整 Sender 的发送速率,基于 RTT 的变化

文章图片
#人工智能
隐私计算 — 安全多方计算 — Overview

多方安全计算(Multi-Party Computation,MPC)的概念在 1980 年代由由姚期智院士以经典的 百万富翁难题” 提出:MPC 可以保障多个参与方进行协同计算并输出计算结果的同时,使各个参与方除了计算结果之外无法获取任何其他信息,从技术层面实现数据的可用不可见。实现方案主要包括:...........................

#大数据
    共 117 条
  • 1
  • 2
  • 3
  • 12
  • 请选择