kkk12344-CSDN博客

原创大模型分析（三）：LLama

LLama是大模型开源的主力（虽然开源原因待商榷）

2025-04-24 12:15:41 159

原创 AI软件栈：推理框架（二）-Llama CPP1

Llama CPP的主要构造，GGUF和GGML为两个主要部分，包括模型描述文件和模型参数存储文件。

2025-03-16 23:45:13 312

原创 AI软件栈：代码优化

x2;y2∗xx2;y4x0;y2∗xx0;y0x10;y2∗xx10;y=<<1。

2025-01-22 01:42:46 528

原创 CS：程序加载的策略

通过虚拟内存虚拟内存虚拟内存页映射页映射页映射和内存交换内存交换内存交换实现了对程序的真实内存地址、程序加载和内存管理问题，任何程序运行都可以把内存当做一个完整连续空间来使用。

2025-01-21 01:08:49 804

原创 BEV+Transformer的智驾：BEVfusion

BEV+Transformer的智驾关键要素：感知融合的视角转换（从最初的分离视角各自判断的后融合转换为将信息融合到BEV视角下，为该视角提供信息）关键技术：融合对象的差异（基于图像 or 基于图像+雷达 or 其他更多模态），融合方式的区别（基于CNN的特征提取 or 全盘Transformer）未来趋势 3D occupancy？端到端BEV fusion多sensor融合对准确和可靠的AD系统是十分必要的。在此之前的基于point-level融合的方案基本都是采用图像特征来增强LiD

2025-01-20 09:05:26 393

原创 AI软件栈：中间表示

ab∗cADDabtMULtcqtq。

2025-01-20 01:40:40 794

原创 BEV+Transformer的智驾：MV2D

BEV+Transformer 的智驾关键要素：感知融合的视角转换（从最初的分离视角各自判断的后融合转换为将信息融合到BEV视角下，为该视角提供信息）关键技术：融合对象的差异（基于图像 or 基于图像+雷达 or 其他更多模态），融合方式的区别（基于CNN的特征提取 or 全盘Transformer）未来趋势 3D occupancy？端到端MV2D fusioncamera 提供了丰富的纹理数据，但是radar带来了准确的空间信息。依赖单模态通常会受限基于优化的query融合机制，通过

2025-01-19 01:07:41 416

原创端到端多模态智驾：Open EMMA

端到端多模态智驾基于AI、Senor技术以及高性能计算，AI发展迅速。但是，真是场景的不可预测性、交通模式的多变以及复杂的道路环境都对AD提出了显著挑战解决AD的复杂挑战需要随机推理能力、允许AD系统深入理解上下文信息、预测用户意图并作出

2025-01-18 10:34:56 203

原创深度学习加速性能分析与Roofline Model

可以划分为两个瓶颈趋于，包括计算瓶颈（“屋顶”的高度）和带宽瓶颈（“房檐“的斜率）会有两种形态，包括提供更大带宽带来的。所以整个形态类似屋顶形状。Roof-line刻画的计算强度。根据定义可以得到，计算强度。

2025-01-17 09:05:50 997

原创 AI软件栈：Runtime&Driver&Firmware

Runtime支持程序从编译结果向执行过程中的资源管理、进程管理、信息交互Driver完成IP向系统的注册完成运行过程中与系统侧的信息交互、指令响应和异常反馈Firmware支持硬件信息的配置完成中断等异常行为在硬件侧的整理和上报RuntimeDriverFirmware系统系统硬件

2025-01-17 00:32:30 192

原创大模型分析（一）：COSMOS-英伟达世界基础模型WFM

Nvidia的世界基础模型（World Foundation Model，WFM），针对物理世界AI的任务而构建。该模型可以基于下游特定任务需求进行微调。COSMOS包括了一整套的视频管理流程、预训练模型、基于预训练WFM的后训练示例以及视频的tokennizers方法。

2025-01-16 08:48:20 269

原创 AI软件栈：目标代码生成

核心技术。

2025-01-16 01:16:29 215

原创运行时系统

程序完成编译后，进入执行阶段（包括裸驱和OS），如何进行资源管理、运行状态提取、异常响应等工作。** 一段代码的构成 **

2025-01-15 00:44:20 125

原创 SemiKong的解读

LLM展现出解决半导体行业的一些重要问题的潜力。但是当前的模型缺少解决这些问题的内在的物理及化学半导体设备及流程的知识。：提出SemiKong，第一个半导体领域基于工业LLM，提供了可开发裁剪的基础模型。：开发一个基础模型，达到专家级别的可以理解刻蚀问题的基础模型：（a）构建深刻的半导体相关的文档（）；（b）创建具有含额度半导体知识的基础模型；（c）引入一个框架，来集成专家知识，由此提升特定领域AI模型的评估过程。

2025-01-13 09:02:15 444

原创 DDD驱动设计的一些基本理解

业务成功的主要因素和核心竞争力 | 多个子域使用的通用功能 | 既不包含与产品和公司核心竞争力的功能，也不包含通用功能的子域。核心阈 | 通用阈 | 支撑阈。

2024-08-26 23:10:55 127

原创关于开源许可协议

引用开源代码之后是否可以保留知识产权，针对不同的开源协议要进行开源扫描。基于BSD、MIT和Apache三种是可以闭源。但是基于GPL、LGPL和Mozilla的开源方案必须同步开源。

2024-08-21 16:30:56 385

原创架构分析（CPU：ARM vs RISC-V）

对比 N2和V2，整体架构具有一致性。保证。

2024-07-30 00:07:51 255

原创 Reminder related with work

价值贡献值的几个要素工作量化（强化自身工作的可量化特性）通过不同的方式量化自身工作，一方面不断改进；另一方面可以迅速让其他人明白贡献度工作贡献成为领域的专家构建上下游的认可不断拓展变量的范围（例如不同任务、不同约束）多维度看问题尽量少以主观感受或者主观喜好评估工作的重要性；对事情的认知正确性很大程度上来源于认知事物的角度，切记盲人摸象；

2024-07-20 23:10:20 243

原创【Tech Point】

关键技术：

2024-07-02 09:07:14 261

原创 DevOps

关于DevOps的理解和要素

2024-07-01 23:30:01 303 1

原创 DevOps

DevOps的理解与要素

2024-07-01 23:22:48 275

原创 Tesla的自动驾驶

HydraNetBEVOccupancy。

2024-02-18 11:34:22 354

翻译正定矩阵的稀疏张量分解

这是一篇来自PAMI的论文《Tensor Sparse Coding for Positive Define Matrices》1. 全文的组织架构Section 1. Introduction，主要介绍了当前基于正定矩阵的稀疏编码方法与传统的基于矢量化的稀疏处理方法的区别。同时附带分析了正定矩阵的性质以及正定矩阵的应用场景。Section2. 简要介绍了Region Cova

2017-04-01 12:22:37 1144

原创如何写好一篇SCI论文

前言：写好一篇论文对新手来说是个不小的难题。咬破笔头终于凑够了字数，又犹犹豫豫感觉漏洞百出，最后投稿时感觉自己左支右绌，反正整个过程都充满了磕磕盼盼。正文：写好一篇论文需要注意的点有哪些？基础篇：1.杜绝错别字。对于英文文献来说，不要出现病句。（比如无主语的句子，最好不要使用祈使句和疑问句，在全文内部，包括图和引用文献，请统一语言，如果投英文期刊，一定不要出现汉语。写科技文需要牢记写作目的

2017-03-24 17:28:42 2105

原创基础问题

Python定义的基本函数print "Hello, Python!"; 问题在于新版本修改了函数的使用方式 print ("Hello, Python!");raw_input("\n\nPress the enter key to exit.") 提示：NameError: name 'raw_input' is not defined

2017-03-22 17:20:24 334

原创 The 5th weekly record

Paper阅读：关于 An introduction of compre

2014-10-03 22:52:32 348

转载 Every day ，have you reached it？

The most important thing is what I consider to be sufficient amount of time and effort in the lab work. I mentioned that about 60 hr working time per week is what I consider the minimal time an averag

2014-05-22 22:37:37 326

空空如也

空空如也