SUNX-T-CSDN博客

原创【LLM开发】Unigram算法

参考书籍：Unigram 算法是一种基于概率的子词分词方法，与BPE算法、WordPiece算法不同，其核心思想是通过逐步删减初始大词汇表优化分词结果。

2025-04-28 16:42:29 852

原创【LLM模型开发】WordPiece算法

模型首先需要生成一个小的初始化的基础词表；首先将所有字符、词添加到词库中，并需要预先设定词库的规模。首先，对语料进行预分词（按空格切分、按语系切分等等）；各出现一次，所以得分最高；因此作为第一个被合并的字符。但是WordPiece算法计算的是实质是条件概率。这里得分最高的字符对事。，因此合并这两个字符；在词汇表中出现一次，

2025-04-28 16:40:36 578

BPE算法是一种贪婪算法：为了以最有效的方式表示语料库，BPE 在每次迭代时都会通过查看其频率来检查每个可能的合并选项，并且每次合并那些出现频率最高的合并对。如果我们 token化不在训练语料库中的字符，则该字符将转换为未知 tokens，这就是为什么许多 NLP 模型在分析带有表情符号的内容的结果非常糟糕的原因之一。尽管每个字符的字节数可能不同，但是一个字节都是8bit，这样，基本词汇表的大小就很小（（恰好没有一个词是重复的，如果语料库中存在重复词汇，也只会在单词集合中出现一次）

2025-04-28 16:35:05 628

原创【大模型】分词粒度

有一个房子，我们可以将房子拆分为厨房、卧室、客厅、卫生间…可以继续拆分为砖、水泥，玻璃…，这又是一种更细的粒度；砖、水泥、玻璃都可以被继续分解为沙子、泥等；这还是一种粒度，因此，房子到底是由什么组成的，取决于从哪种粒度上进行分析。分词粒度是一种要从哪种角度进行分词的；可以包括字符级（character level）、单词级（word level）、子词级（sub-word level）、字节级（byte level）分词按照词的子词进行分词，类似于利用词根词缀来进行分词。如果按照句子中的空格进行分词，

2025-03-28 16:17:09 230

原创【大模型开发】将vocab解码

对Qwen vocab.json文件进行解码

2025-03-26 14:54:06 731

原创【大模型开发】Tokenizer的常用方法和属性

本文记录一下的transformer库中Tokenizer中常用方法和属性。

2025-03-26 10:44:49 733

原创【大模型】tokenizer 中编码过程

语言模型tokenizer中编码过程

2025-03-25 11:07:04 707

原创 Unicode代码点与编码

Unicode 属于编码字符集（CCS）；其为每个字符映射为一个唯一的数字编号；这个数字编号被称为对应字符的代码点。

2025-03-24 22:43:50 897

原创【leecode】接雨水

力扣接雨水问题

2025-03-13 15:31:45 875

原创【毕业论文编写指南】三线表设置

三线表是论文中一种比较优雅的表格表现方式。

2025-03-10 19:56:09 1469

原创【毕业论文编写指南】页眉设置

毕业论文通常需要设置论文的页眉，而页眉可能会要求**奇数页写本章标题，偶数页写学校名+硕/博士论文**

2025-03-10 11:17:29 540

原创【毕业论文编写指南】公式右对齐

毕业论文以及小论文常常会要求公式右对齐。表达式需另行起排，原则上应居中，用阿拉伯数字分章编号。序号加圆括号，右顶格排。本文讲解几种常见的论文公式右对齐的设置方法。

2025-03-10 10:13:48 939

原创【毕业论文编写指南】图表目录或图表清单

毕业论文中往往有一个图表目录或者是图表清单；需要交叉引用生成，如何实现呢？

2025-03-07 15:24:40 508 2

原创【毕业论文编写指南】图表题注设置

对于毕业论文中的图表题注，学校可能有这样的要求；`图x.x xxxxxx`；其中`x.x`表示章节号.章节中第x张图片。这如何设置呢？

2025-03-07 15:12:22 311

原创【毕业论文编写指南】设置全文的英文字体

毕业论文调整全文英文字体，

2025-03-07 14:49:21 1066

原创【强化学习】乐观初始值（Optimistic Initialization）

乐观初始值（Optimistic Initialization）是强化学习中一种常用的探索策略，用于引导智能体优先探索那些尚未尝试过的动作。的初始值设为一个比其真实值更大的值，从而鼓励智能体尝试每个动作至少一次，以发现潜在的高回报动作。适用性受限：在非平稳环境（奖励分布随时间变化）中，固定的乐观初始值可能失去作用，无法适应环境变化。2.保证探索：未尝试的动作因其高初始值而具有吸引力，智能体会主动尝试这些动作，避免陷入局部最优。1.简单有效：无需复杂的随机性控制，仅通过设置初始值即可实现探索。

2025-02-07 12:21:23 762

原创【逻辑学导论】2.1 论证的重塑

3.种族多元的政府常常比单一种族的政府拥有更低的社会支持，当人们因为种族而被划分的时候，他们就不会觉得是和其他人紧密联系在一起的，也就不太会相信互助程序。这样，错误的总是对方。7.太空中所包含的原子是不可数的，促使它们散向各处的力如同驱使它们来到这个世界的力一样也是不可数的。3.得州在没有辩护的情况下，干涉了这些申诉人的私生活，并且通过将他们受到保护的私人性行为判定为违法而贬低这些申诉人。2.申诉人的行为在上述自由的领域之中，因此根据宪法，他们有绝对的权利行使上述行为而不受到政府的干涉。

2025-02-07 10:00:57 934

原创【逻辑学导论】1.6 有效性和真实性

这个例外就是使得有效论证有效的组合：一个有效论证不可能前提都为真而结论为假，因为它的前提与结论是有逻辑必然性关联的。一个论证是有效的，当且仅当它不可能有真前提和假结论，当且仅当其结论是从其前提逻辑必然地推导出来的。论证的有效性和无效性关注的是前提与结论的必然性，也就是说前提与结论必然联系则是有效论证。如我们所知，这个论证的结论是真的；从例Ⅴ和例Ⅵ可以看出，很显然我们不能从一个论证有假前提和真结论这个事实分辨出这个论证究竟是有效的还是无效的。但是，可以明确的是，一个有效的论证不可能前提都为真而结论为假。

2025-02-06 23:22:09 491

原创【逻辑学导论】1.5 演绎论证和归纳论证

演绎论证则是确定的。因此，对于归纳论证而言，新的发现可能会最终否定结论，因此永远不能说明归纳论证的结论是完全正确的。归纳论证仅为它的结论提供一定的支持，前提授予结论的或然性越高，结论的价值越大。当一个论证断言其前提对结论的真提供了无可辩驳的根据时，这个断言可能是正确的也可能是不正确的。演绎论证中，其断言前提为结论的真提供了决定性的支持，即断言如果其前提为真，那么结论一定也是真的。一个有效的演绎论证的结论是从其前提必然地推出的，而这种有效性不是一个程度问题，也不以任何方式依赖于任何其他可能的情况。

2025-02-06 23:15:15 445

原创【机器学习理论】朴素贝叶斯网络

朴素贝叶斯做出了一个假设”属性条件独立假设“：对所有已知标签的样本，假设每个属性独立地对标签结果产生影响。（这是一个很强的条件）先验概率：对某个事件发生的概率的估计。可以是基于历史数据的估计，可以由专家知识得出等等。一般是单独事件概率。后验概率：指某件事已经发生，计算事情发生是由某个因素引起的概率。一般是一个条件概率。条件概率：条件事件发生后，另一个事件发生的概率。贝叶斯公式基于先验概率，计算后验概率的方法；对于连续属性可考虑概率密度函数，假定。的样本组成的集合，则条件概率。对于离散属性而言，令。

2025-02-02 00:05:40 1623

原创【机器学习理论】生成模型和判别模型

生成模型和判别模型是机器学习中两种不同的建模方式。生成模型关注的是联合概率分布PXY，即同时考虑数据X和标签Y的关系；判别模型则直接学习条件概率PY∣X或决策边界。

2025-02-01 21:18:24 837

原创【逻辑学导论】1.4论证与说明

论证的前提：）1戴维·伯恩斯坦(David Bernstein)在2001年的《唯一补救之地：非裔美国人、劳动法与从重建到新政的法院》之中将劳动法置于美国黑人当代困境的中心。论证的前提：1）社会被市场浸透得越来越严重，经济上的成就比任何其他的东西都得到更多的重视。用来说明的是如下内容：当人类居住在与赤道有不同的距离进而需要得到不同程度的抵御太阳光线的保护措施之时，不同的肤色进化出来了。说明的内容是：圣诞节的时间确定及其许多庆祝仪式有着基督徒庆祝基督生日之外的其他根源，也可能先于基督徒对基督生日的庆祝。

2025-01-30 16:56:13 733

原创【逻辑学导论第15版】A. 推理

最重要的原因在于目前出现了很多在判刑后通过调查免除死刑犯罪行的事件，其中包括在最近18个月里通过长期审判调查而获释的十位囚徒，他们并没有犯下被控的谋杀或强奸罪行。7.当诺亚·韦伯斯特提出《美国英语词典》的计划时，19世纪早期针对他的批评家做出了如下论证：“对于美国来说，任何新词不是愚蠢的就是外来的，因此没有所谓美国英语的东西，有的只是糟糕的英语。6.好的感觉能力是这个世界上分布最为平均的东西，因为所有的人都认为他们自己拥有的足够多，以至于即便是在其他事情上最不容易被满足的人也不会要求更多的感觉能力。

2025-01-29 22:44:11 923 2

原创【conda】Ubuntu 24.04 安装CUDA 12.04

请在Download栏下寻找具体的下载地址（该包实际上是由Debian，Ubuntu 24.04可以正常使用，请下载和自己电脑架构一样的包 amd 或者 arm）。下载好以后（理论上可能下载到本地Download目录下）；（别担心，Ubuntu 24.04能安装CUDA 12.4）该显卡驱动最高支持12.4的CUDA（不想升级显卡驱动）安装了Nvidia驱动，但是550版本的。，目前网上搜到的信息好像不是很适配。这里提供一个新的方案来安装。简单地说，就是安装不上。

2024-12-26 11:23:04 3379 3

原创【python代码编写】命令行参数解析

则可以通过这种方式传递并运行参数。假设上述python代码保存为。模块来解析命令行参数。在python中使用。

2024-12-23 19:22:49 222

原创【强化学习】同轨策略和离轨策略

同轨策略”和“离轨策略”是描述策略评估或优化时使用的策略类型。

2024-12-09 10:50:23 323

原创【强化学习】预测问题和控制问题

强化学习在强化学习中，广义策略迭代是一个有价值的概念，它结合了和两个过程。

2024-12-05 11:09:34 903

原创博客摘录「强化学习 1 —— 一文读懂马尔科夫决策过程（MDP）」2024年7月19日

决强化学习问题意味着要寻找一个最优的策略让个体在与环境交互过程中获得始终比其它策略都要多的收获，这个最优策略可以用 π ∗ \pi_*π ∗ 表示。一旦找到这个最优策略π ∗ \pi_*π ∗ ，那么就解决了这个强化学习问题。一般来说，比较难去找到一个最优策略，但是可以通过比较若干不同策略的优劣来确定一个较好的策略，也就是局部最优解。

2024-07-19 15:31:49 199

原创【python】通行网格地图四叉树化 (leeccode 427)

想将由0和1组成的网格地图绘制为四叉树地图，0表示可通行网格，1表示不可通行网格。受到Leecode 427题的启发，

2024-06-13 21:47:40 479 3

原创【C++】priority_queue的用法(模板参数的实例)

对于自定义类型优先级队列，则必须重载operator

2024-06-13 10:43:48 606

原创【ROS2】ModuleNotFoundError: No module named ‘learning_interface.learning_interface_s__rosidl_typesupp

不知道怎么解决这个问题。

2024-06-05 15:43:55 605 5

原创【C++】编写CMakeList.txt

【代码】【C++】编写CMakeList.txt。

2024-06-03 16:57:28 325 1

原创【Python】setup.py build_ext --inplace解释

setup.py build_ext --inplace是用于构建和编译Python扩展模块的命令。它的主要用途是在开发期间将编译生成的扩展模块放置在源码目录中，而不是默认的构建目录。并生成一个共享库文件（例如在Linux上是。可以包含如下定义扩展模块的代码（文件，在Windows上是。文件），并将其放置在。

2024-06-03 09:17:09 2810

原创【Python】setup.py文件中Extension函数详解

Extension是setuptools模块中的一个函数，用于定义需要编译的C/C++扩展模块。它的参数用于指定扩展模块的名称、源文件及其他相关配置。以下是。

2024-06-03 09:05:58 1865 1

原创【论文导读】Grid Graph Reduction for Efficient Shortest Pathfinding（2023 Access）

并且自己用了两张图做了一下实验，采用的地图来自于(Benchmarks for Grid-Based Pathfinding)[https://movingai.com/benchmarks/grids.html]，分别是random-512-20-6、maze-512-4-4和Shanghai-1-1024地图。Dead-end模式（死胡同模式）：网格地图中存在一些可通行网格，它们通常被障碍物网格包围，当这些网格不是起始网格或目标网格时，它们将不是构成路径一部分的网格，因此没有必要进行计算和搜索。

2024-05-30 23:56:22 1381 3

Theta*算法MATLAB实现

ATM模拟 C语言

空空如也