- 博客(8)
- 收藏
- 关注
原创 数值分析-牛顿插值多项式总结
为了方便理解数值分析的差商表计算原理,这里提炼了核心知识。0.均差的基本概念这里不再阐述。1.均差定义(均差的递推数值计算方法)事实上除了一阶均差,更高阶均差都是根据这个式子定义的。(利用求解的方法过于模糊)要得到这个式子,不妨将2中的均差性质变形处理。该式揭示了均差的计算方法,只要根据该式,便可以递推地计算出所有均差,但是合法性比较模糊,下证合法性。2.均差性质结合1使用数学归纳法证明。这说明均差和节点的排列顺序无关。注意归纳奠基的过程要用到均差的最原始定义,即一阶均差的概念。3.
2021-09-17 20:00:06
2164
原创 学习:费马小定理和模生成环什么时候为域的问题
1.引理1:若ac=bc(mod e),且(e,c)=1,则a=b(mod e)十分易推。ac=bc(mod e),则(a-b)*c=0(mod e),又由于(e,c)=1,故a-b=0(mod e),q.e.d2.引理2:若a=b(mod e),c=d(mod e),则ac=bd(mod e)显然。设a=n1 * e+k1,b=n2 * e+k1,c=n3 * e+k2,d=n4 * e+k2,则ac=…+k1 * k2(前面省略了e的整数倍项),bd=…+k1 * k2,故有:ac=bd(mod
2021-09-03 19:32:10
261
原创 笔记:pipeline浅尝
简介:pipeline可以使代码更清洁,简化ml的步骤前序步骤—代码预处理由于非重点,这里简略pipeline的导入导入:from sklearn.pipeline import Pipeline步骤1:预处理步骤定义————导入from sklearn.compose import CloumnTransformerfrom sklearn.preprocessing import OneHotEncoderfrom sklearn.impute import SimpleImputer
2021-08-16 17:03:41
166
原创 笔记:ml常用库函数和重要步骤汇总
1. mean absolute error的衡量导入:from sklearn.metrics import mean_absolute_error用法:mean_absolute_error(predict,valid)2.RandomForestRegressor的导入(分类器同理)导入:form sklearn.ensemble import RandomForestRegressor用法:model1=RandomForestRegressor(n_estimators=’ ',rand
2021-08-15 11:33:47
352
原创 笔记:各种类型变量及处理方法
变量类型1.Nominal:定类变量,无关联的标签无任何运算方法2.Ordinal:定类变量,空间中具有大小关系的各个点的集合支持比较运算3.Interval:定间隔变量,空间中具有大小关系的子空间的集合,支持比较运算,间隔恒定。4.Ratio:定比变量,支持四则运算。编码方法1.one hot encoding(升维编码)运用n维向量表示特定变量,各变量间必须线性无关2.label encoding(一维编码)直接给变量赋值,比如变量1->1,变量2->2,各变量间无明显比较
2021-08-14 22:24:03
647
原创 笔记:pandas中axis 的含义
当axis=1时,数组的变化是横向的,而体现出来的是列的增加或者减少。简称之为横向堆叠。当axis=0时,数组的变化是纵向的,而体现出来的是行的增加或者减少。简称之为纵向堆叠。以下以table1为例比如 table1.isnull().sum(axis=0)方法,当axis=0时纵向堆叠运算前column1column2column3column4row11234row2124运算后column1column2column3.
2021-08-14 20:07:54
289
原创 2021-08-12
个人粗浅理解笔记1以决策树为例过拟合:将训练集划分过于清晰。比如深度采用10,那么将会有1024个叶子,如果总样本只有2048个,那么每个叶子仅分到两个训练集。这样的训练对训练集样本自身适用很好,但对于测试集适用性较差,因为每个叶子的训练都不充分。欠拟合:将训练集划分过于粗糙,比如深度仅有2,显然处理不了回归问题。...
2021-08-12 18:02:26
103
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人