
统计分析
文章平均质量分 88
育种数据分析之放飞自我
个人公众号:育种数据分析之放飞自我
展开
-
统计学习心法:万物皆可回归,有时可以分类
在一个更大的框架下学习,就像是提升了一个维度,好比你之前在二维世界中,只有前后左右,你不断的探索,不断的画平面圈,有充分的经验去描述脸大脸小,还是无法理解高鼻梁是什么意思!《三体》小说中,三体人制造了水滴这个高科技武器,打败了人类的舰队,但是人类打败水滴,是因为进入了一段四维空间,四维空间可以看到水滴的内部,可以进入操作水滴的内部,就把水滴破坏了。所以,学习一个大的框架,直接决定了视野的宽广与否。如果一直沉浸于方差分析和回归分析中不可自拔,有一种仰之弥高,钻之弥坚的绝望,不妨换一个框架去理解和学习。你会原创 2022-05-09 18:51:00 · 612 阅读 · 0 评论 -
吃饭的家伙:硬件和软件介绍
大家伙,我是飞哥,前几天介绍了一下三屏幕的快乐,后台有人问相关的配置和价格,今天分享一下我办公常用的硬件和软件。1. 硬件电脑:个人笔记本:联想小新14,主要是连接远程,出差,办公,价格5000左右公司台式机:同事根据需求配置的,主要是连接服务器,价格9000左右屏幕:第二屏幕:随便在京东上买的,是大屏幕,需要电源线,但是移动性差。600左右第三屏幕:随便在京东上买的,主要是平时出差需要便携一点的小屏幕,一个接口线包括数据传输和充电,很方便。650左右键盘和鼠标键盘是海盗船原创 2022-05-07 17:38:03 · 440 阅读 · 0 评论 -
没有经验如何获得一个数据分析的工作?
1. 找工作悖论为何工作经验或者项目经验很重要?加入说你是计算机科学、数学专业,统计学专业毕业的学生,你想从事数据分析或者数据挖掘方向的工作,你会在简历里面罗列出你的学习成绩,你会的技能,你取得的成就,极力向用人单位证明你有相关的知识能力,你有学习新事物的能力。但是,现实工作中,用人单位除了需要知道你的技能,还需要了解更多,尤其是你的工作方式,你的项目经验等。如果你不是一个科班出身的人(比如农学,化工,生物等),你想进入相关的行业,唯一证明你自己的就是项目经验了。这就出现了一个悖论,你想进入互联网公原创 2020-11-25 22:10:22 · 1383 阅读 · 0 评论 -
机器学习的路线
之前,在公众号上写了一个专辑《进军机器学习》,时间跨度两年了,还是学学停停,同样学习的朋友都已经到深度学习、神经网络、强化学习了,而我还在机器学习的门口左右徘徊。关于机器学习的学习,我有很多经验,因为我深深的知道不花钱是不能够学到东西的,毕竟充值才能让你变强,我也知道不立Flag不能办成事。我的Flag历史,最早可以追溯到2018年,距今已有两年了!截图如下:关于充值使你变强,我买了很多书,买了很多课程,报了一些班,虽然买过之后特别有学到东西的满足感,花钱的快乐就是好,但是很多书都放在书架上只能睡觉,原创 2020-10-22 21:55:33 · 646 阅读 · 0 评论 -
Fortran 搭配vscode安装及配置
1. Fortran安装及配置1.1 安装MinGWMinGW-w64 - for 32 and 64 bit Windows下载安装包。双击打开安装程序,点击Next:点击Next:一直默认安装:1.2 配置环境变量我的路径为:C:\Program Files (x86)\mingw-w64\i686-8.1.0-posix-dwarf-rt_v6-rev0\mingw...原创 2019-11-07 08:22:19 · 6401 阅读 · 1 评论 -
根据日期 提取场年季效应
1, 提取准者根据年-月-日, 提取年+季节根据日期的年,提取年根据日期的月,提取季节将两者合并2. 示例> head(test) ID Ceding_dat1 1 2015-07-102 2 2015-07-103 3 2015-08-124 4 2016-02-285 5 2016-04-266 6 2016-04-26对数据Ceding_...原创 2019-11-06 07:55:56 · 580 阅读 · 0 评论 -
为什么体型比星座更能影响性格?
1. 体型分为哪几种?这个有很多流派,介绍一下克雷奇米的理论,把体型分为四种:每个体型包括性格特征和易患病症。矮胖型,具有狂躁气质,高血压,高血糖瘦高型,具有分裂气质,精神分裂,自我封闭强壮型,具有黏着气质,冲动,癫痫症发育异常型,抑郁气质,抑郁症换句话说,胖子十有八九逗比沙雕,瘦子抑郁分裂,强壮癫痫症,无论你是哪种体型,总有一款适合你。。。2. 星座是什么鬼?在西方占星学...原创 2019-10-26 21:43:12 · 520 阅读 · 0 评论 -
基因组选择中构建H矩阵需要设置哪些参数?
基因组选择中, H矩阵的构建比较关键, 下面介绍一下, 常用的设置H矩阵的参数.1. 基因组选择中H矩阵的构建这里的1为非测序个体, 2为测序个体, A11, A12, A21, A22可以由系谱构建的A矩阵, 提取相应的矩阵即可, G为基因组构建的矩阵, 可以根据上面的公式, 进行H矩阵的构建, 相关代码, 见: 怎么构建H矩阵.2. 直接构建H−1H^{-1}H−1矩阵因为, 在一步...原创 2019-03-20 15:02:26 · 1719 阅读 · 0 评论 -
Julia1.1安装说明
1. 前言之前, julia0.6, 然后julia0.7变了很多, 然后julia1.0又变化了很多, 经过了很多从开始到放弃的过程.现在Julia1.1了, 从新开始学习.虽然JuliaPro很方便, 但是需要注册, 还要设置很多东西, 初学者建议使用纯净版的官方版, 这里介绍一下安装步骤.2. 下载Julia下载地址Julia download3. 安装Julia安装步骤同一...原创 2019-03-20 16:15:22 · 929 阅读 · 0 评论 -
育种4.0世代的到来个人应该准备什么
PPT引用今天看到王冰冰老师在"2019 年国家良种重大科研联合攻关部署会议"中的报告《国际种业发展态势》, 里面阐述了育种4.0世代的到来, 深有感触,下面是PPT内容,中间加了我的笔记。邓飞笔记:王冰冰老师一直在相关行业,关键词:遗传育种,生物信息,基因组学,先锋,孟山都,华智,百奥云。真的是行业内的大牛。邓飞笔记:世界种业市场规模中,GM是转基因(GM转基因,全称:Geneti...原创 2019-03-28 19:13:08 · 1727 阅读 · 1 评论 -
基因组选择软件市场调研
前言目前, 基因组选择进入了一个高速发展的阶段, 各种新的算法和模型被提出, 这里对基因组选择的软件进行一个汇总大纲1, 调查背景及目的2, 调查方法介绍3, 主要软件汇总4, 基因组软件介绍:单机版5, 基因组软件介绍: R语言版6, 结论及建议1. 调查背景及目的全基因组选择需要选择合适的分析软件,本次调查为了解相关软件应用的整体情况,为选择合适的软件提供决策。本次软...原创 2019-04-15 17:44:20 · 3089 阅读 · 0 评论 -
Julia数据框转化为矩阵
Julia构建数据框using DataFramest1 = DataFrame(y1=collect(1:3),y2=collect(4:6),y3=collect(7:9))结果:Main> t1 = DataFrame(y1=collect(1:3),y2=collect(4:6),y3=collect(7:9))3×3 DataFrames.DataFrame│ Row...原创 2019-04-17 17:33:52 · 1841 阅读 · 1 评论 -
我在哔哩哔哩上上传了什么?
干货!1. 我和bilibili的故事刚来到公司,领导告诉我,哔哩哔哩是个好东西,抱着试试看的态度,我打开了界面,什么?二次元,漫画我只看过进击的巨人好不好,这种style完全不是我的菜。不安利哔哩哔哩的领导不是好的数据分析师,有一天,我对领导讲,腾讯课堂有很多生信的视频,很好啊!领导看了我一眼,说哔哩哔哩上面很多啊,还有人直播写代码呢。然后直播也不是我的菜。后来,我注册了一个账号,但是他...原创 2019-04-22 20:56:36 · 838 阅读 · 1 评论 -
混合线性模型介绍--Wiki
模型介绍混合线性模型:是即包括固定因子,又包括随机因子的模型。 混合线性模型被广泛应用于物理、生物和社会科学。尤其是一些重复测量的数据及面板数据。混合线性模型比较突出的特点是可以非常优秀的处理缺失值,相对于传统的方差分析, 它有更广泛的使用范围,也更优秀。发展历程Ronald Fisher 最早提出随机因子模型来研究亲属间性状的相关性,1950年 Charles Roy Hende...原创 2018-08-01 21:04:37 · 11963 阅读 · 3 评论 -
R语言三元组变为矩阵 矩阵变为三元组
1. 生成一个矩阵使用matrix函数, 生成一个4*4的矩阵> # 生成一个矩阵> mat = matrix(1:16,4,4)> mat [,1] [,2] [,3] [,4][1,] 1 5 9 13[2,] 2 6 10 14[3,] 3 7 11 15[4,] 4 8...原创 2019-06-09 23:12:39 · 4239 阅读 · 1 评论 -
AMMI模型双标图怎么看?
AMMI模型定义AMMI的全称:效可加互作可乘(Additive main multiplicative interaction, AMMI)。AMMI通过从加性模型的残差中分离模型误差和干扰,提高估计的准确度。并且借助于双标图可以更直观的描述和分析基因型与环境互作模式。公式:...原创 2019-07-31 20:08:55 · 2744 阅读 · 0 评论 -
不同试验设计遗传力的计算方法
前言农业和林业, 经常涉及到要计算遗传力的问题, 这是一个数量遗传学问题. 和动物计算遗传力不同, 植物和林木计算遗传力时, 一般是使用家系遗传力, 动物计算遗传力一般是计算个体遗传力.他们的主要区别在于, 计算家系遗传力时, 需要根据重复数, 对方差组分进行校正.1, 单因素随机区组比如有10个品种, 在一个地点有3次重复, 表型数据是小区的产量和百粒重, 试计算产量和百粒重的遗传力....原创 2019-02-28 20:50:05 · 10266 阅读 · 1 评论 -
农业统计分析系列2-试验设计
试验设计试验设计时农业中比较核心的技能, 关系着试验数据的好坏, 关系着后续分析的模型, 关系着效率的高低.兵马未动, 粮草先行. 好的试验设计, 事半功倍.一个简单的试验: RCBD小师妹来信:师兄你好, 老板让我设计试验, 目前有5个品种, 我想重复3次, 如何设计试验?师兄回信:小师妹好, 这个问题难不倒我, 你可以把问题理解为单因素完全随机试验, 这里3次重复就是单存的...原创 2019-02-22 19:25:18 · 3014 阅读 · 1 评论 -
育种值 表型值 回归系数 相关系数 遗传力之间的关系
假定表型值由均值+育种值+残差yi=μ+ai+ϵi y_i = \mu + a_i + \epsilon_iyi=μ+ai+ϵi表型值 VS 育种值他们之间的相关系数cor(y,a)=Cov(y,a)Var(y)∗Var(a) cor(y,a) = \frac{Cov(y,a)}{\sqrt{Var(y)*Var(a)}}cor(y,a)=Var(y)∗Var(a)Cov(y,a)...原创 2019-04-17 17:35:06 · 3497 阅读 · 0 评论 -
Python生物统计---前言及Flag---学习笔记1
划重点英文版的书名是: An Introduction to Statistics wiht PythonPython生命科学的统计重实践介绍, 不是面面俱到我的感想很早听过一句话, 如果你对某件事情不了解, 那就研究一下, 就此内容写一本书吧!!! 现在想起这句话, 我联想到我数次学习Python时都半途而废, 真真的从开始到放弃, 从入门到出家, 主要原因就在于我没有就此写一...原创 2018-10-13 18:18:21 · 977 阅读 · 0 评论 -
如何对数据进行汇总统计(R语言)
1 模拟数据这里模拟了4个因子,5个观测值的数据框, 主要介绍了一下几种方法的汇总统计:1, 单变量~单因子,单个个统计量, 这里使用平均数mean2 单变量~单因子,多个个统计量, 这里使用自定义的函数func3 单变量 ~ 多因子, 单个个统计量4 多变量~单因子5 多变量~多因子1.1 模拟数据代码dat = data.frame(F1=1:24,F2=rep(1:2,1...原创 2018-10-30 21:10:48 · 23556 阅读 · 0 评论 -
基因组选择和SNP分析在ASREML-SA中的实现方法
目录:无意中, 发现了这个pdf, 将学习笔记做一下.简介这篇文档的主要目标是介绍ASReml在基因组分析中的实现方法, 它假定读者有一定的统计基础. 在本文档中, 不对统计和模型做过多的介绍.单标记分析示例数据:ID,effect,SNP_1,SNP_100,SNP_1000,SNP_101,SNP_102,SNP_103,SNP_104,SNP_105,SNP_106,SNP_1...原创 2019-03-19 21:16:05 · 2084 阅读 · 0 评论 -
R语言混合线性模型包代码演示
之前翻译了一篇博文R中的线性混合模型介绍(翻译博客), 但是里面的示例代码显示不友好, 今天重新整理.数据来源: MASS软件包的oats数据oats数据, 这是一个燕麦的裂区试验数据, 主区是品种, 裂区是施肥N, 重复是B区组, 观测值是产量YThe yield of oats from a split-plot field trial using three varieties an...原创 2018-10-25 19:56:12 · 14114 阅读 · 3 评论 -
R语言中怎么将矩阵变为三元组(即三列: row, col, value)
bing上搜索:矩阵怎么变为三元组形式, 在bing上搜索结果:各种C语言, 完全找不到R语言的实现方法.R语言写循环很慢, 就用现成的包吧MatrixMatrix是一个很强大的包, 它可以将矩阵转化为稀疏矩阵, 将0变为., 节约资源.测试, 生成10*10的矩阵, 里面有大量的0, 现在将其非0的地方转化为三元组的形式.何谓三元组, 即使矩阵的转化为三列的形式, 本来矩阵是二维的...原创 2019-04-17 17:33:35 · 8346 阅读 · 3 评论 -
data.table中选择列与data.frame的区别: This difference to data.frame is deliberate and explained in FAQ 1.1.
太长不看版data.table格式在调用列时, 加上逗号, 如果是字符串, 加上with=FALSEtrait = "yield"dat[,trait,with=F]使用oats数据集将其转化为dat的data.table的形式library(asreml)data(oats)str(oats)library(data.table)dat = as.data.table(oa...原创 2019-02-22 19:29:34 · 4068 阅读 · 2 评论 -
devtools 报错Error: Could not find package root.
主要原因:不是root软件包的问题, 而是当前路径不在开发R包的目录下Error: Could not find package root.解决方法:setwd()回到开发R包的目录下即可.原创 2018-11-10 14:23:27 · 1861 阅读 · 0 评论 -
DMU-单性状动物模型-学习笔记2
单性状动物模型本次主要是演示如何使用DMU分析单性状动物模型.数据使用learnasreml包中的数据learnasreml是我编写的辅助学习asreml的R包, 里面有相关的数据和代码, 这里我们用其中的animalmodel.dat和animalmodel.ped的数据.如果没有软件包, 首先安装:library(devtools)install_github("dengfei20...原创 2018-11-14 19:09:09 · 4353 阅读 · 1 评论 -
DMU-单性状重复力模型-学习笔记3
单性状重复力模型本次主要是演示如何使用DMU分析单性状重复力模型.数据使用learnasreml包中的数据learnasreml是我编写的辅助学习asreml的R包, 里面有相关的数据和代码, 这里我们用其中的repeatmodel.dat和repeatmodel.ped的数据.如果没有软件包, 首先安装:setwd("d:/dmu-test/")lib原创 2018-11-18 18:13:06 · 3923 阅读 · 2 评论 -
DMU-多性状动物模型-学习笔记4
多性状动物模型本次主要是演示如何使用DMU分析多性状动物模型.数据使用learnasreml包中的数据learnasreml是我编写的辅助学习asreml的R包, 里面有相关的数据和代码, 这里我们用其中的animalmodel.dat和animalmodel.ped的数据.如果没有软件包, 首先安装:setwd("d:/dmu-test/")library(devtools)# i...原创 2018-11-19 20:47:29 · 3081 阅读 · 1 评论 -
农业统计分析系列1-序
前言学走路时的艰难, 在你会走路后就忘记或者故意忽略了, 这就是代沟的起源.正所谓白天不知夜的黑, 有时候简单的概念在初学者眼里也是抽象不断, 难解其义.本着帮助同学的态度(自我吹捧的态度), 将会的知识重新整理一下, 名曰学习笔记.其实只有我知道, 不刷刷存在感, 生活真的没有趣味.如项羽所言: ‘富贵不归故乡,如衣锦夜行,谁知之者! ’是为序.agricolae包介绍这是一个专...原创 2019-02-22 19:26:35 · 1597 阅读 · 0 评论 -
R语言中矩阵变为对称矩阵的两种方法
问题: 现有一个矩阵, 想将其以上三角矩阵变为对称矩阵例子:set.seed(123)mat <- matrix(runif(16),4,4)matmat矩阵内容 现将其上三角矩阵为基础,变为对称矩阵> set.seed(123)> mat <- matrix(runif(16),4,4)> mat [,1] ...原创 2018-07-29 16:38:42 · 15703 阅读 · 1 评论