数据是所有统计分析和图形绘制的基础,正如原料与菜谱之关系。数据读取正确与否,直接关系后续的统计分析结果的准确性,这好比原料新鲜与否,直接关系到后续菜肴的可口性。对于R初学者,尤其要重视数据的读取。本人主要从事林业统计分析,尤其是遗传评估,大部分涉及的变量多为因子型,但R语言并非如此智能,能直接读懂我们脑子里所想。在接触的一些网友问题里,我发现许多网友对数据是否正确读取没有什么概念,导致后续的许多分析结果都是错的。请记住,只要给R语言任意一份看似合乎情理的数据,R似乎都能给出一些结果,但结果可能是错的!
自交对植物遗传评估的影响
当亲本之一未知时,且物种可以自交,则需要在遗传评估中考虑自交的可能性。例如,对于桉树,假设自交概率为0.3是很普遍的。如果不考虑自交,则加性遗传方差将会被高估,因为子代并不都是半同胞——它们越密切相关,因此比模型假定的更相似。
用R进行G×E互作的AMMI模型分析
在多地点试验中,突出的一个问题是林木基因型与环境之间往往存在显著的交互作用(Genotype by environment interaction, GEI),因此如何准确评估GEI对于后续林木良种的选育和推广至关重要。目前,农业上大多使用联合回归法1、主效可加互作可乘模型(Additive main effects multiplicative interaction, AMMI)2和基因型主效加基因型-环境互作效应双标图(Genotype Main Effect plus Genotype-by-Environment Interaction biplot, GGE双标图) 3分析多点试验,并据此来进行品种评价、试验点评价和品种生态区划分,其中GGE双标图越来越受关注。迄今,GGE双标图在林木上的应用4仍然很少,仅在少数树种如辐射松、杨树和乐昌含笑中有过报道。
python3.7及其module的安装--win7系统
很早就买了本书《Python科学计算》,却一直未曾动过。直到前些天,看到报道说,python已占据编程语言之巅。人生时间有限,要学就学最好的。因此,打算开始学学python。不料win7系统安装python及其module,遇见了不少问题。本文将描述安装所遇到的问题及其解决方法。我在本人网盘1里收录了本文在python软件及其安装遇到问题所需的全部文件。
for循环与plyr包执行方差分析及其多重比较的批量分析
有网友问我,能否批量进行方差分析与多重比较及其结果的提取。答案是肯定的。在之前的博文《巧用plyr包进行线性模型的批量分析》[1],演示了借助plyr包进行线性模型的批量分析。本文除了plyr包外,先演示for循环来实现方差分析的批量分析。不过R用户一般不建议使用for循环,数据量一般庞大后,for循环运行会比较慢。
R初学者如何学习R
作者:林元震
近年来,我参加了几次R培训的授课,也接触了不少R初学者。看到很多人对R很感兴趣,但学习起来却不得门道,着实着急。今天,我讲述自己如何学习R的一些个人体会,供R初学者参考。