微生信神助力:在线绘制发表级主成分分析(PCA)图

2024-06-12 03:44

本文主要是介绍微生信神助力:在线绘制发表级主成分分析(PCA)图,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

主成分分析(Principal components analysisPCA)是一种线性降维方法。它利用正交变换对一系列可能相关的变量的观测值进行线性变换,从而投影为一系列线性不相关变量的值,这些不相关变量称为主成分(Principal Components)。PCA是一种对数据进行简化分析的技术,这种方法可以有效地找出数据中最主要的元素和结构,去除噪音和冗余,将原有的复杂数据降维,揭示隐藏在复杂数据背后的简单结构。

举个通俗易懂的例子:以学习成绩为例,每个同学有多门考试成绩(即分数),例如语文75、数学78、英语86等等。如果有10门课程,那么每个同学的成绩就有10个维度,10个维度对于我们了解这个同学的成绩来说,有点复杂。这时,我们可以用成绩好和成绩不好来表征这个同学的成绩,这就是“降维”。

PCA降维”的目的:

1)去冗余

例如微积分成绩和概率论的成绩一般是强相关,这样就可以将10个维度去掉1个维度)

2)发现异常值

例如某同学由于疫情被隔离了几天,缺了几门课的成绩,那么降维后就可以在2D图上找到该同学所代表的点,后续分析时可以考虑踢掉

3)保留原始信息

降维后新的主成分能够解释原数据,如果降维后可解释性降低,那么就不是好的降维

大多数情况下,降维是为聚类、分类服务的。降维后,我们就可以研究同学们的成绩情况,寻找隐藏在成绩背后的信息,例如,有几个学生成绩都很好,那么“他们住在同一个宿舍”就有可能是潜在变量。

降维的方法有很多种,常见的包括线性降维(PCAPLS),非线性降维(UMAPtSNE)等。降维后一般会进行2D,或者3D图的绘制,其中2D图最常见也最容易理解。一般我们绘制individuals散点图,也就是将看得见,摸得着的样本点(例如常规RNAseq结果中的15个样品或者单细胞测序中的成千上万个细胞等)绘制在X/Y轴坐标系中。

对主成分分析(Principal components analysisPCA)有了简单地解后,我们就可以用微生信网站进行发表级PCA绘图了。

1,打开绘图页面

微生信-在线绘制主成分分析图(Principal component analysis,PCA)

2,下载示例数据

这是最经典的鸾(音:yuān)尾花数据,该数据测量了三种鸢尾花(B列:Setosa鸢尾花、Versicolour鸢尾花和Virginica鸢尾花)的4个属性数据(C:花萼长度、D:花萼宽度、E:花瓣长度、F:花瓣宽度),每种花收集了50条样本记录,共计150条(A列:s1-s150)。

3,拷贝并粘贴示例数据

4,修改参数,并提交

图片大小颜色形状以及标注字体大小等都可以个性化定制,可满足不同的绘图需求。

5,提交出图

该图展示了150个样品在第一主成分(73%)和第二主成分(22.39%)的散点图,百分比表示可解释程度,即第一主成分可以解释数据属性的73%。将4维空间降维为2维空间后,可以较明显地看出这150个样本呈现为3群。

该模块调用了FactoMineRfactoextraR包。

没有预览就是没有出图,这时请参考示例数据,检查输入数据格式!

遇到文字截断,需要修改字体、调整字体大小等,使用inkscape软件进行操作

微生信助力高分文章,用户185000,谷歌学术3600篇

这篇关于微生信神助力:在线绘制发表级主成分分析(PCA)图的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1053106

相关文章

水位雨量在线监测系统概述及应用介绍

在当今社会,随着科技的飞速发展,各种智能监测系统已成为保障公共安全、促进资源管理和环境保护的重要工具。其中,水位雨量在线监测系统作为自然灾害预警、水资源管理及水利工程运行的关键技术,其重要性不言而喻。 一、水位雨量在线监测系统的基本原理 水位雨量在线监测系统主要由数据采集单元、数据传输网络、数据处理中心及用户终端四大部分构成,形成了一个完整的闭环系统。 数据采集单元:这是系统的“眼睛”,

性能分析之MySQL索引实战案例

文章目录 一、前言二、准备三、MySQL索引优化四、MySQL 索引知识回顾五、总结 一、前言 在上一讲性能工具之 JProfiler 简单登录案例分析实战中已经发现SQL没有建立索引问题,本文将一起从代码层去分析为什么没有建立索引? 开源ERP项目地址:https://gitee.com/jishenghua/JSH_ERP 二、准备 打开IDEA找到登录请求资源路径位置

电力系统中的A类在线监测装置—APView400

随着电力系统的日益复杂和人们对电能质量要求的提高,电能质量在线监测装置在电力系统中得到广泛应用。目前,市场上的在线监测装置主要分为A类和B类两种类型,A类和B类在线监测装置主要区别在于应用场景、技术参数、通讯协议和扩展性。选择时应根据实际需求和应用场景综合考虑,并定期维护和校准。电能质量在线监测装置是用于实时监测电力系统中的电能质量参数的设备。 APView400电能质量A类在线监测装置以其多核

客户案例:安全海外中继助力知名家电企业化解海外通邮困境

1、客户背景 广东格兰仕集团有限公司(以下简称“格兰仕”),成立于1978年,是中国家电行业的领军企业之一。作为全球最大的微波炉生产基地,格兰仕拥有多项国际领先的家电制造技术,连续多年位列中国家电出口前列。格兰仕不仅注重业务的全球拓展,更重视业务流程的高效与顺畅,以确保在国际舞台上的竞争力。 2、需求痛点 随着格兰仕全球化战略的深入实施,其海外业务快速增长,电子邮件成为了关键的沟通工具。

【WebGPU Unleashed】1.1 绘制三角形

一部2024新的WebGPU教程,作者Shi Yan。内容很好,翻译过来与大家共享,内容上会有改动,加上自己的理解。更多精彩内容尽在 dt.sim3d.cn ,关注公众号【sky的数孪技术】,技术交流、源码下载请添加微信号:digital_twin123 在 3D 渲染领域,三角形是最基本的绘制元素。在这里,我们将学习如何绘制单个三角形。接下来我们将制作一个简单的着色器来定义三角形内的像素

SWAP作物生长模型安装教程、数据制备、敏感性分析、气候变化影响、R模型敏感性分析与贝叶斯优化、Fortran源代码分析、气候数据降尺度与变化影响分析

查看原文>>>全流程SWAP农业模型数据制备、敏感性分析及气候变化影响实践技术应用 SWAP模型是由荷兰瓦赫宁根大学开发的先进农作物模型,它综合考虑了土壤-水分-大气以及植被间的相互作用;是一种描述作物生长过程的一种机理性作物生长模型。它不但运用Richard方程,使其能够精确的模拟土壤中水分的运动,而且耦合了WOFOST作物模型使作物的生长描述更为科学。 本文让更多的科研人员和农业工作者

MOLE 2.5 分析分子通道和孔隙

软件介绍 生物大分子通道和孔隙在生物学中发挥着重要作用,例如在分子识别和酶底物特异性方面。 我们介绍了一种名为 MOLE 2.5 的高级软件工具,该工具旨在分析分子通道和孔隙。 与其他可用软件工具的基准测试表明,MOLE 2.5 相比更快、更强大、功能更丰富。作为一项新功能,MOLE 2.5 可以估算已识别通道的物理化学性质。 软件下载 https://pan.quark.cn/s/57

Flutter 进阶:绘制加载动画

绘制加载动画:由小圆组成的大圆 1. 定义 LoadingScreen 类2. 实现 _LoadingScreenState 类3. 定义 LoadingPainter 类4. 总结 实现加载动画 我们需要定义两个类:LoadingScreen 和 LoadingPainter。LoadingScreen 负责控制动画的状态,而 LoadingPainter 则负责绘制动画。

JavaFX应用更新检测功能(在线自动更新方案)

JavaFX开发的桌面应用属于C端,一般来说需要版本检测和自动更新功能,这里记录一下一种版本检测和自动更新的方法。 1. 整体方案 JavaFX.应用版本检测、自动更新主要涉及一下步骤: 读取本地应用版本拉取远程版本并比较两个版本如果需要升级,那么拉取更新历史弹出升级控制窗口用户选择升级时,拉取升级包解压,重启应用用户选择忽略时,本地版本标志为忽略版本用户选择取消时,隐藏升级控制窗口 2.

衡石分析平台使用手册-单机安装及启动

单机安装及启动​ 本文讲述如何在单机环境下进行 HENGSHI SENSE 安装的操作过程。 在安装前请确认网络环境,如果是隔离环境,无法连接互联网时,请先按照 离线环境安装依赖的指导进行依赖包的安装,然后按照本文的指导继续操作。如果网络环境可以连接互联网,请直接按照本文的指导进行安装。 准备工作​ 请参考安装环境文档准备安装环境。 配置用户与安装目录。 在操作前请检查您是否有 sud