单细胞数据如何绘制stacked violin?Python 的Scanpy包和Seurat包一样,是单细胞数据处理的利器,其中,Scanpy中有一种堆积的小提琴图,可以很好的展示 marker 的表达情况,但是在Seurat中并没有内置命令。因此,我自己尝试提取数据并用ggplot2包来画该图。 首先来展示以下画图的成果,如图2024-09-20生物信息
不同的语言处理gzip压缩文件的时间对比首先在 shell 中测试如下命令12#!/bin/shtime gzip -d -c risearch_chr1:143971112-143971134:+:FAM72C.out.gz > risearch_chr1:143971112-143971134:+:FAM72C.out2024-09-20编程语言
使用R语言实现bedtools求交集的功能?Bedtools 作为基因组研究的 “ 瑞士军刀 ”, 功能强大且易于操作,是生信行业不可多得的好软件。通常对 bed 区间的注释,我们使用其中“ 求交集 ”的功能(bedtools intersect) ,但是有一个很不方便的地方,我们通常要生成对应的 bed 文件,再注释完成后还需要用 R 语言等读入才能继续分析,所以整合度不是很好,本文希望提供 R 语言的思路来解决该问题。2024-09-20编程语言
再说转录组数据标准化(TPM,RPKM,FPKM)基础概念讲解在 RNA-Seq 的分析中,我们常用RPKM、FPKM 和 TPM作为转录组数据定量的表示方法。 它们都是对表达量进行标准化的方法,为何不直接用 read 数表示,而选标准化呢?2024-09-20生物信息
单细胞数据如何混合亚类和大类做点图分析Marker基因单细胞数据数据量很大,加重了分析的负担,但只要掌握好的方法和工具,就可以无往而不利。今年要说的这个如题,是因为在区分亚类的时候,提取了大类型并调整分辨率重新聚类计算的亚类。针对这种情况,该如何实现呢?2024-09-20生物信息
ClusterProfiler:真的不只是富集分析网上很多教程都在讲 Y 叔的 clusterprofile 富集分析的教程,但是查阅了官方文档后才知道,这个包真的不仅仅只有这个功能,其他功能也很强大。2024-09-20生物信息
python, perl 和julia的性能对比在生物信息学中经常用到的脚本语言主要是python和perl,他们被用来处理文本,大量统计,流程控制等等,其自身也是各有优势。比如说perl天生就为了处理文本而生,但是python确是有名的胶水语言,特别在整合C代码时显示出巨大的优势,其语法简洁易懂,易于维护更让其成为仅次于C和JAVA的第三大语言,但其糟糕的性能在处理大量循环时会让人忍不住抓狂。因此,Julia语言应运而生,其控制了python中没必要的动态性,加之使用 JIT 技术让其能够保有高性能的同时具备简洁的语法。2024-09-20编程语言
16S rRNA基因扩增子分析在此工作流程中,介绍了 Qiime2 和 R 中 16S rRNA 基因扩增子数据分析的主要步骤。本教程是为哥本哈根大学食品科学系的 MAC 2023 课程准备的。尽管这些步骤是为 Oxford Nanopore Tech (ONT) 测序设计的,但也在 Ilumina 短读长上进行了测试。2024-09-20生物信息
如何批量计算相关性1.只计算相关性,不考虑显著性检验:1234library(corrr)library(dplyr)data(mtcars)mtcars%>%correlate()%>%rearrange()%>%stretch()2020-02-17生物信息