meme suite —— Motif分析百宝箱(二) admin 2023-10-25 13:12:02 篇首语:本文由小编为大家整理,主要介绍了meme suite —— Motif分析百宝箱(二)相关的知识,希望对你有一定的参考价值。 参考技术A Motif Discovery中还包括MEME-ChIP,可对ChIP-seq或CLIP-seq数据的DNA序列进行一系列的Motif分析。该方法整合了: 1、MEME&STREME功能,用以预测Motif(de novo Motif); 2、CentriMo用以寻找输入序列中间区段内已知的Motif,适合ChIP-Seq数据检出峰所在序列上富集的已知 Motif; 3、通过工具Tomtom功能比较已知的motif进行相似性分析,并对重要的motif进行分组; 4、Spamo与CentriMo功能相似,也是对Motif进行富集; 5、FIMO功能旨在输出Motif在基因的位置信息。 MEME-ChIP具体参数可以使用默认值,或按需求更改。示意图如下: 我们以网站Sample Output中MEME-ChIP example结果为例进行说明。 r 导入荷马ChIP-Seq Motif数据 # Daniel Cook 2014# Danielecook.com## Use this function to import ChIP Seq Data generated by Homer. This data is generated using homers findMotifsGenome.pl# command with the "-find " argument. Generate output# looks like this:## 1. Peak/Region ID# 2. Chromosome# 3. Start# 4. End# 5. Strand of Peaks# 6-18: annotation information# 19. CpG%# 20. GC%# 21. Motif Instances (,,)## Getting the information from column 21 for plotting, for example, frequency can be tricky. This funciton aims to help that# by converting the data format from wide to long. Currently, annotation columns are ignored but you can modify the function to# fix.library(stringr)library(splitstackshape)library(reshape2)library(dplyr)suppressMessages(library(data.table))import_peak_file <- function(filename, peak_type) { df <- fread(filename) setnames(df, names(df)[1],"Peak") setnames(df, names(df)[9:length(names(df))] , str_extract(names(df)[9:length(names(df))], "[A-Za-z0-9]+")) motifs <- names(df)[9:length(names(df))] # Reshape latter columns # Remove extra columns if present df$Annotation <- NULL df$"Focus Ratio/Region Size" <- NULL df$Detailed <- NULL df$Distance <- NULL df$Nearest <- NULL df$Entrez <- NULL df$Nearest <- NULL df$Nearest <- NULL df$Nearest <- NULL df$Gene <- NULL df$Gene <- NULL df$Gene <- NULL df$Gene <- NULL # Melt Again df <- melt(df, id.vars = 1:8) df$value <- str_replace_all(df$value, "),", "|") df <- filter(df, value != "") df <- concat.split(as.data.frame(df), split.col = c("value"), sep="|") df$value <- NULL df <- rename(df, c("variable"="motif_name")) df <- melt(df, id.vars = 1:9) df$value_1 <- NULL df$variable <- NULL df <- filter(df, value != "") df$MOTIF <- str_extract(df$value,"[ATCG]+") df$POS <- as.integer(str_extract(df$value,"[-0-9]+")) df$STRAND <- str_extract(df$value,"(,[+|-],)") df$STRAND <- str_replace_all(df$STRAND,",","") df$value <- NULL df <- filter(df, !is.na(POS)) df$peak_type <- peak_type df} 以上是关于meme suite —— Motif分析百宝箱(二)的主要内容,如果未能解决你的问题,请参考以下文章 ansys哪个版本好用 revit注册机显示不出来 您可能还会对下面的文章感兴趣: 相关文章 商丘私人空放联系方式_基本资料审核后快速就能放款平台 济宁私人借钱24小时在线,5万以上级别的贷款|无抵押个人借贷|秒下| 湖州空放私借2小时放款—身无分文借贷100%直接放款 宜昌纯私人放款微信电话——马上为您安排信贷服务+当日到账 蚌埠24小时私人放款联系方式随借随到-做生意借贷|应急周转|大额优先| 遵义空放借钱贷款联系电话:走投无路申请放款马上就到账 绵阳专业空放贷款私人联系方式,不看过往|先贷后放|马上拿钱| 德州附近个人放款电话号码多少:不审核+随借随还+当日成功+直接到账