CNV分析工具之一:CNVkit

CNV有很大程度上辨析器,使成为一体发花,但有人家挤压成的成绩是,眼前缺席在位的的一部分辨析器,关于有选择粹器的想的作者来说,论述CNV感触莫名的苦楚,您不料逐一棘手的器并竞争这些辨析历程。一段工夫。CNVnator领先于竞赛,由于软件修理很不便,杂多的笔误、debug,因而,辨析器倘若频繁地修理也人家要紧代理人。

最近的,作者被发现的人20162000年压印PLOS
computational biology
IF=)上的CNVkit眼前,开价率已手脚能够到的范围74次,被很大程度上高分文字援用,软件首要运用python编译,轻易修理,胜利的目测也地租的。。2017jimmy强有力的的膜拜也写了一篇文字CNVkit的推文,好东西不喜欢写这样,在这边我还写了一篇文字CNVkittweet是按表格婚配的CNVkit尊敬开展茶,同时,笔者应当自习助长竞争。:费曼竞争法,这包括第一天和最后一天也费曼的诞辰。

以下是什么运用它:

Github地址:

学术权威航线地址:

率先,运用conda软件修理:

conda
config –add channels defaults

conda config
–add channels conda-forge

conda config
–add channels bioconda

conda create -n
12bet备用网址kit 12bet备用网址kit

source activate
12bet备用网址kit

经过find找到本子的得名次,找到它的绝对路程,如/home/anaconda2/envs/12bet备用网址kit/bin/,此路程可在软件运转后运用12bet备用网址kit软件了。土地学术权威网站的提议ucsc下载人类hg38的请教染色体组。同时,当地的也预备了各自的人WGS创纪录的作为典礼创纪录的。

学术权威加密:

batch
* –normal * \

–targets my_baits.bed –annotate
refFlat.txt \

–fasta hg19.fasta –access
data/access-5kb-mappable.hg19.bed \


my_ –output-dir results/ \

–diagram
–scatter

解析:

用于运转本子

batch这是一种在本子中集成很大程度上命令的办法。,自然,它也可以用赡养的accesscoverragefix与休息办法来完整的batch同卵双胞行使职责的辨析,但作为人家无痛的人,提议运用它batch


都是中肯的的战利品bam档案,提议用bwa经过ucschg38请教染色体组做mapping,结合samtool排序替换bam体式。您可以在这边出口更多

–targets
要辨析的区域新闻

–annotate
refFlat
FORMA说话中肯生殖细胞的细胞质正文新闻,可以从UCSC上下载

–fasta
请教染色体组

–access
必要依照bed档案,表现过 access mm10.fasta -s 10000 -o access-10kb.mm10.bed 出示

–output-reference
出口的作为下落山tumor创纪录的辨析出口档案,和出口关系

–output-dir
出口大学境遇便览名

–diagram
–scatter
二者都是决定因素化的扩大某人的兴趣图

在辨析了学术权威办法以前,您可以在本人的维修服务上停止典礼。,加密列举如下:

/home/anaconda2/envs/12bet备用网址kit/bin/
batch /data1/data-sample/human-WGS/bwa-sam-bam/700_bwa.sam.bam –annotate /home/genome/human-ucsc-hg38/ucsc-human-refflat2.txt
–normal   /data1/data-sample/human-WGS/bwa-sam-bam/  –method wgs -f
/home/genome/human-ucsc-hg38/ 
–output-reference my_flat_ -d  699vs700

率先运用绝对路程运用本子,出口了两个门口bam档案:作为tumor700调和与举动normal699,出口了ucsc上下载的hg38refFlat档案,由于这是对完全的染色体组的辨析,因而添加–method wgs决定因素,出口请教染色体组也在ucsc上下载的hg38

运转时将泄漏笔误(这是我运用的维修服务笔误),这绝不具有重要性普通的笔误泄漏,少到要点DNAcopy即将到来的R包,进入R后头被采取bioconductor下载并修理此包装盒。最近的biocondutor人家成绩是在位的的一部分本地的用网覆盖不表现,您可以将修理包下载到本地的网站,运用R CMD INSTALL xxx.tar.gz修理就够了。。

重行运转或笔误泄漏,被发现的人是refFlat记载成绩,经过搜索找到学术权威图案refFlat未查明首行信头,列举如下图所示,切除第党派的创纪录的,再跑一次,跑得很牛棚。。

笔者将在手术胜利中开始各自的档案,在位的这是最要紧的人家。由于笔者的决定因素以前的男朋友或女朋友在内–diagram –scatter决定因素,因而默许境遇下不见得出示视觉图像。笔者可以独立从命令行中绘制所需的图片,如对7染色体标号映照scatter图:

/home/anaconda2/envs/12bet备用网址kit/bin/ scatter -s
700_bwa.sam.cn{s,r} -c chr7 -o scatter-chr7.png

绘制diagram,加密列举如下:

/home/anaconda2/envs/12bet备用网址kit/bin/ diagram

胜利是pdf档案,截图列举如下:

推测笔者平静人家tumor范本704异样的辨析也必要做,第一步不喜欢出口这么些决定因素,复杂点。,运用前出示my_flat_档案就十足了。,tumor战利品是704,对应的normal战利品或699-p 10对应的盘旋标号:

/home/anaconda2/envs/12bet备用网址kit/bin/
batch /data1/data-sample/human-WGS/bwa-sam-bam/704_bwa.sam.bam -r
my_flat_ -d 704 -p 10

从整个上看,作者的风景bam按比例分配文档数i60GB,但性质上运转人家项目工夫很长1个小时在内,胜利暗示,该软件的运转效力依然很高。。 

发表评论