NR数据库(NonRedundant Protein Sequence Database)是NCBI构建的一个非冗余蛋白序列调集,整合了来自GenPept、Swissprot等多个来历的数据。它首要用于蛋白质功用注释和物种注释,包含一切物种分类的蛋白序列数据。以下是NR数据库的具体介绍和运用办法:
NR数据库简介1. 界说和特色: NR数据库对错冗余的蛋白质序列调集,即它去除了重复的蛋白质序列,确保每个序列是仅有的。 NR数据库包含了来自不同基因组和非冗余的蛋白质序列,适用于各种生物信息学剖析,如序列比对和功用注释。
2. 数据来历: NR数据库整合了GenBank、EMBL、DDBJ和PDB等数据库中的蛋白质序列数据。
3. 用处: 常用于蛋白质功用注释和物种注释。 经过与NR数据库进行比对,能够快速进行物种判定和功用猜测。
运用办法1. 下载和构建NR数据库: 拜访NCBI的官方网站,输入关键词“nr”或“protein”查找NR数据库页面。 能够经过FTP下载NR数据库的fasta文件,然后运用相应的东西进行本地化构建。
2. 创立NR子库: 因为NR数据库数据量巨大,为了进步特定范畴的注释功率,能够创立NR子库。 运用东西如taxonkit、csvtk、ncbiblast等,能够依据物种分类信息创立子库。
3. 运用Diamond进行比对: Diamond是一种高效的序列比对东西,常用于与NR数据库进行比对。 经过Diamond比对,能够获得具体的注释成果,包含物种信息和功用注释。
4. 序列标识符: NR数据库中的序列标识符通常以WP和XP最初,这些标识符代表了不同来历的非冗余蛋白质序列。
相关资源 NCBI NR数据库:https://www.ncbi.nlm.nih.gov/refseq/about/nonredundantproteins/ Diamond软件:https://github.com/bbuchfink/diamond taxonkit和csvtk东西:https://github.com/shenwei356/taxonkit, https://github.com/shenwei356/csvtk
NR数据库,全称为Non-Redundant Protein Sequence Database,即非冗余蛋白序列数据库。它是美国国立生物技术信息中心(NCBI)保护的一个重要的生物信息数据库,包含了来自GenBank、EMBL、DDBJ、PDB等数据库中的非冗余蛋白序列信息。NR数据库是生物信息学研讨中常用的序列比对和注释东西,关于微生物学、分子生物学、遗传学等范畴的研讨具有重要意义。
NR数据库具有以下特色:
非冗余:NR数据库中的序列是经曩昔重处理的,避免了重复序列对剖析成果的影响。
全面性:NR数据库包含了来自多个数据库的蛋白序列信息,涵盖了广泛的生物物种。
更新及时:NR数据库会定时更新,以确保数据的时效性和准确性。
易于拜访:NR数据库能够经过NCBI的在线BLAST东西进行拜访,便使用户进行序列比对和注释。
NR数据库在生物信息学研讨中具有广泛的运用,以下罗列一些常见运用场景:
序列比对:经过将不知道序列与NR数据库中的序列进行比对,能够找到与不知道序列类似度较高的已知序列,然后揣度不知道序列的功用和来源。
物种判定:经过比对不知道序列与NR数据库中的序列,能够确认不知道序列所属的物种。
基因注释:经过比对不知道序列与NR数据库中的序列,能够注释不知道序列的基因功用、基因产品等信息。
系统发育剖析:经过比对NR数据库中的序列,能够构建物种之间的系统发育树,研讨物种的进化联系。
NR数据库能够经过以下途径获取和运用:
在线拜访:用户能够经过NCBI的在线BLAST东西拜访NR数据库,进行序列比对和注释。
本地装置:用户能够将NR数据库下载到本地计算机,运用本地BLAST软件进行序列比对和注释。
以下是下载NR数据库的过程:
拜访NCBI FTP服务器:ftp://ftp.ncbi.nlm.nih.gov/blast/db/FASTA/
下载NR数据库:挑选适宜的NR数据库版别,例如nr.faa.gz,下载到本地计算机。
解压数据库:运用解压东西将下载的nr.faa.gz文件解压,得到nr.faa文件。
构建索引:运用BLAST软件构建NR数据库索引,以便进行序列比对。
NR数据库是生物信息学研讨中不可或缺的东西之一,它为用户供给了一个巨大的蛋白序列数据库,便使用户进行序列比对、物种判定、基因注释等研讨。了解NR数据库的特色、运用和获取办法,有助于用户更好地使用这一资源,进步研讨功率。
上一篇:数据库损坏,原因、影响及应对战略
下一篇: 删去数据库用户, 准备工作
检查oracle编码,深化解析Oracle数据库编码格局检查办法
1.查询数据库字符集:```sqlSELECTvalueFROMnls_database_parameters...
2025-01-12
2025-01-12 #前端开发
2025-01-12 #数据库
2025-01-12 #前端开发
检查oracle编码,深化解析Oracle数据库编码格局检查办法
2025-01-12 #数据库
linux装置rz,Linux体系下rz指令的装置与运用攻略
2025-01-12 #操作系统