一般而言,在NCBI(也就是Entrez数据系统)查基因序列,主要是搜索的NCBI的Genbank数据库的核酸与蛋白质序列,方法见六零六406。由于Genbank起初是一个类似BBS的序列数据库系统,虽然目前有人工核对序列,但其数据库中的序列质量还是不如Swissprot数据库。最近,我们在投递序列过程中,其管理员与我们进行了很多的交流(基本上都是PhD),所以他们肯定也开始注重数据质量了。但是,从数据规模上,NCBI还是比较全的,毕竟它有与EBI和DDBJ的数据每日交换机制。另外,NCBI提供的blast服务,也可以帮助你获得更多的同源序列。
因此,我建议首先从Swissprot上查询,下面以TPS为例:
1 搜索swissprot中的TPS基因
http://www.uniprot.org/uniprot/?query=TPS&sort=score
我们得到两个酵母相关基因,利用你的专业知识判断选择一个或两个。
2 点击进入P38426 (TPS3_YEAST),查看蛋白质序列是否你想要的。
3 进入NCBI的Blast服务页面,
http://blast.ncbi.nlm.nih.gov/Blast.cgi
在basic blast部分,你有两个选择:1)protein blast->搜索蛋白质序列;2)tblastN->搜索核酸序列。
4 进入程序搜索页面,将Swissprot的登录号P38426贴如输入框。
5 再下面就是如何使用Blast。
6 在Blast的结果中,你可以根据序列的相似性找你感兴趣的基因序列。
附图:一个blast的结果
上了网页后选择GenBank ,再搜索 barm TPS ; barm TPP 你一个一个的查,基因序列它已经是很精确的了,你也只能跟着细致化下来。