实验中发现两个蛋白的表达有调控关系,如何用生信方法确认?
以下几步简单粗暴,不得不试(文字少,全是干图)。
一.先看两个蛋白有没有直接相互作用。
1. 肯定要先试试最著名的 STRING 了。点击进入 STRING 官网 。在首页左侧边栏中,选择 Multiple proteins,在右边输入框中输入蛋白名称和研究对象种类。
随后不停的 continue,就能看到结果了。根据两个蛋白之间连线的颜色,可以判定两个蛋白的可能相互作用类型(Known Interactions,Predicted Interactions,others)。
如果通过蛋白的名称在 STRING 检索不到,还可以通过输入蛋白的氨基酸序列来检索。氨基酸系列可以在 UCSC 官网,选取 hg19 版本。检索蛋白或编码基因名称,点击图中第一条黑色横线后,进入序列界面。
点击图中 Protein(XX aa)获取 fasta 格式的氨基酸序列。
再回到 STRING 主页,左侧选取 Multiple sequences,右侧输入刚刚获取的两个蛋白的序列,就可以得到结果了。
2. 另一个在线软件是 struct2net 的 online 版本,点击进入。界面也非常友好。与 STRING 类似,首先把蛋白名称输入。
得到结果。当然,对于数据库中没有收录的蛋白名称,也可以通过粘贴氨基酸序列的方法进行检索。
二.如果第一步没有发现相互作用,可以分别查找所有的相互作用蛋白,看是否有交集,也就是间接相互作用。
1. 首先依然是 STRING 了。 点击进入 STRING 官网。在首页左侧边栏中,选择 Protein by name。先输入其中一个蛋白的名字,随后不停的 continue,得到与此蛋白直接相互作用的所有蛋白。
随后再进入首页输入另一个蛋白名称,也得到结果,在图下方可以选取以文本形式 download。就可以取交集了。
小 tip:如果把交集蛋白连通关系的两个蛋白,一起放进 STRING,会有意想不到的效果哦,我们得到了两个蛋白的互作网络。
2. Hitpredict 在线软件可以实现类似的功能。官网 http://hintdb.hgc.jp/htp/。同样简单粗暴,输入蛋白名称,得到结果。
分别输入两个蛋白名称,得到结果。以 txt 格式下载后,就可以取交集了。
三.如果前两步都没有可靠的结果,则进一步查看,是否发生蛋白与 DNA 的相互作用,也就是一个蛋白是否对另一个蛋白的编码 DNA 有调节作用。
1. PROMO 数据库是此类研究的最常用数据库, 点击进入官网。 使用前,首先要得到两个蛋白对应的启动子序列。序列依然从 UCSC 获取。
点击 Genomic Sequence(chr XXXX),得到序列选取界面,选取上游启动子区域(通常 Upstream 2000)。当然如果编码区域较短,也可以把编码区域也选上。
点击 submit 后得到 fasta 格式的序列。随后进入 PROMO 网站,SelectSpecies 后 SearchSites 。将 DNA 序列贴入。
Submit 后得到结果。查看与此 DNA 可能结合的蛋白中有无我们关心的那一个(也就是另一个蛋白)。
2. 也可以在 GENECARDS 网站中直接分别搜索两个蛋白的编码基因名称,在结果中找到 Regulatory Elements for XXX Gene 表格。
点击左下角 See All at QIAGEN 就可以得到此蛋白的编码 DNA 有没有受到另一个蛋白的调控了。
4. 我们还可以在 GEO DATABASE 中查看是否已经有我们关心的两个蛋白的 chip-seq 数据。点击进入 GEO DATABASE 官网。 搜索其中一个蛋白名称,下载 chip-seq 数据(最终结果多为 excel 格式),就可以查看有没有跟另一个蛋白的编码 DNA 相互结合啦。
如果到目前还没有结果,就只能靠自己实验了,毕竟软件的预测能力有限,数据库的收录也可能不全。这个时候自己做 chip-seq,co-IP 等当然是极好的了。