NCBI簡(jiǎn)單的來(lái)說(shuō)就是一個(gè)生物信息庫(kù),四面八方不分國(guó)界地吸收著關(guān)于生物的一切信息,是一個(gè)洋溢著生命氣息的軟件。
它是富有的,用中國(guó)話(huà)說(shuō)就是包羅萬(wàn)象,不可勝言,車(chē)載斗量,斗量筲計(jì),浩如煙海,換句話(huà)說(shuō)就是“貧窮限制了我們的想象”。有多富有就會(huì)有多強(qiáng)大,有多強(qiáng)大也就有多好用,好用而又免費(fèi)那就是天上掉餡餅,喜歡什么餡就接什么餡嘍。
下面就先介紹兩種餡,吃對(duì)了,吃飽了就可以擴(kuò)展科學(xué)新領(lǐng)域啦。
1 查找基因、轉(zhuǎn)錄產(chǎn)物和蛋白
01 基因名字
當(dāng)我們知道一個(gè)基因的名字,但是并不清楚這個(gè)基因的具體信息時(shí),就可以通過(guò)名字對(duì)其進(jìn)行檢索,在NCBI的首頁(yè)在檢索的下拉菜單中選擇Gene,輸入基因名字,點(diǎn)擊search,關(guān)于這個(gè)基因的信息就無(wú)處躲藏。
舉個(gè)簡(jiǎn)單的例子,比如這幾年一直困擾我們的冠狀病毒的一個(gè)基因orf,檢索后就會(huì)出現(xiàn)下圖的信息。
點(diǎn)擊紅框部分就可以出現(xiàn)這個(gè)基因的信息,然后我們就可以看到下圖的信息,只要點(diǎn)擊每個(gè)向下的箭頭就可以展開(kāi)詳細(xì)的信息。
這還沒(méi)有結(jié)束,在展開(kāi)的具體內(nèi)容上,鼠標(biāo)就會(huì)變成小手手,點(diǎn)哪都會(huì)出現(xiàn)相應(yīng)的具體信息,手手動(dòng)起來(lái)還怕看不穿它的前世今生嗎?
不論是基因還是蛋白最需要關(guān)注的就是序列部分,序列就是在NCBI Reference Sequences(RefSeq)條目下進(jìn)行查看。
如下圖,圈紅的NC是基因,NP蛋白。點(diǎn)擊框紅部分,將顯示的頁(yè)面翻到最后就可以看到具體的序列信息了。
以蛋白為例,檢索到的蛋白序列如下圖。
02 基因ID
拿到基因的ID就是拿到了確認(rèn)它唯一身份的證件,這個(gè)要比名字更容易鎖定,畢竟基因名稱(chēng)也像人名一樣,重名的太多了。檢索方式是與上述名字檢索相同的,只是輸入的是ID的序號(hào)。剩下的又是上述的前世今生的信息了。
2 序列比對(duì)
在科研中最大的成就便是“新”,新領(lǐng)域、新事物、新功能哪一個(gè)不是讓人瞠目結(jié)舌的大驚喜,這就是科研界的打拼新天下,擴(kuò)充新疆土。
在這片疆土中序列就是一個(gè)標(biāo)志性的存在,序列中所謂的“新”就是排除“舊的”,這就體現(xiàn)了數(shù)據(jù)庫(kù)的重要性。
那么NCBI是如何實(shí)現(xiàn)序列比對(duì)的呢?
回歸NCBI首頁(yè)右側(cè)Popular Resources下的BLAST出現(xiàn)下圖,左側(cè)紅框是核酸序列的比對(duì),右側(cè)紅框是蛋白序列的比對(duì),根據(jù)需要自行進(jìn)入。
下面以核酸序列比對(duì)為例,輸入需要檢索的序列(Query Sequence),在右側(cè)還可以對(duì)檢索的序列進(jìn)行區(qū)域的設(shè)置。
或者是直接上傳本地文件,如數(shù)據(jù)庫(kù)登錄號(hào)、NCBI gi號(hào)或FASTA格式的序列的列表。
圖中綠框部分是對(duì)檢索范圍的一些具體的設(shè)置,黃框是對(duì)檢索結(jié)果進(jìn)行優(yōu)化,可根據(jù)具體情況自行設(shè)置。
檢索時(shí)可以將圈紅部分選中,這樣檢索結(jié)果就會(huì)在新的窗口展示,點(diǎn)擊BLAST,在等待新窗口時(shí),還可以在先前的窗口對(duì)另外的序列設(shè)置檢索信息并進(jìn)行檢索,互不沖突,節(jié)省時(shí)間。
以一段序列為例,進(jìn)行展示,檢索結(jié)果如下圖,分為3個(gè)模塊:基本信息、以圖形展示的檢索信息、具體的檢索結(jié)果信息、相似序列的分類(lèi)信息。
基本信息中需要分析的幾個(gè)參數(shù),scientific name(系列所在的物種)、query cover(檢索的序列與庫(kù)中的序列覆蓋度)、E值(兩個(gè)序列對(duì)比的可信度)、per.ident(兩個(gè)序列的一致程度),當(dāng)query cover和per.ident均為100%時(shí)可認(rèn)定為相同的序列。
在答復(fù)中,經(jīng)常需要將本申請(qǐng)的的序列與對(duì)比文件進(jìn)行比對(duì),那么這種對(duì)比通過(guò)NCBI又是如何實(shí)現(xiàn)的呢?
下面就通過(guò)兩個(gè)簡(jiǎn)單的序列進(jìn)行展示。在檢索信息頁(yè)面,將圈紅的選中,就會(huì)再出現(xiàn)一個(gè)填寫(xiě)序列的對(duì)話(huà)框,將需要對(duì)比的序列填入,點(diǎn)擊BLAST。
檢索結(jié)果如下圖,相似的是92%,序列的差別就是紅框部分。
好啦,小編就先分享到這了,希望這些能幫助到大家打天下。
更多交流,歡迎關(guān)注公眾號(hào)獲得進(jìn)群邀請(qǐng)!
加好友獲取課程、直播、學(xué)習(xí)資料!
微信掃一掃
關(guān)注該公眾號(hào)