除了核苷酸序列數(shù)據(jù)庫(kù),另外一個(gè)主要的初級(jí)數(shù)據(jù)源來(lái)自各種基因組測(cè)序計(jì)劃?;蚪M數(shù)據(jù)庫(kù)的主要內(nèi)容為收集基因組序列、注釋結(jié)果并且展示這些序列。目前許多基因組已經(jīng)測(cè)序完成,這些基因組的大部分信息在ENA、GenBank 等數(shù)據(jù)庫(kù)...[繼續(xù)閱讀]
海量資源,盡在掌握
除了核苷酸序列數(shù)據(jù)庫(kù),另外一個(gè)主要的初級(jí)數(shù)據(jù)源來(lái)自各種基因組測(cè)序計(jì)劃?;蚪M數(shù)據(jù)庫(kù)的主要內(nèi)容為收集基因組序列、注釋結(jié)果并且展示這些序列。目前許多基因組已經(jīng)測(cè)序完成,這些基因組的大部分信息在ENA、GenBank 等數(shù)據(jù)庫(kù)...[繼續(xù)閱讀]
非編碼RNA(non-coding RNA)包括rRNA、tRNA、snRNA、snoRNA 和microRNA 等,它們的共同特點(diǎn)是都能轉(zhuǎn)錄但是不翻譯成蛋白,在RNA 水平上就能行使各自的生物學(xué)功能。非編碼RNA 從長(zhǎng)度上來(lái)劃分可以分為3類(lèi):小于50nt,包括miRNA、siRNA、piRNA;50nt 到500nt,包括...[繼續(xù)閱讀]
1.蛋白質(zhì)序列數(shù)據(jù)庫(kù)Swiss-Prot 和PIR 是國(guó)際上兩個(gè)主要的蛋白質(zhì)序列數(shù)據(jù)庫(kù),目前這兩個(gè)數(shù)據(jù)庫(kù)在EMBL和GenBank 數(shù)據(jù)庫(kù)上均建立了鏡像(mirror)站點(diǎn)。Swiss-Prot 數(shù)據(jù)庫(kù)包括了從EMBL 翻譯而來(lái)的蛋白質(zhì)序列,這些序列經(jīng)過(guò)了人工檢驗(yàn)和注釋。該數(shù)...[繼續(xù)閱讀]
表1-2.13 部分代謝途徑數(shù)據(jù)庫(kù)網(wǎng)址生物體內(nèi)基因經(jīng)由轉(zhuǎn)錄并翻譯成蛋白質(zhì)后,參與的各種復(fù)雜的生化反應(yīng),使物質(zhì)A 到物質(zhì)X 的酶反應(yīng)按常規(guī)程序(A→B→C→……X)進(jìn)行,稱(chēng)為A 至X 的代謝途徑(metabolic pathway )。代謝途徑數(shù)據(jù)庫(kù)中較為常用和...[繼續(xù)閱讀]
1.代謝組學(xué)數(shù)據(jù)庫(kù)代謝組學(xué)數(shù)據(jù)庫(kù)是收錄在代謝組學(xué)通路中的酶、化合物以及基因等成分信息的數(shù)據(jù)庫(kù)。其中MetaboLights (http://www.ebi.ac.uk/metabolights/)為EMBL 下屬的代謝組學(xué)數(shù)據(jù)庫(kù)(圖1-2.15),主要內(nèi)容包含代謝組學(xué)實(shí)驗(yàn)數(shù)據(jù)以及相關(guān)聯(lián)的衍...[繼續(xù)閱讀]
1.什么是一級(jí)數(shù)據(jù)庫(kù)和二級(jí)數(shù)據(jù)庫(kù),它們有什么異同?2.簡(jiǎn)述Fasta 和Fastq 格式,并比較它們的異同。3.如何向NCBI 遞交序列? 列舉三種方法。如果遞交序列數(shù)據(jù)很大或序列條數(shù)很多應(yīng)該如何解決?4.如何下載水稻基因組的特定區(qū)段序列或注釋...[繼續(xù)閱讀]
序列聯(lián)配(sequence alignment)也叫序列對(duì)比,是生物信息學(xué)中的重要內(nèi)容之一,許多生物信息學(xué)分析均涉及序列聯(lián)配方法。如下兩條DNA 序列:我們簡(jiǎn)單地把它們聯(lián)配如下,僅有兩個(gè)堿基匹配:如果我們?cè)谝粭l序列中引入一個(gè)空位或空格(gap),即一...[繼續(xù)閱讀]
構(gòu)建計(jì)分矩陣,我們需要找到一個(gè)可以估計(jì)任何聯(lián)配的某一統(tǒng)計(jì)數(shù),使生物學(xué)關(guān)系最顯著的聯(lián)配統(tǒng)計(jì)數(shù)最大。先看以下2條氨基酸序列的聯(lián)配情況。如果我們將各殘基按相同率處理,則2種聯(lián)配方式(a 和b)的得分是相等的(9個(gè)殘基中5個(gè)匹配...[繼續(xù)閱讀]
1.PAM 替換矩陣已故Dayhoff 是蛋白質(zhì)序列比較的先驅(qū),她和她的同事們通過(guò)對(duì)蛋白質(zhì)進(jìn)化模式的研究,建立了一組被廣泛應(yīng)用的氨基酸替換矩陣,這些矩陣常被稱(chēng)為Dayhoff 矩陣、MDM(mutation data matrix)或PAM(percent accepted mutation)矩陣。由于蛋白質(zhì)...[繼續(xù)閱讀]
PSSM(position-specific scoring matrix)是由一個(gè)簡(jiǎn)單對(duì)數(shù)變換而來(lái)的矩陣,它給出不同來(lái)源的一小段保守序列(基序)各個(gè)特定位置氨基酸的頻率。PSSM 可以用于一條序列的保守序列的搜索。一條序列中,與PSSM 最相似的位置即為PSSM 代表的基序位...[繼續(xù)閱讀]