功能域和基序通過多序列聯(lián)配等途徑可以獲得它們的聯(lián)配結(jié)果(如圖1-4.4NBS 功能域)。在分子生物學(xué)領(lǐng)域,大量功能基因被克隆,大量功能域被發(fā)現(xiàn);同時(shí),基于序列分析,也可以發(fā)現(xiàn)大量基因共同保守的區(qū)段,這些為未知功能的候選功能域。...[繼續(xù)閱讀]
海量資源,盡在掌握
功能域和基序通過多序列聯(lián)配等途徑可以獲得它們的聯(lián)配結(jié)果(如圖1-4.4NBS 功能域)。在分子生物學(xué)領(lǐng)域,大量功能基因被克隆,大量功能域被發(fā)現(xiàn);同時(shí),基于序列分析,也可以發(fā)現(xiàn)大量基因共同保守的區(qū)段,這些為未知功能的候選功能域。...[繼續(xù)閱讀]
信息量或信息熵的概念來自信息論。當(dāng)我們說一條信息或消息,我們會(huì)問其信息量有多大或它可以提供給我們多少明確的信息。一條消息的信息量越大,其不確定性就越小。例如,我們說“今年將在中國召開G20峰會(huì)”和“2016年9月將在杭...[繼續(xù)閱讀]
在生物信息學(xué)領(lǐng)域,信息熵有兩個(gè)廣泛應(yīng)用,如計(jì)分矩陣信息量的估計(jì)和序列保守性的圖形描述等。1.計(jì)分矩陣我們構(gòu)建了一個(gè)計(jì)分矩陣(如PSSM、PAM 和BLOSUM 矩陣)之后,經(jīng)常會(huì)問的一個(gè)問題是,該矩陣用于序列搜索或保守區(qū)段的搜索效果如...[繼續(xù)閱讀]
1.簡述漸進(jìn)多序列聯(lián)配算法(ClustalW 算法)。2.什么是功能域和基序(motif)?3.簡述幾種功能域的描述方式(模型)。4.請構(gòu)建多序列聯(lián)配結(jié)果(功能域)的馬爾可夫模型并簡要說明。5.說明PSSM 等矩陣的熵(H)和信息量(IC)的概念。...[繼續(xù)閱讀]
一個(gè)生物體的基因組是指一套染色體中完整的DNA 序列。例如,生物個(gè)體二倍體體細(xì)胞由兩套染色體組成,其中一套DNA 序列就是一個(gè)基因組。也就是說,對于單倍體細(xì)胞,基因組是指編碼序列和非編碼序列在內(nèi)的全部DNA 分子。對于有性生...[繼續(xù)閱讀]
在完成基因組序列拼接后,可以獲得基因組的主要DNA 序列,甚至可能是整個(gè)基因組各條染色體的序列。這些序列中包含許多未知基因,將基因從這些基因組序列中找出來是生物信息學(xué)的一個(gè)重要任務(wù)?;蚪MDNA 序列上,一個(gè)蛋白質(zhì)編碼...[繼續(xù)閱讀]
在進(jìn)行基因組序列注釋過程中,一般會(huì)遇到兩種情況:一是僅針對少量目標(biāo)序列(如若干BAC 克隆序列)進(jìn)行基因注釋,目的是了解這些序列上可能的功能基因,二是針對一個(gè)新測序基因組進(jìn)行全基因組水平的基因注釋。對于第一種情況,可以...[繼續(xù)閱讀]
馬爾可夫模型,也叫馬爾可夫過程或馬爾可夫鏈(Markov chain),是俄羅斯數(shù)學(xué)家Markov 在研究俄羅斯文學(xué)家普希金《奧涅金》作品不同音的出現(xiàn)規(guī)律時(shí),于1907年提出來的一個(gè)數(shù)學(xué)模型,它是研究隨機(jī)過程統(tǒng)計(jì)特征的一種概率模型。假設(shè)存在一...[繼續(xù)閱讀]
隱馬爾可夫模型在實(shí)際應(yīng)用中會(huì)涉及3個(gè)基本問題,即評估問題(evaluation)、解碼問題(decoding)和學(xué)習(xí)問題(learning)。評估問題是已知觀察序列O 和模型λ,如何計(jì)算由此模型產(chǎn)生此觀察序列的概率P(O|λ)? 解碼問題是已知觀察序列O 和模型λ...[繼續(xù)閱讀]
1.HMM 基因預(yù)測模型HMM 是20世紀(jì)90年代最早在原核生物上用于基因預(yù)測。當(dāng)時(shí)被用于大腸桿菌E.coli的基因預(yù)測(Krogh 等,1994),而在這之前,馬爾可夫模型已在原核生物上被用于基因預(yù)測(Borodovsky 和McIninch,1993)。而后,HMM 被用于人類等真核生...[繼續(xù)閱讀]