摘要:密碼子優(yōu)化是基因表達(dá)優(yōu)化的關(guān)鍵步驟之一。其中涉及 mRNA 二級(jí)結(jié)構(gòu)、稀有密碼子、核糖體結(jié)合位點(diǎn)等關(guān)鍵因素。簡(jiǎn)單說(shuō),基因能否順利表達(dá)蛋白與稀有密碼子含量、mRNA 結(jié)構(gòu)是否阻礙翻譯有很大關(guān)系。德泰開(kāi)發(fā)的生物信息學(xué)軟MaxCodonTM 經(jīng)過(guò)近千個(gè)項(xiàng)目實(shí)踐的優(yōu)化,可以幾乎完美地優(yōu)化這些關(guān)鍵因素,為蛋白表達(dá)提供堅(jiān)實(shí)基礎(chǔ)?;虮磉_(dá)優(yōu)化還包括載體,表達(dá)系統(tǒng)特異性,表達(dá)條件優(yōu)化。
密碼子優(yōu)化
密碼子優(yōu)化涉及的優(yōu)化點(diǎn)可以從基因合成、載體構(gòu)建、基因轉(zhuǎn)錄、mRNA 翻譯、翻譯后修飾等過(guò)程中提取,目的只有一個(gè),就是便于相關(guān)過(guò)程的高效達(dá)成。以下是部分優(yōu)化內(nèi)容:
特定功能的Motif
許多 motif 在基因表達(dá)過(guò)程中承擔(dān)著重要的角色,隨著研究的不斷開(kāi)展,功能性 motif 也在不斷被發(fā)現(xiàn),我們會(huì)將其不斷地添加到南京德泰生物的密碼子優(yōu)化工具中。舉例如下:
TATA 框:是構(gòu)成真核生物的啟動(dòng)子元件之一,位于轉(zhuǎn)錄起始點(diǎn)上游-30bp 處,它可以保證轉(zhuǎn)錄的正確定位。
SD 序列: 作為原核表達(dá)的核糖體綁定位點(diǎn),是翻譯必不可少的信號(hào)。
Kozak 序列:真核生物中符合 Kozak 規(guī)則的基因,其轉(zhuǎn)錄及翻譯效率較好。
Chi 序列:在原核生物中能夠增加自然重組的幾率,可能會(huì)影響人工重組蛋白的表達(dá)。
隱蔽剪切位點(diǎn):真核生物中存在大量的隱蔽剪切位點(diǎn)(cryptic splice sites),一旦被激活,會(huì)造成 mRNA 的剪接偏離我們的預(yù)期。
仔細(xì)研究轉(zhuǎn)錄、翻譯的過(guò)程,并不斷閱讀基礎(chǔ)資料及最新研究進(jìn)展,不斷搜集相關(guān)的 motif 模式,我們南京德泰生物在不斷完善密碼子優(yōu)化算法。在載體設(shè)計(jì)上,我們要通盤(pán)考慮。當(dāng)然,部分 motif 已經(jīng)固化到了商業(yè)載體上了。
重復(fù)序列
重復(fù)序列過(guò)多,會(huì)增加基因合成的難度。反向互補(bǔ)序列也對(duì) mRNA 二級(jí)結(jié)構(gòu)有重要影響。
GC 含 量
相對(duì)于 AT 配對(duì)需要 2 個(gè)氫鍵,GC 配對(duì)是 3 個(gè)氫鍵,GC 含量直接影響著 PCR 退火溫度。在啟動(dòng)子等保守區(qū)域 GC 含量相對(duì)較高。GC 含量也影響著 mRNA 熱力學(xué)穩(wěn)定性及 mRNA 二級(jí)結(jié)構(gòu)。
mRNA 二級(jí)結(jié)構(gòu)
mRNA 二級(jí)結(jié)構(gòu)是影響翻譯過(guò)程的重要因素,復(fù)雜穩(wěn)定的二級(jí)結(jié)構(gòu)會(huì)阻礙翻譯過(guò)程的順利進(jìn)行,特別是核糖體綁定位點(diǎn)(RBS) 附近的二級(jí)結(jié)構(gòu)。mRNA 的二級(jí)結(jié)構(gòu)預(yù)測(cè)是一個(gè)復(fù)雜的過(guò)程,需要考慮堿基配對(duì)、自由能等多種因素,南京德泰生物的密碼子優(yōu)化系統(tǒng)可以快速有效識(shí)別發(fā)卡(Hairpin)結(jié)構(gòu)區(qū)并進(jìn)行有效規(guī)避。
密碼子偏好性
不同物種的種屬之間,對(duì)同義密碼子的使用頻率是不同的。在外源基因的同義密碼子使用頻率與表達(dá)宿主相匹配的 情況下,外源基因的表達(dá)水平會(huì)顯著提高。常用密碼子適應(yīng)指數(shù)(Codon Adaption Index)來(lái)表示。
限制性酶切位點(diǎn)
限制性酶切位點(diǎn)需要根據(jù)實(shí)際情況進(jìn)行排除,以免與需要用到的酶切位點(diǎn)產(chǎn)生沖突,影響重組基因的操作。