一个密码子对应一个氨基酸,但一个氨基酸可能对应多个密码子,基因蛋白质表达量有所差异时可通过改变基因的密码子来提高目的蛋白的表达量。随着生命科学、生物技术的快速发展,人们对于机体生理生化机制认识更加深入,也为密码子优化策略提供新的指导,泓迅生物为大家分享的是我司最新推出的密码子优化升级版——密码子优化2.0,快来了解一下吧!
密码子优化策略
1. 密码子偏向性
每一个宿主细胞会有一套自己的密码子使用频率表,在宿主细胞里,使用频率高的密码子(最佳密码子)其对应的tRNA丰度高,由使用频率高的密码子组成的mRNA,其蛋白表达也会很高。密码子适应指数CAI(Codon Adaption Index)指的是异源mRNA序列中密码子和宿主细胞最佳密码子使用频率的相符程度,通常情况下,CAI≥0.80被认为是预测重组蛋白高效表达的标准,所以密码子优化的最基本原则就是用宿主细胞中使用频率高的同义密码子去替换外源mRNA序列中密码子,保证外源mRNA序列中的密码子和宿主细胞的密码子使用偏向性更加契合,避免稀有密码子。
2. mRNA二级结构
mRNA二级结构是影响翻译过程的重要因素,复杂稳定的二级结构会阻碍翻译过程的顺利进行,特别是核糖体绑定位点(RBS)附近的二级结构。mRNA二级结构在DNA序列中主要表现为发卡结构(Hairpin),有效识别并尽可能的减少发卡结构是密码子优化软件优劣的重要判断标准。
3.GC含量
AT间存在2个氢键,GC间存在3个氢键,所以GC含量直接影响着DNA序列的结合稳定性和退火温度。在启动子等保守区域GC含量相对较高。另外,GC含量也影响着mRNA热力学稳定性及mRNA二级结构。研究表明,GC含量大于70%会造成RNA二级结构稳定性增加,减慢或暂停翻译;而GC含量小于30%,则会减慢转录延伸,也不利于蛋白表达。在真核生物中,还有一些对转录有重要影响的元件,如CpG岛,TATA盒等重复序列,对序列的GC含量也非常重要。
泓迅生物密码子优化2.0
泓迅生物围绕密码子偏好性、GC含量、串联短重复序列、发夹结构等影响异源蛋白表达的因素进行算法设计,自主开发的NGTMCodon密码子优化技术,可显著提高原核蛋白的成功率和蛋白可溶性。
未经密码子优化与密码子优化2.0对比
1.蛋白R0103,分子量53.48kDa,未优化序列分别构建于pET-28a(+)载体,采用37℃及16℃两种条件进行异源蛋白表达,未优化的序列未见目的蛋白表达,经过泓迅生物NGTMCodon密码子优化2.0在37℃和16℃均有显著目标蛋白表达。
2.蛋白R0118,分子量35.77kDa,未优化序列分别构建于pET-28a(+)载体,采用37℃及16℃两种条件进行异源蛋白表达,未优化的序列未见目的蛋白表达,经过泓迅生物NGTMCodon密码子优化2.0在37℃和16℃均有显著目标蛋白表达,可溶性蛋白表达比例较高。
参考文献
[1] Hongguang Fu, Yanbing Liang, Xiuqin Zhong, et al. Codon optimization with deep learning to enhance protein expression. Sci Rep. 2020. 10: 17617.
[2] Yi Liu, Qian Yang, and Fangzhou Zhao. Synonymous but not silent: the codon usage code for gene expression and protein folding. Annu Rev Biochem. 2021. 90: 375–401.