结构生物化学/核酸/RNA/RNA二级结构
外观
- -RNA碱基:A,G,C,U
- -碱基对:A-U, G-C
- -非典型碱基对:G-U
- -稳定性:G-C > A-U > G-U
- -单链:链折叠成自身形成碱基对;可以具有多种二级结构形式
- 碱基配对稳定结构
- 未配对部分-环状结构不稳定结构
- 当一个位置的碱基发生变化时,与之配对的碱基也必须发生变化以保持相同的结构-协变
- -大多数碱基对是非交叉碱基对: -任何两个对 (i, j) 和 (i', j') -> i < i' <j' < j 或 i' < i < j < j'
- -二级结构的碱基对用圆圈表示
- -为结构中的每个碱基配对绘制一条弧线
- -序列的RNA二级结构数目:(递归关系)
- S(0)=S(1)=S(2)=1
- S(n+1)=S(n)+ƩS(j-1)S(n-j), (n≥2)
- -长度为n的RNA结构大约有13亿个,其中n为27
- 1) 发夹环 - 每个环长4个或更多个碱基
- 2) 凸出环 - 一侧的碱基不能形成碱基对
- 3) 内部环 - 两侧的碱基不能形成碱基对
- 4) 多环(连接点)– 2个或更多个双链区域汇聚形成一个封闭结构
- 1) 最大化碱基对
- -确定最大碱基对集
- -根据碱基配对能力排列碱基,以确定最佳结构
- -Nussinov算法:4种方法获得i和j之间的最佳结构
- -找到具有最多碱基对的结构:A-U和G-C
- 2) 最小化能量
- -确定特定位置处4个结构的最大分数
- -堆叠是主要的稳定力
- -能量最小化算法通过最小化自由能来预测二级结构
- -需要估计有助于二级结构的能量项
- -动态规划方法
- 1) 初始化
- 2) 递归
- 3) 回溯
- -不需要事先序列比对
- -任何位置相关的能量只受局部序列和结构的影响
- RNA折叠算法如何工作? S.R. Eddy. Nature Biotechnology, 22:1457-1458, 2004.
- <http://en.wikipedia.org/wiki/Biomolecular_structure>