本发明涉及一种蛋白质序列特征可视化提取方法,主要包括首先对蛋白质序列中每个氨基酸进行数字编码,通过编码模型将蛋白质字符序列转换成反映蛋白质序列理化性质的三个数字序列,再基于偏序理论构建三个哈斯矩阵,通过变换将这三个哈斯矩阵转换成一个改进的哈斯矩阵,这个改进的哈斯矩阵中的元素由“0”、“1”、“2”、“3”、“4”、“5”、“6”、和“7”八个数字构成,再将改进的哈斯矩阵转换为8种颜色的图像,得到具有蛋白质全序列特征可视化图形。本发明方法具有全序列分析、直观性和普适性的特点,从生成的可视化序列图像中可得到不同蛋白质序列具有的特征。
Copyright © 2015 科易网 版权所有 闽ICP备07063032号-5