13121.1341.2561.2.11.2.271.2.389102.12.1.111122.1.213序号时间模型发表期刊架构缺点11980sBlastKNN/输入:蛋白质序列;算法:通过比较目标蛋白与已知功能的蛋白质之间的相似性,然后采用一种相似性加权算法来预测目标蛋白的功能;早期机器学习算法,效率低22018年DeepGOBioinformatics输入:蛋白质序列和PPI网络;算法:基于卷积神经网络(CNN)的深度学习分类模型,使用3-mer编码蛋白质序列,取序列特征。对于PPI网络,采用DeepWalk生成每个蛋白质的256维网络拓扑特征;层次化分类网络需要巨大的内存资源,难以应用于大规模标签32020年DeepGOCNNBioinformatics输入:蛋白质序列;算法:从蛋白质序列中提取特征以预测功能,通过堆叠的CNN层来提取特征并预测蛋白质的功能最大预测蛋白质长度为200042020年DeepGOAIEEE/ACMTransactionsonComputationalBiologyandBioinformatics输入:蛋白质序列和PPI网络;算法:使用Word2vec生成序列的残基级嵌入,然后输入到Bi-LSTM和多尺度CNN层中以提取全局和局部特征;具有特殊特征的蛋白质功能无法预测,蛋白质序列最长为100052021年DeepGraphGOBioinformatics输入:蛋白质序列和PPI网络;算法:端到端模型,利用GNNs从PPI网络中提取信息以预测蛋白质功能;缺乏PPIs信息的新测序生物体难以预测62021年DeepFRINatureCommunications输入:蛋白质序列和结构;算法:融合了自监督语言模型和图卷积网络,从蛋白质序列的自监督模型中提炼出的序列特征及蛋白质结构来预测其功能;蛋白质序列训练集局限于PDB72022年GAT-GOBriefingsinBioinformatics输入:蛋白质序列和结构;算法:基于图注意力网络(...
发表评论取消回复