我们可以提供的
核酸和蛋白质数据集
其它功能数据库
核酸数据集
收录源自NCBI Genbank核酸数据库4000多万条核酸数据,覆盖人、大鼠、小鼠三个物种,记录包含核酸序列、序列描述、序列长度、分子类型等信息。
基因数据集
收录源自NCBI Gene数据库4000多万条基因数据,覆盖古细菌、细菌、真核生物与病毒在内的所有物种,记录包含基因所在的物种、参考序列、在基因组上的定位、表型特征等多方面信息。
蛋白质结构数据集
收录源自Uniprot蛋白序列数据库50多万条高质量的、手工注释的非冗余的蛋白质信息,包含蛋白质的基本信息、序列、序列特征、功能、名称和谱系、亚细胞定位、疾病与变异、翻译后修饰、表达、相互作用等信息。
蛋白质序列数据集
收录源自Protein Data Bank(PDB)蛋白质结构数据库20多万条经过X射线单晶衍射、核磁共振、电子衍射等实验手段确定的生物大分子(蛋白质、核酸和糖)2.5维(以二维的形式表示三维的数据)结构数据,记录包括蛋白质结构、基本信息、实验数据、参考文献等。