摘要:
目的 基因表达分析是阐释生物学表型和辅助疾病诊断的有力工具,脑组织的基因表达实验样品采集工作难度大、风险高、成本高,亟需一种能规避脑组织取样的表达谱检测替代方案.方法 以基因型-组织表达数据库(genotype-tissue expression,GTEx)中的脑组织样本配对的全血基因表达谱为输入特征数据,以13个脑组织的基因表达量分别为目标数据,挖掘全血基因表达量与脑组织中任一基因表达量数值的多对多关联关系,进而构建一个基于全血基因表达谱的未取样脑组织中基因表达量的回归预测模型.结果 针对每个基因分别提取包含15个最相关的全血基因表达量特征构成低维度的新特征数据集,构建了13个脑组织所有基因表达量线性回归预测模型.预测模型平均绝对误差为0.406 ~0.542,均方根误差为0.558 ~0.941.结论 本研究提出了一种基于全血基因表达量数据的脑组织基因表达量预测模型,证明仅用全血表达谱数据能比较准确地预测出未取样脑组织基因表达量,有望在转录组研究中规避脑组织样本的手术取样,为脑组织相关疾病的基因表达谱研究提供一种备选工具.