期刊文献+
共找到11篇文章
< 1 >
每页显示 20 50 100
用于基因数据挖掘的基因表达数据库GEO 被引量:19
1
作者 余海浪 马文丽 郑文岭 《中国生物工程杂志》 CAS CSCD 北大核心 2007年第8期96-103,共8页
使用高通量方法学来检测基因表达情况在最近几年已非常普遍。微集芯片技术可同时定量成千上万的基因转录本。基因表达综合数据库(Gene Expression Omnibus简称GEO)是目前最大的而且完全公开的高通量分子丰度数据库,主要储存基因表达数... 使用高通量方法学来检测基因表达情况在最近几年已非常普遍。微集芯片技术可同时定量成千上万的基因转录本。基因表达综合数据库(Gene Expression Omnibus简称GEO)是目前最大的而且完全公开的高通量分子丰度数据库,主要储存基因表达数据。该数据库以一个灵活开放的设计理念,允许用户或科研人员来递呈,保存和检索多种不同类型的数据。综述了近年来该数据库在基因表达数据挖掘中的应用,同时介绍一些通过使用用户友好网络界面能有效探索、查询和再现数百个实验和数百万个基因表达谱的工具,以方便数据进行挖掘和可视化。登录GEO公用数据库的网址为:http://www.ncbi.nlm.nih.gov/geo。 展开更多
关键词 geo dna微阵列 基因表达 数据挖掘
在线阅读 下载PDF
基因表达数据的聚类分析研究进展 被引量:25
2
作者 岳峰 孙亮 +2 位作者 王宽全 王永吉 左旺孟 《自动化学报》 EI CSCD 北大核心 2008年第2期113-120,共8页
基因表达数据的爆炸性增长迫切需求自动、有效的数据分析工具.目前聚类分析己成为分析基因表达数据获取生物学信息的有力工具.为了更好地挖掘基因表达数据,近年来提出了许多改进的传统聚类算法和新聚类算法.本文首先简单介绍了基因表达... 基因表达数据的爆炸性增长迫切需求自动、有效的数据分析工具.目前聚类分析己成为分析基因表达数据获取生物学信息的有力工具.为了更好地挖掘基因表达数据,近年来提出了许多改进的传统聚类算法和新聚类算法.本文首先简单介绍了基因表达数据的获取和表示,之后系统地介绍了近年来应用在基因表达数据分析中的聚类算法.根据聚类目标的不同将算法分为基于基因的聚类、基于样本的聚类和两路聚类,并对每类算法介绍了其生物学的含义及其难点,详细讨论了各种算法的基本原理及优缺点.最后总结了当前的基因表达数据的聚类分析方法,并对发展趋势作了进一步的展望. 展开更多
关键词 dna微阵列 基因表达数据 聚类分析
在线阅读 下载PDF
一种肿瘤基因表达数据的知识提取方法 被引量:13
3
作者 李颖新 刘全金 阮晓钢 《电子学报》 EI CAS CSCD 北大核心 2004年第9期1479-1482,共4页
本文以多发性骨髓瘤的基因表达数据为例 ,利用数据挖掘技术 ,提出了一种针对基因表达数据进行知识发现的方法 .该方法通过计算基因的信息增益 ,结合神经网络 ,找出了特征基因集合 ,最后利用决策树进行特征规则的提取 ,给出了基于多发性... 本文以多发性骨髓瘤的基因表达数据为例 ,利用数据挖掘技术 ,提出了一种针对基因表达数据进行知识发现的方法 .该方法通过计算基因的信息增益 ,结合神经网络 ,找出了特征基因集合 ,最后利用决策树进行特征规则的提取 ,给出了基于多发性骨髓瘤数据样本的产生式规则 ,为生物医学研究提供了一种分析和研究基因表达数据的参考方法 .实验结果表明了该方法的有效性 . 展开更多
关键词 dna芯片 基因表达 数据挖掘 神经网络 多发性骨髓瘤
在线阅读 下载PDF
最小支撑树算法在基因表达数据聚类分析中的应用 被引量:1
4
作者 张焕萍 王惠南 宋晓峰 《南京航空航天大学学报》 EI CAS CSCD 北大核心 2007年第2期171-175,共5页
聚类分析已成为对基因表达数据进行挖掘以提取生物医学信息的主要方法。本文提出了基于图论的最小支撑树(Minimum spanning tree,MST)聚类算法,用MST表示多维基因表达数据,可将数据的聚类转换为对最小支撑树的分割,相对于传统聚类方法,... 聚类分析已成为对基因表达数据进行挖掘以提取生物医学信息的主要方法。本文提出了基于图论的最小支撑树(Minimum spanning tree,MST)聚类算法,用MST表示多维基因表达数据,可将数据的聚类转换为对最小支撑树的分割,相对于传统聚类方法,最小支撑树算法具有形象直观、对一些准则函数能产生全局最优解等优点;将MST算法分别与Memetic algorithm及人工免疫算法(Artificial immune network,aiNet)相结合,则产生更优化的聚类结果。对酵母基因表达数据的实验结果表明,最小支撑树聚类算法是一种有效的基因表达数据的聚类方法。 展开更多
关键词 最小支撑树 基因表达数据 聚类分析 dna微阵列
在线阅读 下载PDF
基因表达谱芯片数据挖掘系统 被引量:2
5
作者 李荣 《计算机应用研究》 CSCD 北大核心 2009年第8期2938-2941,共4页
基因芯片是基因组研究的重要工具,其数据分析极大依赖于数据挖掘技术。结合数据挖掘技术和生物信息学研究,设计并实现了若干基因表达谱芯片数据挖掘分析模型及相应的数据挖掘系统,具有良好的收缩性和实体独立性,底层复杂的数据挖掘算法... 基因芯片是基因组研究的重要工具,其数据分析极大依赖于数据挖掘技术。结合数据挖掘技术和生物信息学研究,设计并实现了若干基因表达谱芯片数据挖掘分析模型及相应的数据挖掘系统,具有良好的收缩性和实体独立性,底层复杂的数据挖掘算法对用户透明。 展开更多
关键词 数据挖掘 生物信息学 基因芯片 基因表达 分析模型
在线阅读 下载PDF
模糊C-均值聚类分析在基因表达数据分析中的应用 被引量:3
6
作者 陈佳妮 段文英 丁徽 《森林工程》 2010年第2期54-57,76,共5页
为更好地挖掘基因表达数据、获取更多的生物学信息,近年来许多改进的传统聚类算法和新聚类算法不断涌现。模糊聚类在聚类分析中又具有广泛的意义和重要的应用价值。叙述基因表达数据的获取和表达,介绍应用在基因表达数据中的模糊C均值... 为更好地挖掘基因表达数据、获取更多的生物学信息,近年来许多改进的传统聚类算法和新聚类算法不断涌现。模糊聚类在聚类分析中又具有广泛的意义和重要的应用价值。叙述基因表达数据的获取和表达,介绍应用在基因表达数据中的模糊C均值聚类算法以及不同的实现途径和相应的优缺点,简述聚类结果的评价问题,并对发展趋势做进一步的展望。 展开更多
关键词 dna微阵列 基因表达数据 聚类分析
在线阅读 下载PDF
基因表达数据中的局部模式挖掘研究综述 被引量:3
7
作者 姜涛 李战怀 《计算机研究与发展》 EI CSCD 北大核心 2018年第11期2343-2360,共18页
基因微阵列(DNA microarray)是实验分子生物学中的一个重要突破,其使得研究者可以同时监测多个基因在多个实验条件下表达水平的变化,进而为发现基因协同表达网络、研制药物、预防疾病等提供技术支持.研究者们提出了大量的聚类算法来分... 基因微阵列(DNA microarray)是实验分子生物学中的一个重要突破,其使得研究者可以同时监测多个基因在多个实验条件下表达水平的变化,进而为发现基因协同表达网络、研制药物、预防疾病等提供技术支持.研究者们提出了大量的聚类算法来分析基因表达数据,但是标准的聚类算法(单向聚类)只能发现少量的知识.因为基因不可能在所有实验条件下共表达,也不可能展示出相同的表达水平,但是可能参与多种遗传通路.在这种情况下,双聚类方法应运而生.这样就将基因表达数据的分析从整体模式转向局部模式,从而改变了只根据数据的全部对象或属性将数据聚类的局面.主要从局部模式的定义、局部模式类型与标准、局部模式的挖掘与查询等方面进行了梳理.介绍了基因表达数据中局部模式挖掘当前的研究现状与进展,详细总结了基于定量和定性的局部模式挖掘标准以及相关的挖掘系统,分析了存在的问题,并深入探讨了未来的研究方向. 展开更多
关键词 基因微阵列 基因表达 局部模式 保序子矩阵 双聚类 数据挖掘
在线阅读 下载PDF
基于R语言的基因表达芯片注释流程 被引量:1
8
作者 孙小洁 郑方强 曾健明 《生物加工过程》 CAS 2021年第1期17-22,共6页
基于R语言,将R程序包Rsubread、Rsamtools、refGenome和GenomicRanges整合为一个完整的流程,实现了基因表达芯片探针序列的自主注释。以应用范围最广的GPL570,GPL10558和曾使用的GPL21163芯片平台为测试数据进行重注释,并将GPL570的新... 基于R语言,将R程序包Rsubread、Rsamtools、refGenome和GenomicRanges整合为一个完整的流程,实现了基因表达芯片探针序列的自主注释。以应用范围最广的GPL570,GPL10558和曾使用的GPL21163芯片平台为测试数据进行重注释,并将GPL570的新注释与现存的注释做比较;对较新的长链非编码RNA表达芯片GPL16956进行自主注释,以测试流程的实用性。结果表明:GPL570的自主注释覆盖到了89.58%的探针,GPL10558、GPL21163和GPL16956的自主注释分别覆盖到了81.54%、84.68%和76.15%的探针。在GPL570新注释单独比对到的7107个基因中,有411个编码蛋白的基因能够富集到GO条目,而另外两种注释未能比对到这些基因,证明了本流程的可靠性和先进性。因此,本流程实用、有效,为数据挖掘工作提供了新的有力工具。 展开更多
关键词 基因表达芯片(geo) 数据挖掘 R语言
在线阅读 下载PDF
基于基因表达数据的双聚类分析研究
9
作者 罗德相 李飞龙 欧旭 《河南科技》 2018年第34期23-25,共3页
基因芯片及高通量技术的广泛应用产生了大量的基因表达数据,海量数据蕴涵着非常丰富的生物信息,利用聚类分析可以有效分析蕴含在其中的规律和知识。然而,基因表达数据普遍为高维稀疏矩阵,传统单聚类分析很难寻找到隐藏在海量基因表达数... 基因芯片及高通量技术的广泛应用产生了大量的基因表达数据,海量数据蕴涵着非常丰富的生物信息,利用聚类分析可以有效分析蕴含在其中的规律和知识。然而,基因表达数据普遍为高维稀疏矩阵,传统单聚类分析很难寻找到隐藏在海量基因表达数据的局部有用信息。为了更好地挖掘海量数据中有用的局部信息,人们从思想上提出了有别于传统的聚类算法的双聚类概念,其主要强调在聚类时基因和条件的同时性。 展开更多
关键词 基因芯片 dna微阵列 基因表达数据 聚类分析 双聚类分析
在线阅读 下载PDF
GEO-基因表达综合数据库的应用与数据挖掘 被引量:2
10
作者 阴常欣 马文丽 郑文岭 《医学分子生物学杂志》 CAS CSCD 2009年第2期161-166,共6页
高通量微阵列杂交技术和测序技术的快速发展,产生了大量的基因数据,生物信息迅速膨胀成为数据的海洋。为适应这种高通量基因表达数据的不断增长和人们共享数据的需要,各种数据库应用而生,其中,NCBI(national center for biotechno... 高通量微阵列杂交技术和测序技术的快速发展,产生了大量的基因数据,生物信息迅速膨胀成为数据的海洋。为适应这种高通量基因表达数据的不断增长和人们共享数据的需要,各种数据库应用而生,其中,NCBI(national center for biotechnology information)的基因表达综合数据库(gene expression omnibus,GEO)是世界上最大的储存高通量分子丰度数据的公共数据库,用户可以提交、储存和检索多种形式的数据并免费使用。迄今为止,GEO已收录了300000个样本的数据,涉及16亿个基因表达丰度数据,涵盖500多种生物体,广泛覆盖各种生物学内容。GEO数据库操作简单,数据全面,免费共享的优势为后期数据挖掘和信息推广提供了良好的平台。文章概述了GEO数据库的结构、数据的提交、检索和其在分子生物学领域中的应用前景。登陆GEO数据库的网址为:http://www.ncbi.nlm.nih.gov/geo。 展开更多
关键词 基因表达综合数据库 基因表达 数据挖掘
原文传递
乳腺癌基因芯片实验数据分析与挖掘 被引量:2
11
作者 蒋峥 卜友泉 +2 位作者 刘忠于 宋方洲 张世强 《医学分子生物学杂志》 CAS CSCD 2011年第3期220-224,252,共6页
目的 对公共数据库上下载得到的乳腺癌基因芯片试验结果进行数据分析,找出在正常组织与癌组织中呈现差异表达的基因,并寻找差异表达基因的相关基因.方法 综合运用显著性分析(SAM)、顶级评分基因对(TSP)、关联规则挖掘等方法,对数据... 目的 对公共数据库上下载得到的乳腺癌基因芯片试验结果进行数据分析,找出在正常组织与癌组织中呈现差异表达的基因,并寻找差异表达基因的相关基因.方法 综合运用显著性分析(SAM)、顶级评分基因对(TSP)、关联规则挖掘等方法,对数据进行处理.结果 筛选出若干呈现差异表达的基因,并且寻找了其中一部分基因的可能高度相关的基因.结论 筛选出的基因及其相关基因可用于为进一步的研究提供候选基因. 展开更多
关键词 基因芯片 数据挖掘 乳腺癌 差异表达基因 关联规则
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部