期刊文献+
共找到440篇文章
< 1 2 22 >
每页显示 20 50 100
面向工业场景的云边协同数据存储与检索架构
1
作者 秦学程 刘春颜 +1 位作者 李宝 赵蕴龙 《计算机应用》 北大核心 2025年第9期2902-2912,共11页
面向工业场景各业务域中数据分布式存储和跨域流转的场景,针对业务系统多而复杂、数据量庞大且部分数据不可上云的问题,提出云边协同的数据存储与检索架构,旨在实现大规模数据的统一存储和跨域高效流转。该架构中,设计基于资源描述框架(... 面向工业场景各业务域中数据分布式存储和跨域流转的场景,针对业务系统多而复杂、数据量庞大且部分数据不可上云的问题,提出云边协同的数据存储与检索架构,旨在实现大规模数据的统一存储和跨域高效流转。该架构中,设计基于资源描述框架(RDF)图模型的数据编码规则和基于S-tree(Signature-tree)的数据多层级高效存储策略,从而保证不可上云数据存储在边缘侧服务器上,而可上云数据存储在云服务器上。此外,提出面向云边协同存储的基于云边协同索引树(CECI-tree)的高效协同检索方法,通过云边协同索引机制提高数据检索的效率。所提架构与RDF-3X和GRIN等方法进行比的实验结果表明,该架构的运行效率和CPU利用率表现更优。 展开更多
关键词 分布式存储 资源描述框架 云边协同 协同存储 协同检索
在线阅读 下载PDF
分布式数据库中基于半连接的查询优化算法研究 被引量:23
2
作者 魏士伟 黄文明 +1 位作者 康业娜 周娅 《计算机应用》 CSCD 北大核心 2007年第B06期34-36,39,共4页
首先阐述了分布式查询优化的主要目标,介绍了半连接算法和基于半连接的二分劈开缩减算法,分析了两者的特点和不足并在其基础上提出了一种新的优化算法——两次半连接对接算法。通过进行两次半连接减少了通信信息量,并且利用多结点的并... 首先阐述了分布式查询优化的主要目标,介绍了半连接算法和基于半连接的二分劈开缩减算法,分析了两者的特点和不足并在其基础上提出了一种新的优化算法——两次半连接对接算法。通过进行两次半连接减少了通信信息量,并且利用多结点的并行性处理提高了查询的响应时间和处理速度。通过对三种算法的比较对新算法的性能进行了分析,结果表明,该算法在某些特定的环境下确实具有较高的处理速度、节点利用率和实际可行性,适合大规模的数据库查询。 展开更多
关键词 分布式数据库 查询处理和优化 半连接算法 响应时间 并行性
在线阅读 下载PDF
基于协处理器的HBase区域级第二索引研究与实现 被引量:16
3
作者 丁飞 陈长松 +2 位作者 张涛 杨涛 张岩峰 《计算机应用》 CSCD 北大核心 2014年第A01期181-185,共5页
针对HBase全表扫描查询效率问题,对HBase第二索引功能进行研究,实现一种基于HBase协处理器的服务端区域级第二索引扩展功能。通过将索引维护与查询放到服务端完成,极大地减少了网络通信开销。索引文件使用HFile格式组织。利用HFile成熟... 针对HBase全表扫描查询效率问题,对HBase第二索引功能进行研究,实现一种基于HBase协处理器的服务端区域级第二索引扩展功能。通过将索引维护与查询放到服务端完成,极大地减少了网络通信开销。索引文件使用HFile格式组织。利用HFile成熟的编程接口以及高效的读写性能,使得索引维护变得简单易行,也保证了索引读写的效率,提供了高效的查询性能。实践表明,该索引扩展机制能有效地满足集群应用中对大数据集的第二索引查询功能需求。 展开更多
关键词 HBase数据库 区域级 第二索引 协处理器 HFile格式
在线阅读 下载PDF
基于遗传算法的分布式数据库查询优化研究 被引量:23
4
作者 帅训波 马书南 +1 位作者 周相广 龚安 《小型微型计算机系统》 CSCD 北大核心 2009年第8期1600-1604,共5页
在收益半连接研究基础之上,本文提出一种新的查询执行计划代价模型,它包括关系副本选择、查询多连接次序、操作站点的选择、数据的传输及数据局部处理等因素,准确地表示了分布式数据库查询执行代价,并且给出了解决基于此代价模型查询优... 在收益半连接研究基础之上,本文提出一种新的查询执行计划代价模型,它包括关系副本选择、查询多连接次序、操作站点的选择、数据的传输及数据局部处理等因素,准确地表示了分布式数据库查询执行代价,并且给出了解决基于此代价模型查询优化问题的遗传算法,实验结果表明,该算法有较好的寻优效果,更具有实际意义. 展开更多
关键词 分布式数据库 查询优化 代价模型 遗传算法
在线阅读 下载PDF
云海大数据一体机体系结构和关键技术 被引量:10
5
作者 张东 亓开元 +4 位作者 吴楠 辛国茂 刘正伟 颜秉珩 郭锋 《计算机研究与发展》 EI CSCD 北大核心 2016年第2期374-389,共16页
为了弥补从大数据技术到行业应用之间的鸿沟,针对当前行业用户对大数据处理平台的持续扩展、一体化和多样性需求,提出了大数据一体机的可扩展性、可定制性和多类型处理模型,并基于此设计了云海大数据一体机.该一体机采用兼顾横向和纵向... 为了弥补从大数据技术到行业应用之间的鸿沟,针对当前行业用户对大数据处理平台的持续扩展、一体化和多样性需求,提出了大数据一体机的可扩展性、可定制性和多类型处理模型,并基于此设计了云海大数据一体机.该一体机采用兼顾横向和纵向可扩展的体系结构,并采用硬件可定制化设计和混合型软件架构支持多种大数据应用类型.在此基础上,针对HDFS元数据服务瓶颈问题、MapReduce负载倾斜问题、HBase的跨域问题,介绍了在云海大数据一体机中采用的多元数据服务、负载均衡和跨数据中心大表技术.在电信、金融和环保行业实际案例中的应用和测试表明,上述体系结构和关键技术是可行和有效的. 展开更多
关键词 大数据一体机 可扩展性 可定制性 混合型软件架构 大数据行业应用
在线阅读 下载PDF
利用J2EE构建XML Web Services的研究 被引量:9
6
作者 李慧盈 李德昌 +1 位作者 段羽 吕邦国 《计算机工程与应用》 CSCD 北大核心 2004年第5期128-130,共3页
IT界设想的Web服务是一种可以结合现在WWW技术和组件对象技术的优点而避免其缺点的技术。虽然Web是基于开放而简单的Internet标准,然而现在基于Web的对象技术标准却过于复杂繁多,且依赖复杂的局域网底层构造,从而使不同组件间的相互操... IT界设想的Web服务是一种可以结合现在WWW技术和组件对象技术的优点而避免其缺点的技术。虽然Web是基于开放而简单的Internet标准,然而现在基于Web的对象技术标准却过于复杂繁多,且依赖复杂的局域网底层构造,从而使不同组件间的相互操作出现严重的问题。该文研究在XMLWebServices架构下,利用J2EE技术,提供新一代网络应用技术所要解决的问题。 展开更多
关键词 Web SERVICES XML SOAP WSDL UDDI J2EE
在线阅读 下载PDF
天文大数据挑战与实时处理技术 被引量:8
7
作者 杨晨 翁祖建 +6 位作者 孟小峰 任玮 忻日辉 王春凯 都志辉 万萌 魏建彦 《计算机研究与发展》 EI CSCD 北大核心 2017年第2期248-257,共10页
超大型天文观测技术的出现不仅能够让研究人员观测到新的天文现象,更能用于验证已有物理模型的正确性.这些最新天文成果的发现是建立在海量天文数据的近乎实时产生、管理与分析的基础上,因此给目前的数据管理系统带来了新的挑战.以我国... 超大型天文观测技术的出现不仅能够让研究人员观测到新的天文现象,更能用于验证已有物理模型的正确性.这些最新天文成果的发现是建立在海量天文数据的近乎实时产生、管理与分析的基础上,因此给目前的数据管理系统带来了新的挑战.以我国自主研发的地基广角相机阵(the ground-based wide-angle camera array,GWAC)天文望远镜为例,15s的采样和处理周期都处于短时标观测领域的世界前列,但却对数据管理系统提出了很多问题,包括多镜头并行输出数据管理、实时瞬变源发现、当前观测夜数据的秒级查询、数据持久化和快速离线查询等.基于上述问题,设计了分布式GWAC数据模拟生成器用于模拟真实GWAC数据产生场景,并基于产生的数据特性,提出一种两级缓存架构,使用本地内存解决多镜头并行输出、实时瞬变源发现,使用分布式共享内存实现秒级查询.为了平衡持久化和查询效率,设计一种星表簇结构将整个星表数据划分后聚集存储.根据天文需求特点,设计基于索引表的查询引擎能从缓存和星表簇以较小的代价对星表数据查询.通过实验验证,当前方案能够满足GWAC的需求. 展开更多
关键词 天文大数据管理 地基广角相机阵 两级缓存 星表簇 索引表
在线阅读 下载PDF
基于统计方法的Hive数据仓库查询优化实现 被引量:16
8
作者 王有为 王伟平 孟丹 《计算机研究与发展》 EI CSCD 北大核心 2015年第6期1452-1462,共11页
Map/Reduce是海量离线数据分析中广泛应用的并行编程模型。Hive数据仓库基于Map/Reduce实现了查询处理引擎,然而Map/Reduce框架在处理偏斜数据时会出现工作负载分布不均的问题。均衡计算模型(computation balanced model,CBM),其核心... Map/Reduce是海量离线数据分析中广泛应用的并行编程模型。Hive数据仓库基于Map/Reduce实现了查询处理引擎,然而Map/Reduce框架在处理偏斜数据时会出现工作负载分布不均的问题。均衡计算模型(computation balanced model,CBM),其核心思想是通过数据分布特征指导查询计划优化。相应研究贡献包括2部分,首先针对应用极广的GroupBy查询和Join查询建立了运行估价模型,确定了不同场景下查询计划的优化选择分支;其次基于Hive ETL机制设计了一种统计信息收集方法,解决了统计海量数据分布特征的问题。实验数据表明,通过CBM优化的GroupBy查询耗时节省了8%~45%,Join查询耗时节省了12%~46%;集群CPU负载均衡指标优化了60%~80%,I/O负载均衡指标优化了60%~90%。实验结果证实了基于CBM模型优化的查询计划生成器能显著均衡化Hive查询运行时的集群负载,并优化了查询处理效率。 展开更多
关键词 海量数据离线处理 分布式数据仓库 负载均衡 统计信息收集 查询优化
在线阅读 下载PDF
基于纠删码和动态副本策略的HDFS改进系统 被引量:10
9
作者 李晓恺 代翔 +1 位作者 李文杰 崔喆 《计算机应用》 CSCD 北大核心 2012年第8期2150-2153,2158,共5页
为了让Hadoop分布式文件系统(HDFS)达到更高的存储效率以及更加优化的负载均衡能力,针对HDFS的多副本存储技术提出了改进方案——Noah。Noah引入了编码和译码模块,对HDFS中的block进行编码分解,生成更多数量的数据分片(section),并随机... 为了让Hadoop分布式文件系统(HDFS)达到更高的存储效率以及更加优化的负载均衡能力,针对HDFS的多副本存储技术提出了改进方案——Noah。Noah引入了编码和译码模块,对HDFS中的block进行编码分解,生成更多数量的数据分片(section),并随机地分散保存到集群当中,替代原有系统的多副本容灾策略;在集群出现节点失效的情况下,通过收集与失效block相关的任意70%左右的section进行原始数据的恢复;同时根据分布式集群运行情况以及对副本数目需求的不同采用动态副本策略。通过相关的集群实验,表明Noah在容灾效率、负载均衡、存储成本以及安全性上对HDFS作了相应的优化。 展开更多
关键词 HADOOP分布式文件系统 分布式存储 数据容灾 负载均衡 动态副本
在线阅读 下载PDF
基于B/S模式和分布式数据库技术的物流信息系统 被引量:9
10
作者 康瑞华 尹帆 薛胜军 《武汉理工大学学报(交通科学与工程版)》 北大核心 2003年第6期860-863,共4页
介绍了分布式数据库、物流系统、B/ S模式的概念 ,分布式数据库的设计步骤和原则 ,描述了分布式数据库在物流系统的体系结构中的体现 .最后以 ASP.NET和 SQL Server2 0 0 0为开发环境 ,列举了 B/ S模式下的分布式数据库应用程序开发和... 介绍了分布式数据库、物流系统、B/ S模式的概念 ,分布式数据库的设计步骤和原则 ,描述了分布式数据库在物流系统的体系结构中的体现 .最后以 ASP.NET和 SQL Server2 0 0 0为开发环境 ,列举了 B/ S模式下的分布式数据库应用程序开发和应用程序中客户端与服务器端的数据库的连接和访问方法 . 展开更多
关键词 B/S 分布式数据库 数据分片 数据存取 ASP.NET DTC 数据同步 分布式查询
在线阅读 下载PDF
分布式异构数据库集成系统研究与实现 被引量:17
11
作者 徐爱萍 宋先明 徐武平 《计算机工程与科学》 CSCD 北大核心 2015年第10期1909-1916,共8页
由于历史原因和数据库技术的不断发展,很多部门已经积累并且还会大量积累各种异构数据,其异构性主要表现在数据库类型和数据结构的不同。针对这一问题进行研究,以三峡库区水环境及水文分布式异构数据库为例,在分析水环境和水文数据需求... 由于历史原因和数据库技术的不断发展,很多部门已经积累并且还会大量积累各种异构数据,其异构性主要表现在数据库类型和数据结构的不同。针对这一问题进行研究,以三峡库区水环境及水文分布式异构数据库为例,在分析水环境和水文数据需求的基础上,构建了水文及水环境数据交换架构和数据共享平台;采用异构多源数据库引擎中间件解决了不同种类数据库之间的数据交换问题;针对大量历史数据的交换问题提供了分批导入数据交换方式;使用数据目录注册的方式使得集成平台的管理和使用便捷通用。本研究的异构多源数据库引擎不仅可以方便地连接目前主流的各种数据库,还基于Web Services技术解决了连接Web数据接口的问题。研究成果可满足不同应用环境的异构数据集成需求。 展开更多
关键词 异构数据 数据共享 GDBE 数据集成 中间件 集成系统
在线阅读 下载PDF
面向海量交通数据的HBase时空索引 被引量:9
12
作者 房俊 李冬 +1 位作者 郭会云 王嘉怡 《计算机应用》 CSCD 北大核心 2017年第2期311-315,共5页
针对HBase无法直接建立时空索引所带来的交通数据查询性能问题,基于HBase行键设计了面向海量交通数据的HBase时空索引。首先利用Geohash降维方法将二维空间位置数据转化为一维编码,再与时间维度进行组合;然后根据组合顺序的不同,提出了... 针对HBase无法直接建立时空索引所带来的交通数据查询性能问题,基于HBase行键设计了面向海量交通数据的HBase时空索引。首先利用Geohash降维方法将二维空间位置数据转化为一维编码,再与时间维度进行组合;然后根据组合顺序的不同,提出了四种结构模型,分别讨论了模型的具体构成以及交通数据查询中的适应面;最后提出了相应的时空索引管理算法及基于Hbase时空索引的交通数据查询方法。通过实验验证了提出的HBase时空索引结构能有效提升海量交通数据的区域查询性能,并比较了四种时空索引结构在不同数据规模、不同查询半径以及不同时间范围的查询性能,量化验证了不同索引结构在交通数据查询中的适应场景。 展开更多
关键词 海量交通数据 HBASE Geohash 时空索引 区域查询
在线阅读 下载PDF
改进的云存储系统数据分布策略 被引量:26
13
作者 周敬利 周正达 《计算机应用》 CSCD 北大核心 2012年第2期309-312,共4页
针对当前云存储系统海量数据应用环境中数据分布策略可扩展性以及灵活性的不足,提出一种高效的数据分布策略。一方面,该策略基于一致性哈希数据分布算法,引入了虚拟化的设计思路,采用虚拟节点进行存储资源分配;另一方面,该策略采用了一... 针对当前云存储系统海量数据应用环境中数据分布策略可扩展性以及灵活性的不足,提出一种高效的数据分布策略。一方面,该策略基于一致性哈希数据分布算法,引入了虚拟化的设计思路,采用虚拟节点进行存储资源分配;另一方面,该策略采用了一种基于节点容量感知的负载均衡方法,有效地优化了系统性能,提高了系统可扩展性。通过实验分析,不管在同构还是异构的云存储架构中,该策略改善了存储资源负载均衡程度,有效优化了系统整体性能。 展开更多
关键词 云存储 一致性哈希 数据分布 虚拟化 负载均衡
在线阅读 下载PDF
基于分布式数据库的维修资料管理系统设计 被引量:8
14
作者 杨路刚 李丽华 喻莉 《计算机工程与设计》 CSCD 北大核心 2009年第17期4120-4122,共3页
以往的维修资料管理系统存在着数据分散使用和集中管理的矛盾。为了解决此问题,基于Oracle9i分布式数据库设计了一种装备维修资料管理信息系统。采用数据库链接来更新联网节点,采用导入/导出文件的方法来进行未联网节点的同步。为了取... 以往的维修资料管理系统存在着数据分散使用和集中管理的矛盾。为了解决此问题,基于Oracle9i分布式数据库设计了一种装备维修资料管理信息系统。采用数据库链接来更新联网节点,采用导入/导出文件的方法来进行未联网节点的同步。为了取得访问速度与管理方便性间的平衡,根据不同资料类型,数据分别采取存放在BLOB字段和文件系统中两种方法。通过这些手段构建了一个数字化、网络化的维修资料共享和管理平台。 展开更多
关键词 分布式数据库 管理信息系统 数据库链接 数据同步 大容量二进制字段
在线阅读 下载PDF
基于Web Service的数据一致性维护方法 被引量:7
15
作者 邱宁 吕何新 冯淑娟 《计算机工程与设计》 CSCD 北大核心 2006年第14期2564-2566,2569,共4页
随着互联网和分布式数据库系统的广泛应用,如何保证多个数据库之间的数据一致已成为系统可靠运行所要解决的重要问题。而WebService可以通过HTTP、SOAP(XML)等协议为互联网用户提供服务,具有良好的普适性和灵活性。提出了一种基于WebSer... 随着互联网和分布式数据库系统的广泛应用,如何保证多个数据库之间的数据一致已成为系统可靠运行所要解决的重要问题。而WebService可以通过HTTP、SOAP(XML)等协议为互联网用户提供服务,具有良好的普适性和灵活性。提出了一种基于WebService的数据一致性维护方法,并实现了相应的同步一致和异步一致的维护方法。该方法不仅适用于各种分布式数据库,也可应用于相互独立的多个数据库。 展开更多
关键词 WEB SERVICE 分布式数据库 数据一致 同步一致 异步一致
在线阅读 下载PDF
基于SOAP协议的Web Services安全性扩展实现 被引量:7
16
作者 李慧盈 张长海 李德昌 《计算机应用研究》 CSCD 北大核心 2006年第1期106-107,共2页
通过对W eb服务的架构进行分析,研究了建立安全性模型的基本途径。基于W eb服务安全性模型的主体是SOAP的安全性,从而提出了对于SOAP进行安全扩展以达到信息安全交换的一种实现方法,该方法确保了网络服务的完整性和安全性。
关键词 Web服务 简单对象访问协议 可扩展标记语言 安全套接字层 数字签名
在线阅读 下载PDF
基于虚拟日志压缩的数据同步方案 被引量:7
17
作者 张春玲 吕震宇 刘遵峰 《计算机工程》 CAS CSCD 北大核心 2010年第18期67-69,共3页
在基于虚拟日志的数据同步中,当主库端存在对同一记录的频繁修改时,庞大的虚拟日志记录会影响整个数据同步效率。针对该问题,提出一种基于虚拟日志压缩的数据同步方案。虚拟日志压缩通过计算合并日志记录,只保留与数据同步相关的日志信... 在基于虚拟日志的数据同步中,当主库端存在对同一记录的频繁修改时,庞大的虚拟日志记录会影响整个数据同步效率。针对该问题,提出一种基于虚拟日志压缩的数据同步方案。虚拟日志压缩通过计算合并日志记录,只保留与数据同步相关的日志信息,从而减少网络数据流量,提高数据同步效率。实验结果表明,该方法适合广域网异构数据库的异步数据同步。 展开更多
关键词 异构数据库 数据同步 虚拟日志 日志压缩
在线阅读 下载PDF
基于功能语义单元的博客评论抽取技术 被引量:3
18
作者 范纯龙 夏佳 +2 位作者 肖昕 吕红伟 徐蕾 《计算机应用》 CSCD 北大核心 2011年第9期2417-2420,2425,共5页
博客作为一类重要的网络信息资源,其评论信息抽取是舆情分析等研究工作的基础。总结了当前主流的博客评论抽取算法,介绍了页面结构在信息抽取中的应用,并结合人理解网页时充分利用"首页"等指示性短语的特点,提出利用具有明确... 博客作为一类重要的网络信息资源,其评论信息抽取是舆情分析等研究工作的基础。总结了当前主流的博客评论抽取算法,介绍了页面结构在信息抽取中的应用,并结合人理解网页时充分利用"首页"等指示性短语的特点,提出利用具有明确语义和功能指示作用的功能语义单元来抽取评论信息的技术;详细介绍了抽取过程中涉及的页面结构线性化、功能语义单元识别、正文识别和评论抽取算法等内容。最后,通过实验证明,该技术在博客的正文和评论信息抽取上能取得良好效果。 展开更多
关键词 功能语义单元 信息抽取 评论 博客 正文识别
在线阅读 下载PDF
Peer-to-Peer数据共享研究 被引量:16
19
作者 王珊 张新宇 《计算机应用与软件》 CSCD 北大核心 2003年第11期1-4,70,共5页
最近一段时间,由于许多Peer-to-Peer(简写为P2P)系统例如Napster、Freenet和Gnutella等的成功应用,P2P数据共享问题成为国际上应用领域和研究领域内的热点。在数据管理领域内的国际会议和杂志上也可以纷纷见到这方面的文章,分别从体系... 最近一段时间,由于许多Peer-to-Peer(简写为P2P)系统例如Napster、Freenet和Gnutella等的成功应用,P2P数据共享问题成为国际上应用领域和研究领域内的热点。在数据管理领域内的国际会议和杂志上也可以纷纷见到这方面的文章,分别从体系结构、数据表示、数据检索、资源管理和安全与法律等方面着手研究在P2P的环境下进行数据共享的问题。由于Peer-to-Peer自身开放性和松散性的特点,导致了P2P系统在很多方面都需要进行进一步的深入研究。在本文中,我们将对P2P数据管理领域内目前的研究现状作一个综述。 展开更多
关键词 数据共享 数据管理 分布式数据库系统 数据检索 数据表示 P2P系统
在线阅读 下载PDF
物流信息系统的分布式数据库设计 被引量:9
20
作者 谈冉 康瑞华 李凌 《武汉理工大学学报(信息与管理工程版)》 CAS 2006年第8期38-41,共4页
结合物流信息系统的研究,提出了系统分布式数据库的结构,并详细叙述了分布式数据库的设计内容、设计原则和设计步骤,分析并讨论了数据存储机制的选择。
关键词 分布式 透明性 数据共享 全局模式 数据库设计
在线阅读 下载PDF
上一页 1 2 22 下一页 到第
使用帮助 返回顶部