期刊文献+
共找到222篇文章
< 1 2 12 >
每页显示 20 50 100
WRF模式对黄土高原丘陵地形条件下夏季边界层结构的数值模拟 被引量:26
1
作者 王腾蛟 张镭 +2 位作者 胡向军 赵世强 王瑾 《高原气象》 CSCD 北大核心 2013年第5期1261-1271,共11页
利用中尺度数值模式WRF提供的两种边界层参数化方案(YSU和MYJ方案),选取2009年7月27-29日作为夏季个例,对黄土高原丘陵地形条件下大气边界层结构及地表能量场特征进行了较为细致的模拟研究。结果表明,WRF模式较好地模拟出黄土高原夏季... 利用中尺度数值模式WRF提供的两种边界层参数化方案(YSU和MYJ方案),选取2009年7月27-29日作为夏季个例,对黄土高原丘陵地形条件下大气边界层结构及地表能量场特征进行了较为细致的模拟研究。结果表明,WRF模式较好地模拟出黄土高原夏季边界层结构的日变化及近地面温度场、风场、净辐射通量、感热通量和潜热通量等要素的变化特征。WRF模式对温度的模拟最好,相关系数达到了0.95,对风速的模拟则较差,这与风场本身的随机多变性有很大的关系;WRF模式提供的土地利用类型、土壤类型以及NCEP提供的初始场土壤湿度与实际不符,是造成白天地表能量场模拟效果较差的主要原因;黄土高原半干旱区对流边界层最大高度可达到2 500m,夜间稳定边界层高度可达到700m左右。两种方案的对比分析表明,加入了非局地混合作用以及边界层顶夹卷作用的YSU方案能更好地模拟出对流边界层结构特征,而MYJ局地闭合方案则对稳定边界层的模拟表现更优。 展开更多
关键词 WRF模式 边界层参数化方案 黄土高原 潜热通量 感热通量
在线阅读 下载PDF
面向XPath执行的XML数据流压缩方法 被引量:17
2
作者 王腾蛟 高军 +2 位作者 杨冬青 唐世渭 刘云峰 《软件学报》 EI CSCD 北大核心 2005年第5期869-877,共9页
由于XML(extensible markup language)本身是自描述的,所以XML数据流中存在大量冗余的结构信息.如何压缩XML数据流,使得在减少网络传输代价的同时有效支持压缩数据流上的查询处理,成为一个新的研究领域.目前已有的XML数据压缩技术,都需... 由于XML(extensible markup language)本身是自描述的,所以XML数据流中存在大量冗余的结构信息.如何压缩XML数据流,使得在减少网络传输代价的同时有效支持压缩数据流上的查询处理,成为一个新的研究领域.目前已有的XML数据压缩技术,都需要扫描数据多遍,或者不支持数据流之上的实时查询处理.提出了一种XML数据流的压缩技术XSC(XML stream compression),实时完成XML数据流的压缩和解压缩,XSC动态构建XML元素事件序列字典并输出相关索引,能够根据XML数据流所遵从的DTD,产生XML元素事件序列图,在压缩扫描之前,产生更加合理的结构序列编码.压缩的XML数据流能够直接解压缩用于XPath的执行.实验表明,在XML数据流环境中,XSC在数据压缩率和压缩时间上要优于传统算法.同时,在压缩数据之上查询的执行代价是可以接受的. 展开更多
关键词 XML 数据流 压缩 DTD XPATH
在线阅读 下载PDF
城市下垫面对河谷城市兰州冬季热岛效应及边界层结构的影响 被引量:25
3
作者 王腾蛟 张镭 +2 位作者 张博凯 曹贤洁 王宏斌 《气象学报》 CAS CSCD 北大核心 2013年第6期1115-1129,共15页
利用中尺度数值模式WRF耦合单层城市冠层模块UCM,引入2005年MODIS土地利用类型资料,在对2005年1月25—28日兰州市热岛现象进行高分辨率数值模拟的基础上,设计了去除城市下垫面敏感性试验,探讨了城市下垫面对城市边界层的影响程度。结果... 利用中尺度数值模式WRF耦合单层城市冠层模块UCM,引入2005年MODIS土地利用类型资料,在对2005年1月25—28日兰州市热岛现象进行高分辨率数值模拟的基础上,设计了去除城市下垫面敏感性试验,探讨了城市下垫面对城市边界层的影响程度。结果表明,城市下垫面能使近地层大气温度升高而风速减小,并且,在夜间表现更明显。由城市热岛强度日变化分析可知,城市下垫面对兰州市热岛强度的贡献率为44%。夜间,城市上空200 m以下的近地层大气保持了白天的混合层特征,热岛环流的上升运动促进了山风环流,使得上升气流到达地面以上600 m左右;白天,由于山峰加热效应,城市上空400—600 m存在一个脱地逆温层,城市热岛环流使得11—15时(北京时)市区近地层出现弱上升气流,抑制了谷风环流的形成及发展。城市下垫面的低反照率特性和建筑物的多次反射作用导致城市下垫面的净辐射通量大于非城市下垫面;城市下垫面由于建筑材料的不透水性,导致潜热通量远小于感热通量,而储热项所占比重明显增大。 展开更多
关键词 河谷城市 城市热岛效应 WRF模式 城市边界层
在线阅读 下载PDF
医务人员高尿酸血症与代谢综合征相关性的初步调查 被引量:13
4
作者 王腾蛟 江雅平 +4 位作者 徐国宾 王学晶 李海霞 刘青艳 杨宏云 《临床检验杂志》 CAS CSCD 北大核心 2012年第4期309-313,共5页
目的评价医务人员高尿酸血症(hyperuricemia,HUA)与代谢综合征(metabolic syndrome,MS)的相关性,研究HUA发生的危险因素,为通过改善生活方式降低HUA发生风险提供依据。方法以北京某医院参加职工体检的2 763名医务人员为研究对象,建立健... 目的评价医务人员高尿酸血症(hyperuricemia,HUA)与代谢综合征(metabolic syndrome,MS)的相关性,研究HUA发生的危险因素,为通过改善生活方式降低HUA发生风险提供依据。方法以北京某医院参加职工体检的2 763名医务人员为研究对象,建立健康人群血尿酸(UA)的参考区间;用logistic回归分析HUA发生的风险因素,评价MUA与MS的相关性。结果男性血UA的参考区间为244~496μmol/L;女性为175~398μmol/L(≤50岁)、183~415μmol/L(>50岁)。超重(OR2.312,95%CI 1.840~2.905)、血压升高(OR 1.902,95%CI 1.470~2.463)、三酰甘油(TG)升高(OR 1.765,95%CI 1.372~2.272)及MS(OR 3.906,95%CI 3.052~5.001)是HUA发生的独立危险因素。UA水平随MS诊断指标异常个数的增多而升高(P<0.05),每增加一个异常指标,HUA的患病风险升高1.723倍(95%CI 1.567~1.896)。结论本研究建立的医务人员血UA参考值较先前报告的有所升高,MS是HUA的独立危险因素。 展开更多
关键词 血尿酸 参考区间 高尿酸血症 代谢综合征
暂未订购
泸型酒醅物理性质的实验研究 被引量:13
5
作者 王腾蛟 李海龙 +2 位作者 易彬 张良 黄卫星 《中国酿造》 CAS 北大核心 2011年第5期121-124,共4页
实验测定了酒醅含湿量、乙醇含量、真实密度、堆积密度、空隙率、堆积角和静摩擦系数在窖池中的分布规律。结果表明,随着窖池深度的增加,含湿量从60.2%升高到71.3%,乙醇含量先升高后降低,表层最低为4.1%,中下层最高为6.4%,底层为5.7%;... 实验测定了酒醅含湿量、乙醇含量、真实密度、堆积密度、空隙率、堆积角和静摩擦系数在窖池中的分布规律。结果表明,随着窖池深度的增加,含湿量从60.2%升高到71.3%,乙醇含量先升高后降低,表层最低为4.1%,中下层最高为6.4%,底层为5.7%;真实密度、松散堆积密度和振实堆积密度随窖池深度增加而增大,其范围分别为747.5kg/m3μ913.4kg/m3、374.7kg/m3μ443.2kg/m3和529.8kg/m3μ580.6kg/m3;堆积角的变化范围是42.8°μ45.3°,表层最小、中下层最大;酒醅在生铁、玻璃和木板上的静摩擦系数均随窖池深度增加而增加,其范围分别为0.54μ0.58、0.58μ0.66和0.69μ0.85。研究结果为酒醅混合搅拌及输运设备的设计和蒸馏工艺优化提供了重要参考。 展开更多
关键词 酒醅 物理性质 含湿量 堆积角
在线阅读 下载PDF
多物化视图并行增量保持三阶段模式 被引量:2
6
作者 王腾蛟 王海洋 +1 位作者 洪晓光 董继润 《软件学报》 EI CSCD 北大核心 1999年第11期1138-1141,共4页
文章提出了一种基于并行流水线处理方式的多物化视图(materializedviews)增量保持方法,即在先进行筛选的条件下,利用归类拓扑排序,将所有物化视图进行分类,使每一类中的视图之间没有嵌套定义关系.最后对每一类中的所有视图利用... 文章提出了一种基于并行流水线处理方式的多物化视图(materializedviews)增量保持方法,即在先进行筛选的条件下,利用归类拓扑排序,将所有物化视图进行分类,使每一类中的视图之间没有嵌套定义关系.最后对每一类中的所有视图利用基于信号量控制机制的流水线模式并行处理,以达到对多物化视图实现增量保特的目的. 展开更多
关键词 多物化视图 流水线 分布式数据库 数据仓库
在线阅读 下载PDF
青年痛风性肾病1例 被引量:2
7
作者 王腾蛟 李海霞 +2 位作者 左力 任雅丽 徐国宾 《临床检验杂志》 CAS CSCD 北大核心 2012年第4期320-320,共1页
1病历摘要患者,男,18岁。2009年9月进食海鲜、啤酒后夜间突发右侧第一跖趾关节红肿、疼痛,行X线检查未见骨折,外敷治疗后自行好转。2009年10月进食海鲜、啤酒后上述症状再次发作,血尿酸(UA)481μmol/L,用别嘌呤醇片(每天3次每次0.1... 1病历摘要患者,男,18岁。2009年9月进食海鲜、啤酒后夜间突发右侧第一跖趾关节红肿、疼痛,行X线检查未见骨折,外敷治疗后自行好转。2009年10月进食海鲜、啤酒后上述症状再次发作,血尿酸(UA)481μmol/L,用别嘌呤醇片(每天3次每次0.1g)治疗1月后停药。 展开更多
关键词 痛风 痛风性肾病 慢性肾病 青年
暂未订购
让大数据分析更可信 被引量:2
8
作者 王腾蛟 李喜莲 《大数据》 2017年第2期31-37,共7页
大数据在学术界和产业界的各个领域正扮演着愈加重要的角色,但同时,大数据是否可信,引发了无数研究者的广泛关注和激烈讨论。从大数据名称的历史演变、大数据应用的案例分析以及大数据工程的角度探索大数据的可信程度,并由此总结出保证... 大数据在学术界和产业界的各个领域正扮演着愈加重要的角色,但同时,大数据是否可信,引发了无数研究者的广泛关注和激烈讨论。从大数据名称的历史演变、大数据应用的案例分析以及大数据工程的角度探索大数据的可信程度,并由此总结出保证大数据分析正确性需要解决的3个挑战:正确选择数据源、科学抽样有代表性和有价值的数据、严谨完备的大数据工程分析方法。 展开更多
关键词 大数据 数据仓库 海量数据 大数据工程
在线阅读 下载PDF
数据挖掘在电信领域客户行为分析中的应用 被引量:5
9
作者 王腾蛟 林子雨 《电信技术》 2008年第1期22-25,共4页
首先介绍了基于数据挖掘技术构建的客户行为分析系统的架构,然后讨论了5种典型的电信领域客户行为分析应用及其使用的数据挖掘技术。
关键词 数据挖掘 客户行为分析 客户细分
在线阅读 下载PDF
网络环境下海量信息的局部模式提取方法
10
作者 王腾蛟 唐世渭 +1 位作者 杨冬青 刘云峰 《软件学报》 EI CSCD 北大核心 2001年第11期1639-1646,共8页
海量信息的模式提取是网络环境下海量信息集成研究的难点 .给出了一种新的局部精确模式提取及其增量保持方法 ,通过探测目标集的路径距离 ,利用 Hash类及其路径距离操作 ,将模式的生成规模控制在“模式直径”范围内 。
关键词 半结构化数据 模式提取 数据模型 信息集成 INTERNET
在线阅读 下载PDF
互联网+时代:用数据管理工作 被引量:1
11
作者 王腾蛟 李湛 《互联网经济》 2015年第6期32-37,共6页
伴随知识社会的来临,驱动当今企业组织变革的不仅是无所不在的网络,还有无所不在的计算、无所不在的数据、无所不在的知识。企业在运营过程中的知识管理、数据管理愈发引人关注。本文聚焦于企业的数据管理领域,探讨互联网时代所带来... 伴随知识社会的来临,驱动当今企业组织变革的不仅是无所不在的网络,还有无所不在的计算、无所不在的数据、无所不在的知识。企业在运营过程中的知识管理、数据管理愈发引人关注。本文聚焦于企业的数据管理领域,探讨互联网时代所带来的崭新工作方式。 展开更多
关键词 数据管理工作 互联网时代 企业组织变革 知识社会 知识管理 运营过程 管理领域
在线阅读 下载PDF
高原山地强对流天气培训个例库建设及应用研究
12
作者 王腾蛟 孙俊 冉津江 《教育教学论坛》 2021年第15期26-29,共4页
为提高短时临近预报技术培训的教学质量,建立高原山地强对流天气培训个例库,梳理出特殊地形条件下强对流天气临近预报思路和方法,根据学员的认知规律和业务技术培训特点,制作成规范的教学课件,利用个例教学和短时临近预报结合的情景模... 为提高短时临近预报技术培训的教学质量,建立高原山地强对流天气培训个例库,梳理出特殊地形条件下强对流天气临近预报思路和方法,根据学员的认知规律和业务技术培训特点,制作成规范的教学课件,利用个例教学和短时临近预报结合的情景模拟教学方式,增强卫星、雷达等资料在短时临近预报中的应用能力,完善高原山地气象业务特色培训项目建设,提高强对流个例实习课程的多样性和针对性,满足日益增强的培训需求。 展开更多
关键词 强对流天气 培训个例库 情景模拟教学
在线阅读 下载PDF
XML数据的查询技术 被引量:72
13
作者 孔令波 唐世渭 +2 位作者 杨冬青 王腾蛟 高军 《软件学报》 EI CSCD 北大核心 2007年第6期1400-1418,共19页
XML规范已成为当前网络应用(包括数字图书馆、Web服务以及电子商务)中事实上的数据表达、交换的标准.针对XML数据的查询在当前XML数据管理研究中占有重要的地位,也是当前XML数据处理研究领域的热点方向,相关的研究文献有很多.根据查询... XML规范已成为当前网络应用(包括数字图书馆、Web服务以及电子商务)中事实上的数据表达、交换的标准.针对XML数据的查询在当前XML数据管理研究中占有重要的地位,也是当前XML数据处理研究领域的热点方向,相关的研究文献有很多.根据查询模式描述的不同,将当前XML查询技术归入两大类:XML Query方式和XML IR方式.后者又进而可分以为3个子类:XML IR/keyword方式、XML IR/fragment和XMLIR/query方式,并从中挑选出3个研究者关注的问题进行了简述,它们是:Twig查询模式的处理、SLCA(smallest lowest common ancestor)节点的获取以及对所获取的XML片段相似性的度量.以方便普通用户使用为准则探讨了相关XML查询技术的优、缺点,将如下4个问题作为需要进一步关注的研究内容:结构化关键字查询及相应的结构相似性度量方法,如何消除XML Query查询处理模式(包含XML IR/query)和XML IR/keyword查询处理模式间数据冗余的问题,XML Query查询方式的理论探讨及其实现以及针对特定应用的XML数据的有效管理. 展开更多
关键词 XML查询 XML IR查询 XPATH XQUERY XML关键字查询 XQUERY FT Twig查询模式 结构连接 SLCA节点 DEWEY编码 相似性度量 树编辑距离 向量空间模型 TF^*IDF
在线阅读 下载PDF
XML数据索引技术 被引量:55
14
作者 孔令波 唐世渭 +2 位作者 杨冬青 王腾蛟 高军 《软件学报》 EI CSCD 北大核心 2005年第12期2063-2079,共17页
对XML数据建立有效的索引,是左右XML数据处理性能的重要因素.深入地讨论了目前XML索引技术的研究现状,将XML索引技术分为两大类:节点记录类索引(本身还可以分为3个小的类型)和结构摘要类索引.根据XML数据查询处理效率以及XML数据修改对... 对XML数据建立有效的索引,是左右XML数据处理性能的重要因素.深入地讨论了目前XML索引技术的研究现状,将XML索引技术分为两大类:节点记录类索引(本身还可以分为3个小的类型)和结构摘要类索引.根据XML数据查询处理效率以及XML数据修改对XML索引的要求,讨论了相关XML索引方法的优点和不足,并归结出XML索引后续研究的3个方向:XML结构信息的获取,路径信息的多维处理,数据修改合法性的有效支持,以及涉及能够同时有效满足XML查询和信息获取的索引. 展开更多
关键词 XML索引 区间编码 B-E-L模型 节点赋数 双似 k阶双似 结构摘要 XML数据修改 增量式验证 XML信息获取
在线阅读 下载PDF
一种基于参考点和密度的快速聚类算法 被引量:108
15
作者 马帅 王腾蛟 +2 位作者 唐世渭 杨冬青 高军 《软件学报》 EI CSCD 北大核心 2003年第6期1089-1095,共7页
数据的规模越来越大,要求数据挖掘算法有很高的执行效率.基于密度的聚类是聚类分析中的一种,其主要优点是发现任意形状的聚类和对噪音数据不敏感.提出了一种新的基于参考点和密度的CURD(clustering using references and density)聚类算... 数据的规模越来越大,要求数据挖掘算法有很高的执行效率.基于密度的聚类是聚类分析中的一种,其主要优点是发现任意形状的聚类和对噪音数据不敏感.提出了一种新的基于参考点和密度的CURD(clustering using references and density)聚类算法,其创新点在于,通过参考点来准确地反映数据的空间几何特征,然后基于参考点对数据进行分析处理.CURD算法保持了基于密度的聚类算法的上述优点,而且CURD算法具有近似线性的时间复杂性,因此CURD算法适合对大规模数据的挖掘.理论分析和实验结果也证明了CURD算法具有处 理任意形状的聚类、对噪音数据不敏感的特点,并且其执行效率明显高于传统的基于R*-树的DBSCAN算法. 展开更多
关键词 快速聚类算法 密度 高维 参考点 数据挖掘
在线阅读 下载PDF
基于DOM的网页主题信息自动提取 被引量:81
16
作者 王琦 唐世渭 +1 位作者 杨冬青 王腾蛟 《计算机研究与发展》 EI CSCD 北大核心 2004年第10期1786-1792,共7页
Web页面所表达的主要信息通常隐藏在大量无关的结构和文字中 ,使用户不能迅速获取主题信息 ,限制了Web的可用性 ,信息提取有助于解决这一问题 基于DOM规范 ,针对HTML的半结构化特征和缺乏语义描述的不足 ,提出含有语义信息的STU DOM树模... Web页面所表达的主要信息通常隐藏在大量无关的结构和文字中 ,使用户不能迅速获取主题信息 ,限制了Web的可用性 ,信息提取有助于解决这一问题 基于DOM规范 ,针对HTML的半结构化特征和缺乏语义描述的不足 ,提出含有语义信息的STU DOM树模型 将HTML文档转换为STU DOM树 ,并对其进行基于结构的过滤和基于语义的剪枝 ,能够准确地提取出主题信息 方法不依赖于信息源 ,而且不改变源网页的结构和内容 ,是一种自动、可靠和通用的方法 具有可观的应用价值 。 展开更多
关键词 DOM 信息提取 分块 STU STU树 STU-DOM树 相关度
在线阅读 下载PDF
基于树自动机的XPath在XML数据流上的高效执行 被引量:33
17
作者 高军 杨冬青 +1 位作者 唐世渭 王腾蛟 《软件学报》 EI CSCD 北大核心 2005年第2期223-232,共10页
如何在 XML 数据流上高效地执行大量的 XPath 查询成为数据流应用中一个迫切需要解决的关键问题.目前提出的算法或者不能完全支持 XPath 的常规特性,或者在算法的执行效率和空间代价上不能满足数据流应用的要求.提出了基于树自动机的XEB... 如何在 XML 数据流上高效地执行大量的 XPath 查询成为数据流应用中一个迫切需要解决的关键问题.目前提出的算法或者不能完全支持 XPath 的常规特性,或者在算法的执行效率和空间代价上不能满足数据流应用的要求.提出了基于树自动机的XEBT机来解决这个问题.与传统方法相比,XEBT机具备如下特征:首先,XEBT机基于表达能力丰富的树自动机,无须附加中间状态,或保存中间结果,就能处理支持{[]}操作符的 XPath;其次,XEBT 机支持多种优化策略,包括基于DTD的XPath查询自动机的构造;在空间代价有限增加的情况下采用局部确定化减少并发执行的状态;采用自上而下和自下而上相结合的查询处理策略.实验结果表明,提出的方法能够支持复杂的XPath 查询,在执行效率和空间代价方面优于传统算法. 展开更多
关键词 XP 自动机 XML数据 查询 算法 执行效率 操作符 法能 局部 中间状态
在线阅读 下载PDF
XML信息检索中最小子树根节点问题的分层算法 被引量:23
18
作者 孔令波 唐世渭 +2 位作者 杨冬青 王腾蛟 高军 《软件学报》 EI CSCD 北大核心 2007年第4期919-932,共14页
最小子树根节点问题(smallest lowest common ancestor,简称SLCA)是实现XML信息检索研究中关键字查询的一个基本问题,其主旨就是求解所有包含给定关键字的紧致子树的根节点.XU等人给出了3种算法—基于索引的搜索算法(indexed lookup eag... 最小子树根节点问题(smallest lowest common ancestor,简称SLCA)是实现XML信息检索研究中关键字查询的一个基本问题,其主旨就是求解所有包含给定关键字的紧致子树的根节点.XU等人给出了3种算法—基于索引的搜索算法(indexed lookup eager,简称ILE)、基于堆栈的算法以及基于扫描的算法(scan eager,简称SE),并通过实验证明ILE算法具有最好的表现.与基于B+树索引结构的ILE算法不同,所给出的新算法,称为LISA(layered intersection scan algorithm)方法.该方法基于SLCA节点按“层”分布的规律,采取了逐层求解SLCA节点的思路,即在获取了包含关键字的节点的Dewey码集合后,通过计算对应于不同关键字、不同层次的Dewey码前缀集合的交集,可以得到对应不同层的SLCA节点.与ILE相比,LISA除了只需对应于关键字的节点集合信息以外,不再需要其他复杂的辅助数据结构——全部的信息只是对应不同关键字的Dewey码集合以及排序操作.同时,给出了两种实际的算法:LISAI和LISAII,二者的区别在于是否采用Dewey编码到整数的转换.其中,LISAII更具有满意的性能. 展开更多
关键词 XML索引 DEWEY编码 XML信息检索 关键字查询 SLCA ILE
在线阅读 下载PDF
基于关系数据库的关键词查询 被引量:48
19
作者 林子雨 杨冬青 +1 位作者 王腾蛟 张东站 《软件学报》 EI CSCD 北大核心 2010年第10期2454-2476,共23页
介绍了基于关系数据库的关键词查询问题的研究背景;阐述了解决该问题的两大类方法,即基于数据图的方法和基于模式图的方法,并详细介绍了各种方法的原理以及各自的优缺点;最后展望了未来的研究方向.
关键词 关键词查询 关系数据库 信息检索 数据图
在线阅读 下载PDF
基于Ontology的Web内容二阶段半自动提取方法 被引量:18
20
作者 高军 王腾蛟 +1 位作者 杨冬青 唐世渭 《计算机学报》 EI CSCD 北大核心 2004年第3期310-318,共9页
目前Web中的海量信息已经成为人们重要的信息来源 ,如何从大量半结构化或无结构的HTML网页中提取信息已成为目前的研究热点 .但是Web页面的初始设计目的是为了方便用户浏览 ,而不是便于应用程序自动处理 ,如何实现一个精确的、应用广泛... 目前Web中的海量信息已经成为人们重要的信息来源 ,如何从大量半结构化或无结构的HTML网页中提取信息已成为目前的研究热点 .但是Web页面的初始设计目的是为了方便用户浏览 ,而不是便于应用程序自动处理 ,如何实现一个精确的、应用广泛的提取系统面临很多困难 .传统的方法可以粗略划分为基于交互产生的包装程序和自动生成的包装程序 ,但是基于交互产生的包装程序不具备普遍的应用性 ,基于自动生成的包装程序准确性不高 .该文提出了一种新的二阶段基于语义的半自动提取方法 ,在保证提取准确性的前提下 ,尽可能减少交互操作 ,同时随着参与网站的增加 ,逐步提高包装程序生成的自动化 .相对于目前的方法 ,该文方法同时考虑了包装程序提取结果的准确性和提取过程的应用普遍性 .其有效性在原型系统中得到验证 .应用该方法 ,已经成功提取了12 0万HTML页面 . 展开更多
关键词 Internet 搜索引擎系统 信息获取 Web ONTOLOGY 网页分类 半自动提取法
在线阅读 下载PDF
上一页 1 2 12 下一页 到第
使用帮助 返回顶部