期刊文献+
共找到136篇文章
< 1 2 7 >
每页显示 20 50 100
基于改进OATA的物体打击事故致因-责任人关联分析
1
作者 李珏 武诗怡 《工程研究——跨学科视野中的工程》 2025年第3期364-377,共14页
文本选取建筑行业125例物体打击事故调查报告,利用文本挖掘技术从中提取出28项事故致因,并融合词频-逆文档频率算法(TF-IDF)和TextRank算法计算出每个致因的权重值。依据相关规定归类出15类事故责任人,并利用社会网络分析方法构建责任... 文本选取建筑行业125例物体打击事故调查报告,利用文本挖掘技术从中提取出28项事故致因,并融合词频-逆文档频率算法(TF-IDF)和TextRank算法计算出每个致因的权重值。依据相关规定归类出15类事故责任人,并利用社会网络分析方法构建责任人关系网络,进而构建了职业事故树,分析了事故致因与责任人之间的关联。结果表明:事故相关施工人员普遍存在安全意识淡薄、违规操作、防护用品佩戴不到位和物体乱放的问题;事故现场管理人员普遍存在现场管理不到位、监督检查不到位、隐患整改不力和安全教育培训不到位的问题。其中,项目负责人的总体事故责任承担率最高;企业管理人员需要重视人员配备和应急管理方面的工作;政府部门人员需要加强对施工单位的监督和管理。通过挖掘事故责任人和致因之间的关联,既可以让各类责任人明晰自己的责任,也有助于决策者制定更精准的预防措施,并将措施的执行落实到个人,提高措施的执行效率。 展开更多
关键词 物体打击事故 社会网络分析 职业事故树分析(OATA) 词频-逆文档频率 TextRank算法
在线阅读 下载PDF
面向海峡两岸融合发展的客家族谱开发利用探微——以客家族谱博物馆为例
2
作者 何婧茹 傅文奇 严雅英 《情报探索》 2025年第2期113-118,共6页
[目的/意义]海峡两岸融合发展是历史的必然趋势,客家族谱见证了闽台两地客家人同根同源。开发利用客家族谱有利于强化两岸客家亲缘联结,推动海峡两岸融合发展。[方法/过程]在深入调研客家族谱博物馆的基础上,分析该馆在客家族谱开发利... [目的/意义]海峡两岸融合发展是历史的必然趋势,客家族谱见证了闽台两地客家人同根同源。开发利用客家族谱有利于强化两岸客家亲缘联结,推动海峡两岸融合发展。[方法/过程]在深入调研客家族谱博物馆的基础上,分析该馆在客家族谱开发利用中的成效和面临的困难和问题。[结果/结论]从推动族谱资源数字化建设、搭建客家文化交流平台、完善志愿者管理制度、创新面向台湾地区客家青少年的文化宣传方式以及应用新技术赋能服务等方面提出策略,为促进海峡两岸融合发展注入客家力量。 展开更多
关键词 客家族谱 两岸融合 闽台文化 文献开发
在线阅读 下载PDF
Using AdaBoost Meta-Learning Algorithm for Medical News Multi-Document Summarization 被引量:1
3
作者 Mahdi Gholami Mehr 《Intelligent Information Management》 2013年第6期182-190,共9页
Automatic text summarization involves reducing a text document or a larger corpus of multiple documents to a short set of sentences or paragraphs that convey the main meaning of the text. In this paper, we discuss abo... Automatic text summarization involves reducing a text document or a larger corpus of multiple documents to a short set of sentences or paragraphs that convey the main meaning of the text. In this paper, we discuss about multi-document summarization that differs from the single one in which the issues of compression, speed, redundancy and passage selection are critical in the formation of useful summaries. Since the number and variety of online medical news make them difficult for experts in the medical field to read all of the medical news, an automatic multi-document summarization can be useful for easy study of information on the web. Hence we propose a new approach based on machine learning meta-learner algorithm called AdaBoost that is used for summarization. We treat a document as a set of sentences, and the learning algorithm must learn to classify as positive or negative examples of sentences based on the score of the sentences. For this learning task, we apply AdaBoost meta-learning algorithm where a C4.5 decision tree has been chosen as the base learner. In our experiment, we use 450 pieces of news that are downloaded from different medical websites. Then we compare our results with some existing approaches. 展开更多
关键词 MULTI-document SUMMARIZATION Machine Learning Decision trees ADABOOST C4.5 MEDICAL document SUMMARIZATION
在线阅读 下载PDF
Optimized XML Storage in NXD Based on Tree-Structure Disassemble
4
作者 LIU Yun-sheng WANG Yi ZHONG Hao 《Wuhan University Journal of Natural Sciences》 EI CAS 2006年第1期93-99,共7页
Independent XML storage based on XSD (XML Schema Document) is adopted in NXD(Native XML Data base), XMI. storage structure based on tree-structure disassemble and the algorithm used in dynamically updating XML doc... Independent XML storage based on XSD (XML Schema Document) is adopted in NXD(Native XML Data base), XMI. storage structure based on tree-structure disassemble and the algorithm used in dynamically updating XML document are provided in this paper. The main idea is that in term of data model of XML document, XML document is parsed to Document Structure-Tree with Hierarchical Model and Leaf-Data with Relation Model for storage. Simultaneously Proxy node is imported in order to solve the problem that XML data store in cross-blocks. And with XSD model information, sparse index is constructed to save storage space. It is proved that this storage structure could improve efficiency of XML document operation. 展开更多
关键词 XML storage storage model NXD (native XML database) document trees regular expression
在线阅读 下载PDF
富文本协同编辑中基于树型结构地址空间转换的一致性维护
5
作者 刘亚 韩建功 +1 位作者 高丽萍 曲博 《小型微型计算机系统》 CSCD 北大核心 2024年第2期367-373,共7页
协同编辑通过多用户远程实时编辑,最大程度的支持团队之间的协作和交流.撤销操作作为协同编辑的一个重要特性,通过错误恢复简化协作编辑过程中产生的错误或者意外操作的处理过程.富文本编辑采用树型结构来进行文档管理,从而产生了较线... 协同编辑通过多用户远程实时编辑,最大程度的支持团队之间的协作和交流.撤销操作作为协同编辑的一个重要特性,通过错误恢复简化协作编辑过程中产生的错误或者意外操作的处理过程.富文本编辑采用树型结构来进行文档管理,从而产生了较线性文档更为复杂的并发操作环境和冲突消解场景.为了解决富文本文档中的并发操作环境与撤销操作冲突问题,本文提出了一种新颖的基于树型结构的地址空间转换方法,采用基于位置的节点寻址方案和节点属性值计数器策略,能更方便地支持撤销操作与更改操作.此外,本文还给出了树型结构地址空间的结果一致性的正确性证明及详细的案例分析,并开发了Web平台下实时协同富文本编辑原型系统AST-RichText,进一步验证了该方法的可行性. 展开更多
关键词 计算机支持的协同工作 实时协同编辑 地址空间转换 一致性模型 UNDO 树型文档
在线阅读 下载PDF
A Tree Pattern Matching Algorithm for XML Queries with Structural Preferences
6
作者 Maurice Tchoupé Tchendji Lionel Tadonfouet Thomas Tébougang Tchendji 《Journal of Computer and Communications》 2019年第1期61-83,共23页
In the XML community, exact queries allow users to specify exactly what they want to check and/or retrieve in an XML document. When they are applied to a semi-structured document or to a document with an overly comple... In the XML community, exact queries allow users to specify exactly what they want to check and/or retrieve in an XML document. When they are applied to a semi-structured document or to a document with an overly complex model, the lack or the ignorance of the explicit document model (DTD—Document Type Definition, Schema, etc.) increases the risk of obtaining an empty result set when the query is too specific, or, too large result set when it is too vague (e.g. it contains wildcards such as “*”). The reason is that in both cases, users write queries according to the document model they have in mind;this can be very far from the one that can actually be extracted from the document. Opposed to exact queries, preference queries are more flexible and can be relaxed to expand the search space during their evaluations. Indeed, during their evaluation, certain constraints (the preferences they contain) can be relaxed if necessary to avoid precisely empty results;moreover, the returned answers can be filtered to retain only the best ones. This paper presents an algorithm for evaluating such queries inspired by the TreeMatch algorithm proposed by Yao et al. for exact queries. In the proposed algorithm, the best answers are obtained by using an adaptation of the Skyline operator (defined in relational databases) in the context of documents (trees) to incrementally filter into the partial solutions set, those which satisfy the maximum of preferential constraints. The only restriction imposed on documents is No-Self-Containment. 展开更多
关键词 SEMI-STRUCTURED documents Preference QUERIES tree Pattern Matching treeMatch Algorithm XML The SKYLINE Operator
在线阅读 下载PDF
网络化制造中XML文档结构模型与应用研究 被引量:12
7
作者 于庆梅 尹朝万 刘志刚 《计算机集成制造系统-CIMS》 EI CSCD 北大核心 2003年第7期601-607,共7页
针对网络化制造系统中分布式异构环境下产品协同设计制造数据结构化和非结构化的特点,提出了网络化制造中产品设计制造信息资源的XML统一描述,以及XML文档树结构的定义与模型,并将该模型应用于Web结构的产品异地协同设计制造系统,给出了... 针对网络化制造系统中分布式异构环境下产品协同设计制造数据结构化和非结构化的特点,提出了网络化制造中产品设计制造信息资源的XML统一描述,以及XML文档树结构的定义与模型,并将该模型应用于Web结构的产品异地协同设计制造系统,给出了XML样式化接口和映射接口的实现机制。以机加件类零件为例,给出产品文档树型结构模型的模板与映射接口的实例化,不仅实现了Web环境下的产品异地协同设计中信息资源的浏览与交互处理,而且通过数据映射接口,为远程机加件的在线加工后处理提供了有效的数据。 展开更多
关键词 XML 文档树模型 文档模式 网络化制造
在线阅读 下载PDF
针对XML流数据的复杂Twig Pattern查询处理 被引量:9
8
作者 杨卫东 王清明 施伯乐 《软件学报》 EI CSCD 北大核心 2007年第4期893-904,共12页
XML流数据处理在研究领域引起了研究者的广泛兴趣.针对XML流数据的、具有嵌套AND/OR谓词的复杂Twig Pattern查询处理,提出一种新方法.为了提高查询处理性能,将所有Twig Pattern合并为一个共享前缀的查询树,其中,AND/OR谓词被表示为单独... XML流数据处理在研究领域引起了研究者的广泛兴趣.针对XML流数据的、具有嵌套AND/OR谓词的复杂Twig Pattern查询处理,提出一种新方法.为了提高查询处理性能,将所有Twig Pattern合并为一个共享前缀的查询树,其中,AND/OR谓词被表示为单独的抽象语法树,因而能够以文档顺序、单遍地处理复杂Twig Pattern的匹配,并避免了YFilter中对嵌套谓词进行后置处理所产生的中间结果.实验结果表明,该方法能够有效改善Twig Pattern的处理性能,尤其是在处理大文档的情况下.基于已有的研究工作,讨论如何利用DTD(document type definition)的结构和约束信息优化Twig Pattern,即这种优化是在系统运行前进行的预处理. 展开更多
关键词 XML文档流 xPam TWIG PATTERN 查询树 DTD(document type definition)
在线阅读 下载PDF
基于元数据与领域概念树的文本相似度计算 被引量:7
9
作者 张佩云 陈恩红 +2 位作者 谢荣见 宫秀文 黄波 《系统工程与电子技术》 EI CSCD 北大核心 2014年第3期591-597,共7页
随着网络与信息技术的快速发展,导致网络上产生了大量的电子文本,而文本间的相似度计算是文本处理的一种重要手段。对于大规模的文本集,通常采用向量空间模型(vector space model,VSM)进行文本表示,但是该方法面临着文本向量维度较高及... 随着网络与信息技术的快速发展,导致网络上产生了大量的电子文本,而文本间的相似度计算是文本处理的一种重要手段。对于大规模的文本集,通常采用向量空间模型(vector space model,VSM)进行文本表示,但是该方法面临着文本向量维度较高及文本语义相似度难以度量的问题。提出一种改进的文本相似度计算方法,从大量的特征空间中选择出具有代表性的元数据特征向量元素,以降低向量空间的维度;构建领域概念树并设计基于领域概念树的文本相似度算法,对领域概念中广泛存在的同义词进行处理,以提高文本之间语义相似度度量的性能。实验结果表明:通过降维和概念相似度计算可提高文本相似度计算的性能。 展开更多
关键词 文本元数据 领域概念树 元数据特征向量 文本相似度
在线阅读 下载PDF
XML文档存取控制研究 被引量:9
10
作者 王德强 许峰 +1 位作者 茅兵 谢立 《计算机研究与发展》 EI CSCD 北大核心 2004年第3期426-435,共10页
提出了一种基于授权树的XML存取控制标记算法 ,通过①避免在每个XML结点上进行授权匹配 ;②避免在每个结点上进行授权冲突解决 ;③避免标记每个结点 ,有效地改善了处理性能 另外 ,提出了一种灵活的、用户可配置的授权冲突解决模式 。
关键词 XML XMI文档树 存取控制 授权冲突解决模式 授权树
在线阅读 下载PDF
中文Web文档聚类算法研究 被引量:3
11
作者 林庆 袁晓峰 吴旻 《计算机工程与设计》 CSCD 北大核心 2009年第20期4759-4761,共3页
在STC算法的基础上,提出一种中文Web文档聚类算法STC-I,用以对检索结果进行在线高效地聚类。STC-I中,将文档集通过去同义词、近义词、相同句子的方法对文档进行降维处理,并通过计算查询关键字与文本的相似度,对参加聚类的文本打分的方... 在STC算法的基础上,提出一种中文Web文档聚类算法STC-I,用以对检索结果进行在线高效地聚类。STC-I中,将文档集通过去同义词、近义词、相同句子的方法对文档进行降维处理,并通过计算查询关键字与文本的相似度,对参加聚类的文本打分的方法来降低STC的时间复杂度并提高STC聚类准确率。通过对STC-I与STC、AHC、K-Means算法从聚类的准确性和时间复杂度上进行比较,结果表明,STC-I算法在聚类的准确性和时间复杂度方面都较STC、AHC和K-Means算法好。 展开更多
关键词 后缀树 文本聚类 搜索引擎 STC-I STC
在线阅读 下载PDF
基于HTML树和模板的文献信息提取方法研究 被引量:7
12
作者 李文立 王乐超 宋春雷 《计算机应用研究》 CSCD 北大核心 2010年第12期4615-4617,共3页
教师科研文献信息的自动搜集是科研成果有效管理的重要手段,将网页信息的提取方法用于网络数据库中文献信息的自动搜集有广大的应用前景。提出基于DOM树和模板的文献信息提取方法,利用HTML标记间的嵌套关系将Web网页表示成一棵DOM树,将... 教师科研文献信息的自动搜集是科研成果有效管理的重要手段,将网页信息的提取方法用于网络数据库中文献信息的自动搜集有广大的应用前景。提出基于DOM树和模板的文献信息提取方法,利用HTML标记间的嵌套关系将Web网页表示成一棵DOM树,将DOM树结构用于网页相似度的度量和自动分类,相似度高的网页应用同一模板进行信息提取。实验结果表明该方法在提取网络数据库中文献信息的准确率在94%以上。 展开更多
关键词 网页信息提取 文档对象模型树 模板 文献信息搜集
在线阅读 下载PDF
一种基于后缀树的Web搜索结果聚类方法 被引量:5
13
作者 吴江宁 王治江 《情报学报》 CSSCI 北大核心 2010年第1期78-83,共6页
为同时满足Web搜索结果聚类的关联性、快速性以及类别描述的可浏览性等需求,本文提出了一种适合中文Web信息搜索结果的后缀树聚类算法,其中后缀树的构建以中文汉字为基本单位,一种有效的策略解决了基于二进制方法合并短语类后的类别... 为同时满足Web搜索结果聚类的关联性、快速性以及类别描述的可浏览性等需求,本文提出了一种适合中文Web信息搜索结果的后缀树聚类算法,其中后缀树的构建以中文汉字为基本单位,一种有效的策略解决了基于二进制方法合并短语类后的类别描述问题,利用短语类语义层面的相似性合并同义短语类,有效地改善了聚类结果的质量。测试结果表明:与传统的文档聚类算法相比,基于后缀树的算法在Web文档聚类的精度和效率方面具有较强的优越性。 展开更多
关键词 WEB搜索 后缀树 文档聚类
在线阅读 下载PDF
基于领域本体的智能检索模型 被引量:11
14
作者 贾雪峰 王建新 +1 位作者 齐建东 朱礼军 《计算机工程》 CAS CSCD 北大核心 2010年第23期171-173,176,共4页
在传统检索模型的基础上,结合本体概念,提出一种基于领域本体的检索模型。该模型利用本体中语义概念关系及语义扩展机制对查询关键词进行概念映射及扩展,通过计算文档相似度返回检索结果,提高检索的查准率和查全率。
关键词 信息检索 本体 概念树 智能检索 文档相似度
在线阅读 下载PDF
一种基于特征符号的网页主题信息抽取方法 被引量:4
15
作者 王舒 朱敏 +2 位作者 张明 牛颢 赵瑜 《计算机应用研究》 CSCD 北大核心 2009年第12期4539-4541,共3页
随着Internet网络的日益普及,W eb上的海量数据给文本挖掘尤其是网页主题提取带来了更多的挑战,现有的文本提取方法在保证高准确率的同时无法满足W eb挖掘方法的通用性。通过对W eb网页结构进行研究,对网页生成树模型进行了改进,找到网... 随着Internet网络的日益普及,W eb上的海量数据给文本挖掘尤其是网页主题提取带来了更多的挑战,现有的文本提取方法在保证高准确率的同时无法满足W eb挖掘方法的通用性。通过对W eb网页结构进行研究,对网页生成树模型进行了改进,找到网页结构的通用规则,提出一种基于特征符号的提取方法CECS(contentextraction characteristic symbols),结合相关度对网页主题内容进行提取。实验证明,所提算法具有很高的准确性和通用性。 展开更多
关键词 生成树模型 特征符号 相关度 主题提取
在线阅读 下载PDF
基于有效路径权重的XML树匹配算法 被引量:2
16
作者 赵艳妮 郭华磊 《计算机工程与设计》 北大核心 2016年第4期949-953,共5页
针对当前XML文档信息查询算法的不足,提出一种基于有效路径权重的树匹配算法。在保持XML文档树有效结点和树结构的基础上,树根结点信息最重要,随着树深度增加,结点信息重要性逐渐减弱的特点,按照路径层次自动计算路径权重,并赋予相应路... 针对当前XML文档信息查询算法的不足,提出一种基于有效路径权重的树匹配算法。在保持XML文档树有效结点和树结构的基础上,树根结点信息最重要,随着树深度增加,结点信息重要性逐渐减弱的特点,按照路径层次自动计算路径权重,并赋予相应路径,根据树结点的有效信息和树结构的有效路径计算树的匹配度。在大规模XML文档查询方面,实验验证了该算法在保证较高查准率和查全率的基础上,有效提高了查询效率。 展开更多
关键词 路径权重 树匹配 树深度 查询树 文档树
在线阅读 下载PDF
快速混合Web文档聚类 被引量:3
17
作者 杨瑞龙 朱庆生 谢洪涛 《计算机工程与应用》 CSCD 北大核心 2010年第22期12-15,共4页
提出了一种使用后缀树聚类算法优化K-means文档聚类初始值的快速混合聚类方法STK-means。该方法首先构建文档集的后缀树模型,使用后缀树聚类算法识别初始聚类、提取K-means聚类算法初始值中心值。然后,把后缀树模型的节点映射到M维向量... 提出了一种使用后缀树聚类算法优化K-means文档聚类初始值的快速混合聚类方法STK-means。该方法首先构建文档集的后缀树模型,使用后缀树聚类算法识别初始聚类、提取K-means聚类算法初始值中心值。然后,把后缀树模型的节点映射到M维向量空间模型中的特征项,利用TF-IDF方案计算基于短语的文档向量特征值。最后,使用K-means算法产生聚类结果。实验结果表明该方法优于传统K-means聚类算法和后缀树聚类算法,并具备了这些算法聚类速度快的优点。 展开更多
关键词 聚类算法 K-MEANS算法 后缀树 WEB文档聚类 基于短语的相似度
在线阅读 下载PDF
文件系统增量备份策略的形式化描述及实现 被引量:2
18
作者 肖克辉 倪德明 《计算机工程与设计》 CSCD 北大核心 2007年第10期2455-2457,共3页
文件系统备份和恢复过程中,需根据当前备份资源树和历史备份资源树进行合并等操作,这种操作在物理上表现为对目录树和资源树的处理。特别是增量备份时,它指明备份资源。恢复过程中,用户可以利用该策略根据时间点进行完全恢复和部分恢复... 文件系统备份和恢复过程中,需根据当前备份资源树和历史备份资源树进行合并等操作,这种操作在物理上表现为对目录树和资源树的处理。特别是增量备份时,它指明备份资源。恢复过程中,用户可以利用该策略根据时间点进行完全恢复和部分恢复。给出一种对备份资源树的解析算法,并进行分析,在算法的基础上对备份资源树进行了形式化描述。 展开更多
关键词 文件系统 增量备份 备份资源树 目录树 文档对象模型
在线阅读 下载PDF
机床协同设计中产品信息XML描述模型的研究 被引量:6
19
作者 陈桦 张鹏伟 陈景霞 《组合机床与自动化加工技术》 2005年第2期13-15,18,共4页
文章在分析机床产品特征结构的基础上提出了XML描述的产品设计信息文档模型以及XML文档信息交互处理的方法 ,实现了设计资源的浏览与交互处理的统一描述。采用传输XML表达的设计语义而不是三维实体造型的数据交换方法 ,在减轻网络负荷... 文章在分析机床产品特征结构的基础上提出了XML描述的产品设计信息文档模型以及XML文档信息交互处理的方法 ,实现了设计资源的浏览与交互处理的统一描述。采用传输XML表达的设计语义而不是三维实体造型的数据交换方法 ,在减轻网络负荷的同时 ,满足了协同设计中实时。 展开更多
关键词 XNL 协同设计 机床 文档模式
在线阅读 下载PDF
基于文档目录树的WWW文档协同写作机制 被引量:4
20
作者 杨文清 黄宜华 +2 位作者 冯坚 卢坚 张福炎 《计算机研究与发展》 EI CSCD 北大核心 1999年第9期1051-1056,共6页
协同写作是 C S C W 的一个重要研究领域.文中针对 W W W 文档的协同写作提出了一种文档目录树技术,不仅为 W W W 文档扩充了表示其全局结构的层次式目录结构,还为文档的分工协作写作提供了良好的数据组织结构.文中... 协同写作是 C S C W 的一个重要研究领域.文中针对 W W W 文档的协同写作提出了一种文档目录树技术,不仅为 W W W 文档扩充了表示其全局结构的层次式目录结构,还为文档的分工协作写作提供了良好的数据组织结构.文中详细讨论了基于文档目录树结构对一个 W W W 文档进行协同写作时的协同机制,研究了多用户界面设计、协作方式、以及使用“目录路径锁定法” 展开更多
关键词 CSCW 协同写作 文档目录树 WWW
在线阅读 下载PDF
上一页 1 2 7 下一页 到第
使用帮助 返回顶部