期刊文献+
共找到52篇文章
< 1 2 3 >
每页显示 20 50 100
应急决策文本的多维语义挖掘方法——基于TF-IDF和PMI的技术框架 被引量:2
1
作者 邓云峰 冯永康 王双燕 《中国安全生产科学技术》 北大核心 2025年第5期36-45,共10页
为了解读领导干部应急决策部署中内含的多维语义信息,了解其相关决策行为特征,进而保障突发事件的应对效果,本文提出基于TF-IDF和PMI的自然语言处理技术框架,挖掘应急决策文本中的多维语义信息,分析相关内容的关联性。首先通过Jieba分词... 为了解读领导干部应急决策部署中内含的多维语义信息,了解其相关决策行为特征,进而保障突发事件的应对效果,本文提出基于TF-IDF和PMI的自然语言处理技术框架,挖掘应急决策文本中的多维语义信息,分析相关内容的关联性。首先通过Jieba分词和LTP平台的依存句法分析,挖掘文本中的目标和行动信息,利用TF-IDF算法和词云图展示关键行动,然后通过PMI构建复杂网络,揭示行动间的关联性和决策偏好。研究结果表明:结合应急行动分类体系,TF-IDF算法能精确提取文本中目标和行动信息,以频次反映行动的受关注程度,为理解决策者的决心和意图提供支持;PMI和改良PMI方法能有效挖掘行动的共现关系,揭示行动之间的关联性和决策偏好,其中PMI方法适合分析行动之间的平均相关性,而改良PMI方法能识别出低频高权重的行动关联。研究结果可为分析决策行为特征,细化实化应急决策部署提供可扩展的支持性工具。 展开更多
关键词 应急决策文本 词频-逆文档频率 点互信息 关联性分析 复杂网络 依存句法分析
在线阅读 下载PDF
基于文本数据的严重交通事故特征分析与典型场景研究
2
作者 林同立 黄彬 +1 位作者 吴悦昊 朱彤 《中阿科技论坛(中英文)》 2025年第5期79-83,共5页
为摆脱传统事故分析对结构化数据的依赖,文章构建了融合自然语言处理与复杂网络分析的事故文本智能解析框架。通过解构多源事故调查报告的非结构化信息流,文章系统地揭示了人-车-路-环境多要素耦合作用下的风险传导路径。研究结果表明,... 为摆脱传统事故分析对结构化数据的依赖,文章构建了融合自然语言处理与复杂网络分析的事故文本智能解析框架。通过解构多源事故调查报告的非结构化信息流,文章系统地揭示了人-车-路-环境多要素耦合作用下的风险传导路径。研究结果表明,重特大交通事故存在显著区别于常规事故的场景化聚集特征,其致因链呈现多维度协同演化特性。研究识别出施工区交通组织缺陷、交叉口冲突升级、山区道路动态失稳等5类典型风险场景,并阐明了不同场景中工程缺陷、违规行为与环境干扰的跨尺度作用机制。该方法体系可为事故深度调查提供新技术路径,其形成的场景特征图谱更可为主动安全防控系统优化及风险路段智能诊断提供决策支持。 展开更多
关键词 交通事故 文本数据挖掘 自然语言处理 复杂网络分析 风险传导路径 典型风险场景
在线阅读 下载PDF
基于复杂网络关键节点识别的藏文文本分类技术研究
3
作者 王桂山 苏慧婧 罗成孝 《长江信息通信》 2025年第7期126-129,共4页
藏文作为一种特殊的语言,其文本分类技术的研究面临许多挑战。文章探讨了复杂网络关键节点识别算法的核心原理,并将其应用于藏文文本分类的特征提取与模型优化中。引入基于网络中心性与重叠社区识别的算法,构建了一个能够有效挖掘藏文... 藏文作为一种特殊的语言,其文本分类技术的研究面临许多挑战。文章探讨了复杂网络关键节点识别算法的核心原理,并将其应用于藏文文本分类的特征提取与模型优化中。引入基于网络中心性与重叠社区识别的算法,构建了一个能够有效挖掘藏文文本中重要信息并提升分类性能的模型[1]。实验结果表明,复杂网络的关键节点识别方法能够有效提高藏文文本分类的精度和鲁棒性。 展开更多
关键词 复杂网络 关键节点识别 藏文文本分类 网络中心性 社区划分
在线阅读 下载PDF
基于复杂网络社团划分的文本聚类方法 被引量:4
4
作者 谢凤宏 张大为 +1 位作者 黄丹 谢福鼎 《计算机工程与设计》 CSCD 北大核心 2011年第3期1059-1061,1078,共4页
文本聚类是文本挖掘的一种重要方法,提出了一种加权复杂网络社团划分的新算法,通过不断寻找复杂网络中的稠密集并对其进行适当操作,达到了划分加权复杂网络的目的。将该算法应用于文本聚类,将文本用向量空间模型表示,用余弦公式计算文... 文本聚类是文本挖掘的一种重要方法,提出了一种加权复杂网络社团划分的新算法,通过不断寻找复杂网络中的稠密集并对其进行适当操作,达到了划分加权复杂网络的目的。将该算法应用于文本聚类,将文本用向量空间模型表示,用余弦公式计算文本之间的相似度,根据邻居节点构造出加权复杂网络,用提出的算法对加权复杂网络进行社团划分。对Reu-ters-21578数据集中的部分样本进行聚类,实验结果表明了该方法具有良好的聚类效果。 展开更多
关键词 文本聚类 复杂网络 社团结构 稠密集 邻居
在线阅读 下载PDF
基于复杂关联网络的生物医学研究结构的挖掘 被引量:5
5
作者 闵波 刘爱中 +2 位作者 郑萍 史艳莉 唐春霞 《中华医学图书情报杂志》 CAS 2015年第8期1-4,共4页
基于免费开放的Pub Med文献数据集,利用文献的知识发现,通过挖掘文献中隐含的关联,构建了生物医学实体关联演化网络。它能帮助科研人员形成新的科学假设,分析关联网络的拓扑特征,从系统层面上研究科学文献富集的知识结构、相关性与发展... 基于免费开放的Pub Med文献数据集,利用文献的知识发现,通过挖掘文献中隐含的关联,构建了生物医学实体关联演化网络。它能帮助科研人员形成新的科学假设,分析关联网络的拓扑特征,从系统层面上研究科学文献富集的知识结构、相关性与发展规律,为文献的知识发现引入新的视角与方法,提高知识发现的效率。 展开更多
关键词 复杂网络 文本挖掘 知识发现 关联知识网络
在线阅读 下载PDF
一种基于复杂网络的中文文本分类算法 被引量:8
6
作者 赵辉 刘怀亮 张倩 《情报学报》 CSSCI 北大核心 2012年第11期1179-1186,共8页
为解决向量空间模型中文本结构和语义信息的缺失问题,本文提出将复杂网络应用到中文文本分类过程中,将文本表示为以特征词为节点,以词语语义相关关系为边,以其相关关系强弱作为边权重的加权复杂网络,利用网络节点的综合特性对文本... 为解决向量空间模型中文本结构和语义信息的缺失问题,本文提出将复杂网络应用到中文文本分类过程中,将文本表示为以特征词为节点,以词语语义相关关系为边,以其相关关系强弱作为边权重的加权复杂网络,利用网络节点的综合特性对文本进行特征选择,以降低文本网络的复杂性。给出基于复杂网络的中文文本分类算法并对其进行实验验证。结果表明,该算法是可行的,且有较好的分类效果。 展开更多
关键词 复杂网络 特征选择 文本分类
在线阅读 下载PDF
一种基于GN算法的文本概念聚类新方法 被引量:7
7
作者 安娜 谢福鼎 +1 位作者 张永 刘绍海 《计算机工程与应用》 CSCD 北大核心 2008年第14期142-144,180,共4页
文本聚类是当前文本信息挖掘的基础和研究的重点。给出一种新的文本聚类方法,它将概念格和复杂网络有机地结合起来,以达到更优的聚类效果。首先计算关键词特征权值并对特征向量进行降维处理,然后根据关键词权值大小映射到形式背景中,通... 文本聚类是当前文本信息挖掘的基础和研究的重点。给出一种新的文本聚类方法,它将概念格和复杂网络有机地结合起来,以达到更优的聚类效果。首先计算关键词特征权值并对特征向量进行降维处理,然后根据关键词权值大小映射到形式背景中,通过本文所给出的新的相似度公式,计算出形式背景中概念相似度的大小,从而构造GN网络并应用GN算法进行文本概念聚类。最后通过实例,验证了方法的可行性。 展开更多
关键词 复杂网络 GN算法 文本聚类 概念格
在线阅读 下载PDF
新兴趋势探测研究综述 被引量:9
8
作者 钟辉新 《现代情报》 CSSCI 北大核心 2017年第12期162-167,共6页
介绍了新兴趋势等基本概念,在国际国内文献调研和分析的基础上,揭示了基于文献计量学、文本挖掘结合计量学、复杂网络理论在新兴趋势探测研究中的进展,最后总结了新兴趋势研究走向与存在问题。
关键词 新兴趋势探测 文献计量 文本挖掘 复杂网络 综述
在线阅读 下载PDF
一种基于PL-LDA模型的主题文本网络构建方法 被引量:2
9
作者 张志远 霍纬纲 《复杂系统与复杂性科学》 CSCD 北大核心 2017年第1期52-57,110,共7页
Labeled LDA能挖掘出给定主题下的单词概率分布,但却无法分析主题词之间的关联关系。采用PMI虽可计算两个单词的相互关系,但却和给定主题失去联系。受PMI在窗口中统计词对共现频率的启发,提出了一种PL-LDA(Pointwise Labeled LDA)主题模... Labeled LDA能挖掘出给定主题下的单词概率分布,但却无法分析主题词之间的关联关系。采用PMI虽可计算两个单词的相互关系,但却和给定主题失去联系。受PMI在窗口中统计词对共现频率的启发,提出了一种PL-LDA(Pointwise Labeled LDA)主题模型,可计算给定主题下词对的联合概率分布,在航空安全报告数据集上的实验表明PL-LDA模型所得结果具有很好的解释性。利用PL-LDA构建了主题文本网络,该网络除能反映主题词分布外,还可展现它们之间的复杂关联关系。 展开更多
关键词 主题模型 文本挖掘 复杂网络 PMI
在线阅读 下载PDF
构建基于文献信息网络的知识发现系统应用模型的设想 被引量:2
10
作者 闵波 张力民 +2 位作者 徐海峰 李世超 姜婧 《中华医学图书情报杂志》 CAS 2016年第5期30-34,共5页
文献检索能够帮助用户快速地查找与获取目标文献,但非结构化的文献仍然需要人工阅读才能获得有效的知识,严重限制了从大量文献中发现知识的效率。基于文献的知识发现研究是通过文献集中潜在的关联发现来形成科学假设,因此利用文本挖掘... 文献检索能够帮助用户快速地查找与获取目标文献,但非结构化的文献仍然需要人工阅读才能获得有效的知识,严重限制了从大量文献中发现知识的效率。基于文献的知识发现研究是通过文献集中潜在的关联发现来形成科学假设,因此利用文本挖掘技术将非结构化的文献集转化为图结构模型,对进一步知识发现的实施与深入挖掘都具有重要作用。有鉴于此,我们利用复杂网络的方法对文献集进行文本挖掘,探讨了关联知识的图结构组织对文献知识发现的重要作用,揭示了非相关文献中的隐含知识,并构建了文献信息网络的知识发现应用模型。 展开更多
关键词 文本挖掘 知识发现 复杂网络 自然语言处理
在线阅读 下载PDF
基于文本复杂网络的内容结构特征分析 被引量:5
11
作者 刘红红 安海忠 高湘昀 《现代图书情报技术》 CSSCI 北大核心 2011年第1期69-73,共5页
针对文本信息内容结构参差不齐的问题,提出一种评价文本内容结构分析方法,该方法将文本中的句子作为节点,句子之间的共同名词作为边,构建文本复杂网络,并选取复杂网络的拓扑性质对文本结构特征进行分析。基于一个新闻文本案例构建复杂网... 针对文本信息内容结构参差不齐的问题,提出一种评价文本内容结构分析方法,该方法将文本中的句子作为节点,句子之间的共同名词作为边,构建文本复杂网络,并选取复杂网络的拓扑性质对文本结构特征进行分析。基于一个新闻文本案例构建复杂网络,并计算度、强度、最短路径、加权聚类系数等衡量指标,这些指标能很好地评价文本内容结构的好坏,也为理解和提取文本的中心思想、生成摘要、文本检索过滤提供重要参考依据。 展开更多
关键词 文本复杂网络 内容结构 最短路径 聚类系数
原文传递
结合复杂网络的特征权重改进算法研究 被引量:6
12
作者 杜坤 刘怀亮 郭路杰 《现代图书情报技术》 CSSCI 2015年第11期26-32,共7页
【目的】为了更准确计算特征权重,以提高文本相似度计算的准确性。【方法】考虑特征项间的语义关联构造文本复杂网络并进行特征选择,定义类别相关系数并结合特征选择结果,提出一种改进的特征权重计算方法,并进行中文文本分类实验。【结... 【目的】为了更准确计算特征权重,以提高文本相似度计算的准确性。【方法】考虑特征项间的语义关联构造文本复杂网络并进行特征选择,定义类别相关系数并结合特征选择结果,提出一种改进的特征权重计算方法,并进行中文文本分类实验。【结果】对比实验结果表明,本文提出的特征权重改进算法较之TFIDF算法能够取得较好的分类效果。【局限】特征选择评估函数中的参数需要人工给定。【结论】相较于传统的TFIDF算法,该算法能够更加准确地计算特征权重。 展开更多
关键词 复杂网络 特征权重 文本分类
原文传递
文本智能计算研究的主题挖掘与演化分析 被引量:7
13
作者 胡吉明 田沛霖 《情报杂志》 CSSCI 北大核心 2021年第4期139-146,共8页
[目的/意义]文本智能计算是近年来的新兴交叉学科,揭示其研究动态对情报学研究有重要意义。[方法/过程]从关键词共现网络的视角,以WOS核心合集中的文献为分析样本,借助复杂网络计算、社区划分以及可视化等技术手段,揭示了文本智能计算... [目的/意义]文本智能计算是近年来的新兴交叉学科,揭示其研究动态对情报学研究有重要意义。[方法/过程]从关键词共现网络的视角,以WOS核心合集中的文献为分析样本,借助复杂网络计算、社区划分以及可视化等技术手段,揭示了文本智能计算研究的主题结构和演化脉络,并总结归纳了其发展态势。[结果/结论]当前文本智能计算研究的结构趋于稳定,各子领域关联性较强。研究当前主要分为5个子领域,人工智能、数据挖掘是当前的领域研究热点,文本分析领域将有所突破,并成为新的研究重心。 展开更多
关键词 文本智能计算 复杂网络分析 主题结构 演化态势
在线阅读 下载PDF
面向用户生成内容的短文本聚类算法研究 被引量:6
14
作者 赵辉 刘怀亮 《现代图书情报技术》 CSSCI 北大核心 2013年第9期88-92,共5页
针对用户生成内容中短文本特征语义描述能力弱和K-means算法对初始聚类中心选值的敏感性问题,通过维基百科概念、链接结构和类别体系信息对短文本进行特征扩展以补充其语义信息。进而以文本间语义关系为基础构建文本集加权复杂网络,利... 针对用户生成内容中短文本特征语义描述能力弱和K-means算法对初始聚类中心选值的敏感性问题,通过维基百科概念、链接结构和类别体系信息对短文本进行特征扩展以补充其语义信息。进而以文本间语义关系为基础构建文本集加权复杂网络,利用节点综合特性来选取初始聚类中心,并结合K-means算法对网络节点进行社团划分以达到短文本聚类的目的。实验结果表明,该方法能够有效提高短文本聚类效果。 展开更多
关键词 短文本聚类 特征扩展 复杂网络 K—means算法 用户生成内容
原文传递
一种基于复杂网络的短文本语义相似度计算 被引量:14
15
作者 詹志建 杨小平 《中文信息学报》 CSCD 北大核心 2016年第4期71-80,89,共11页
将传统的文本相似度量方法直接移植到短文本时,由于短文本内容简短的特性会导致数据稀疏而造成计算结果出现偏差。该文通过使用复杂网络表征短文本,提出了一种新的短文本相似度量方法。该方法首先对短文本进行预处理,然后对短文本建立... 将传统的文本相似度量方法直接移植到短文本时,由于短文本内容简短的特性会导致数据稀疏而造成计算结果出现偏差。该文通过使用复杂网络表征短文本,提出了一种新的短文本相似度量方法。该方法首先对短文本进行预处理,然后对短文本建立复杂网络模型,计算短文本词语的复杂网络特征值,再借助外部工具计算短文本词语之间的语义相似度,然后结合短文本语义相似度定义计算短文本之间的相似度。最后在基准数据集上进行聚类实验,验证本文提出的短文本相似度计算方法在基于F-度量值标准上,优于传统的TF-IDF方法和另一种基于词项语义相似度的计算方法。 展开更多
关键词 复杂网络 综合特征值 短文本 语义相似度
在线阅读 下载PDF
大数据与广义GIS 被引量:57
16
作者 陆锋 张恒才 《武汉大学学报(信息科学版)》 EI CSCD 北大核心 2014年第6期645-654,共10页
普适计算基础设施和数据处理技术的发展催生了大数据概念,而大数据时空粒度的不断细化加速了地理空间信息的泛化过程。阐述了大数据时代地理空间信息泛化的显著特征,进而提出GIS概念广义化的迫切需求,从数据采集与整理、数据管理与集成... 普适计算基础设施和数据处理技术的发展催生了大数据概念,而大数据时空粒度的不断细化加速了地理空间信息的泛化过程。阐述了大数据时代地理空间信息泛化的显著特征,进而提出GIS概念广义化的迫切需求,从数据采集与整理、数据管理与集成、数据分析与计算三个方面分析了广义GIS所面临的技术挑战,重点探讨了互联网蕴含地理空间数据采集、移动对象数据库和异构动态数据管理、移动对象轨迹数据挖掘、复杂网络分析等方面的研究进展与存在的问题,并展望了广义GIS时代地理计算与城市计算、社会计算的融合趋势。 展开更多
关键词 广义地理信息系统 互联网文本搜索 移动对象数据库 轨迹数据挖掘 复杂网络
原文传递
集成专利文本与分类号的技术扩散机会研究 被引量:4
17
作者 肖人彬 林文广 陈水宣 《南昌工程学院学报》 CAS 2020年第1期1-9,共9页
在现有研究的基础上,针对专利数据信息主要研究方法各自存在的优势及不足,提出集成专利文本及分类号的技术扩散机会研究方法,设计一种涵盖数据处理、目标领域确定、技术细节分析以及技术扩散建议等阶段的流程框架,同时针对流程中的复杂... 在现有研究的基础上,针对专利数据信息主要研究方法各自存在的优势及不足,提出集成专利文本及分类号的技术扩散机会研究方法,设计一种涵盖数据处理、目标领域确定、技术细节分析以及技术扩散建议等阶段的流程框架,同时针对流程中的复杂网络布局、节点社区划分、主题获取以及主题筛选等环节存在的问题,分别采取ForceAtlas布局算法、G-N聚类算法、LDA算法和技术指数模型等关键技术进行解决,最后将流程应用于固态二氧化碳工业领域,以验证方法的有效性和实用性。 展开更多
关键词 技术扩散 专利文本 分类号 复杂网络
在线阅读 下载PDF
利用网络游记分析成都市旅游景区空间结构 被引量:4
18
作者 张红 李玥 +1 位作者 邓雯 王艺 《地理空间信息》 2024年第7期31-35,共5页
从携程网爬取了2010—2019年成都市游记数据,构建旅游景区关键词文本共现网络,采用数量统计、空间分析、复杂网络分析等方法,挖掘成都市旅游景区游客到访的时空分异特征。结果表明,成都市旅游景区到访频率呈长尾分布,空间上形成以青城... 从携程网爬取了2010—2019年成都市游记数据,构建旅游景区关键词文本共现网络,采用数量统计、空间分析、复杂网络分析等方法,挖掘成都市旅游景区游客到访的时空分异特征。结果表明,成都市旅游景区到访频率呈长尾分布,空间上形成以青城山—都江堰、金牛—武侯主城区为高热度中心的“双核摄动”格局;成都市旅游景区文本共现网络具有较高的集聚系数和较短的平均路径,等级圈层结构和马太效应较显著,热门景区对邻近热门景区的空间溢出效应显著,但对邻近低等级景区的带动效果有限;成都市旅游景区空间结构由条带状和团簇式向轴辐式和网络化方向转变,在区域旅游一体化发展中的作用日益显著。 展开更多
关键词 旅游景区 网络游记 空间结构 文本共现 复杂网络分析
在线阅读 下载PDF
机构投资者抱团与公司前瞻性信息披露 被引量:15
19
作者 张俊瑞 仇萌 张志超 《统计与信息论坛》 CSSCI 北大核心 2023年第5期53-66,共14页
提高信息披露水平是缓解公司内部管理层与外部投资者之间信息不对称的关键机构投资者作为长期资金提供者,更关注企业的前景和成长性,因此会格外关注公司的前瞻性信息披露。国内外现有研究对中国实践情境下机构投资者持股抱团现象缺乏关... 提高信息披露水平是缓解公司内部管理层与外部投资者之间信息不对称的关键机构投资者作为长期资金提供者,更关注企业的前景和成长性,因此会格外关注公司的前瞻性信息披露。国内外现有研究对中国实践情境下机构投资者持股抱团现象缺乏关注,尤其是尚未探讨机构投资者持股抱团与上市公司前瞻性信息披露之间的关系。基于2007—2019年中国A股上市公司数据,通过复杂网络分析方法构建机构投资者重仓持股网络,并借助模块度的社区算法(Louvain算法)提取机构投资者网络团体,同时采取Word2Vec神经网络模型算法构建上市公司前瞻性信息披露指标,进而考察机构投资者网络抱团对公司前瞻性信息披露的影响。研究发现:机构投资者抱团持股比例与公司前瞻性信息披露呈现显著正相关关系,即机构投资者抱团后,公司年报中将来时态的词频显著提高。机制检验发现,机构投资者通过持股抱团增强其对管理层监督的动机与能力,以及机构投资者抱团促使公司增加披露前瞻性描述内容与描述语气,以上两条机制来增加年报中对未来展望的描述。进一步分析发现,机构投资者抱团对前瞻性信息的正向效应存在于民营企业与分析师关注度较高的企业。研究结论通过一系列稳健性检验仍显著成立,加深了公司治理中机构投资者治理角色的认知,促进发挥机构投资者抱团的长期投资作用,对于资本市场持续稳定发展具有启示意义。 展开更多
关键词 机构投资者网络 机构投资者抱团 复杂网络 前瞻性信息披露 文本信息特征
在线阅读 下载PDF
基于加权网络改进的中文短文本相似性度量模型 被引量:5
20
作者 牛奉高 高旭霞 《情报学报》 CSSCI CSCD 北大核心 2021年第3期278-285,共8页
随着文本信息的迅猛增长,数据挖掘已成为知识发现的重要方法。短文本相似性(short text similarity,STSim)度量是数据挖掘研究的重要技术。为了更好的提高短文本相似性度量精度,本文提出了基于加权网络改进的中文短文本相似性度量的一... 随着文本信息的迅猛增长,数据挖掘已成为知识发现的重要方法。短文本相似性(short text similarity,STSim)度量是数据挖掘研究的重要技术。为了更好的提高短文本相似性度量精度,本文提出了基于加权网络改进的中文短文本相似性度量的一种新模型。首先,基于词语间的共现频次对语义网络进行加权,利用加权复杂网络表征短文本;其次,考虑短文本加权复杂网络权重识别度低的特点及每个词语节点的位置,计算短文本中每个词语的加权复杂网络综合特征值;最后,根据新模型计算短文本相似性,并通过聚类实验评价其优劣。实验结果表明,新提出的相似性度量模型优于STSim模型。 展开更多
关键词 STSim模型 加权复杂网络 加权综合特征值 短文本 语义相似性
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部