期刊文献+
共找到751篇文章
< 1 2 38 >
每页显示 20 50 100
Topic-shift in Network Media Reports 被引量:1
1
作者 杨跃珍 《海外英语》 2011年第3X期252-253,256,共3页
It, from the perspective of cohesion, extracts three types of topic-shift markers used in this genre, namely 'change of narrators', 'change of objects being talked about', and 'temporal adverbials&... It, from the perspective of cohesion, extracts three types of topic-shift markers used in this genre, namely 'change of narrators', 'change of objects being talked about', and 'temporal adverbials' to analyze four journalistic reports from the network media and draws the conclusion that cohesion between two topic units is usually weaker than that within a specific topic fragment. 展开更多
关键词 topic-shift MARKING COHESION network media REPORTS topic FRAGMENT
在线阅读 下载PDF
基于BERTopic和LSTM模型的新兴主题预测研究 被引量:6
2
作者 张家惠 丁敬达 《情报科学》 北大核心 2025年第1期98-105,126,共9页
【目的/意义】相比新兴主题的回溯性探测,对新兴主题进行预测研究可以提高新兴主题识别的准确性和前瞻性,有助于丰富新兴主题探测分析的方法体系。【方法/过程】首先,利用BERTopic模型得到领域系列主题;其次,基于文档频率、引用频率、Ps... 【目的/意义】相比新兴主题的回溯性探测,对新兴主题进行预测研究可以提高新兴主题识别的准确性和前瞻性,有助于丰富新兴主题探测分析的方法体系。【方法/过程】首先,利用BERTopic模型得到领域系列主题;其次,基于文档频率、引用频率、Pscore和新兴分数构建模型预测特征集;然后基于主题前三年特征集数据采用LSTM模型预测后两年新兴分数,判断得到领域新兴主题。【结果/结论】构建基于BERTopic和LSTM模型的新兴主题预测方法,并以数据安全领域为例进行实证研究,通过和BP、SVM模型以及相关研究结果的比较表明该方法得到的新兴主题更加有效和合理。【创新/局限】融合新颖性、增长性和影响性特征,构建单一指标新兴分数来预测新兴主题,但没有考虑对未来可能出现主题的预测。 展开更多
关键词 BERtopic模型 神经网络 LSTM 预测 新兴主题 数据安全
原文传递
消费品投诉识别与缺陷特征发现——基于BERTopic模型
3
作者 田晶晶 洪瑶瑶 +2 位作者 韦海霞 刘成伟 林春伟 《标准科学》 2025年第6期116-125,共10页
【目的】为改进消费品质量和服务、提升消费者满意度和品牌竞争力提供依据,助力消费品市场有序健康发展。【方法】以2016—2021年从政府官方平台获取的23,736条投诉文本为基础,应用BERTopic模型进行主题挖掘,识别主要主题及演化趋势,并... 【目的】为改进消费品质量和服务、提升消费者满意度和品牌竞争力提供依据,助力消费品市场有序健康发展。【方法】以2016—2021年从政府官方平台获取的23,736条投诉文本为基础,应用BERTopic模型进行主题挖掘,识别主要主题及演化趋势,并借助投诉主题网络分析缺陷特征之间的关联性。【结果】消费品投诉主要集中在电子产品的质量缺陷和售后服务不足,消费者对手机电池问题导致的自动关机关注度较高,投诉主题网络揭示了投诉内容之间的复杂关系,维修、售后等问题在网络中占据桥梁地位,消费者重视品牌,并对品牌和产品类别的投诉表现出显著差异。【结论】所构建的主题模型能够较好地识别投诉的类别、品牌、缺陷特征等,并详细展示了各投诉内容之间的关联性。后续将进一步扩大研究样本范围,从更广泛的渠道获得投诉文本并进行信息挖掘。 展开更多
关键词 消费品缺陷 BERtopic模型 文本挖掘 投诉主题网络
在线阅读 下载PDF
Mapping the evolution of research topics using ATM and SNA 被引量:1
4
作者 Chunlei YE 《Chinese Journal of Library and Information Science》 2014年第4期46-62,共17页
Purpose:This paper introduces an analysis framework for tracking the evolution of research topics at the selected topics level,covering a research topic’s evolution trend,evolution path and its content changes over t... Purpose:This paper introduces an analysis framework for tracking the evolution of research topics at the selected topics level,covering a research topic’s evolution trend,evolution path and its content changes over time.Design/methodology/approach:After the topics were recovered by the author-topic model,we first built the keyword-topic co-occurrence network to track the dynamics of topic trends.Then a single-mode network was constructed with each node representing a topic and edge indicating the relationship between topics.It was used to illustrate the evolution path and content changes of research topics.A case study was conducted on the digital library research in China to verify the effectiveness of the analysis framework.Findings:The experimental results show that this analysis framework can be used to track evolution of research topics at a micro level and using social network analysis method can help understand research topics’evolution paths and content changes with the passage of time.Research limitations:Using the analysis framework will produce limited results when examining unstructured data such as social media data.In addition,the effectiveness of the framework introduced in this paper needs to be verified with more research topics in information science and in more scientific fields.Practical implications:This analysis framework can help scholars and researchers map research topics’evolution process and gain insights into how a field’s topics have evolved over time.Originality/value:Tbe analysis framework used in this study can help reveal more micro evolution details.The index to measure topic association strength defined in this paper reflects both similarity and dissimilarity between topics,which belps better understand research topics’evolution paths and content changes. 展开更多
关键词 topic evolution Social network analysis(SNA) Author-topic model(ATM) Digital library topic network
原文传递
基于数据挖掘与网络药理学分析中药外治手足综合征用药规律及作用机制
5
作者 楼鹏程 屠世良 《新中医》 2026年第1期183-190,共8页
目的:基于数据挖掘与网络药理学分析中药治疗手足综合征(HFS)的组方用药规律及作用机制。方法:检索自建库至2024年6月30日中国知网、万方、维普、谷歌学术、PubMed等数据库中有关中药外用治疗HFS的文献,建立方剂数据库。使用Excel 2021... 目的:基于数据挖掘与网络药理学分析中药治疗手足综合征(HFS)的组方用药规律及作用机制。方法:检索自建库至2024年6月30日中国知网、万方、维普、谷歌学术、PubMed等数据库中有关中药外用治疗HFS的文献,建立方剂数据库。使用Excel 2021、IBM SPSS Modeler 18.0、SPSS Statistics 27.0等软件进行中药频数、性味归经统计,关联规则和聚类分析。应用网络药理学方法研究核心药对黄芪-当归-桂枝治疗HFS的关键靶点,构建蛋白质互作(PPI)网络,并进行基因本体(GO)功能和京都基因与基因组百科全书(KEGG)通路富集分析;运用AutoDockTools等软件对核心活性成分与关键靶点进行分子对接验证。结果:研究涉及中药160味,高频药物19味,其中当归、桂枝、黄芪、红花、川芎使用频次较高。药性以温、寒、平为主,药味以苦、辛、甘为主,多归肝经。关联规则分析得到支持度≥10%、置信度≥88%的关联规则85条。高频药物聚类分析得到5类药物组合。核心药物黄芪-当归-桂枝包含62种活性成分,涉及81个HFS治疗靶点。网络拓扑分析获得7-O-甲基异粘氨基葡萄糖醇、二氢异黄酮、9,10-二甲氧基-3-羟基紫檀素、美迪紫檀苷、鞘磷脂等核心成分。PPI网络分析获得G1/S-特异性周期蛋白-D1(CCND1)、表皮生长因子受体(EGFR)、半胱氨酸天冬氨酸蛋白酶3(CASP3)、信号转导和转录激活因子3(STAT3)、热休克蛋白90α家族A类成员1(HSP90AA1)等为核心靶点。KEGG结果显示癌症通路、缺氧诱导因子-1(HIF-1)、叉头框O型转录因子(FoxO)、丝裂原活化蛋白激酶(MAPK)等是其主要作用通路。核心活性成分与关键靶点分子对接结合能大多数<-5 kcal/mol。结论:中医药治疗HFS以外用活血化瘀类药物为主,核心药对黄芪-当归-桂枝具有多成分、多靶点、多通路的治疗特点,通过抗炎、调节细胞增殖与凋亡、改善氧化应激等机制发挥治疗HFS的作用。 展开更多
关键词 手足综合征 中药外治 网络药理学 数据挖掘 用药规律 作用机制
原文传递
基于BERT大语言模型的广东省人工智能发明专利测度与时空演化特征
6
作者 陈奕嘉 谭俊涛 杨瑞霖 《热带地理》 北大核心 2026年第1期154-166,共13页
在人工智能(AI)日益成为推动区域高质量发展的关键技术背景下,如何科学测度AI技术活动的空间分布和演化趋势,成为经济地理学研究的重要议题。然而,现有的识别方法在语义有效性、识别精度以及覆盖广度等方面仍存在不足,有待进一步提升与... 在人工智能(AI)日益成为推动区域高质量发展的关键技术背景下,如何科学测度AI技术活动的空间分布和演化趋势,成为经济地理学研究的重要议题。然而,现有的识别方法在语义有效性、识别精度以及覆盖广度等方面仍存在不足,有待进一步提升与完善。为此,文章以广东省2001-2021年约120万条授权发明专利摘要为基础,引入BERT大语言模型,构建基于语义理解的AI授权发明专利识别方法,识别出约20万条AI发明专利文本。在此基础上,结合BERTopic主题建模方法,进一步揭示AI发明专利在广东省的关注领域与动态演化特征。研究发现:1)2001-2021年广东省AI发明专利数量整体经历了缓慢增长和快速扩张2个阶段,AI发明专利占比则呈持续上升趋势,反映AI技术在区域创新体系中的重要性不断提升。2)空间分布方面,AI发明专利在大湾区高度集聚,深圳和广州2市占全省AI发明专利的75.1%,珠海和东莞两地在AI发明专利占比上亦显示出较强活力。在合作网络方面,广东省AI发明专利合作网络呈现显著的“核心―边缘”结构特征,城市间在合作网络中的地位差异明显。3)在技术内容上,广东省AI发明专利主要聚焦于数据与图像处理、机器人与自动化装置、智能交通与故障检测、智能家居与环境控制和生物模拟与图像分析五大主题,不同主题的演化节奏存在差异,其中图像处理技术最为活跃,机器人和智能交通等领域近年来快速增长。此外,广东省内不同城市在AI发明专利布局上也各具特色,形成了差异化的技术优势。 展开更多
关键词 人工智能 AI发明专利 BERT大语言模型 主题建模 技术演化 合作网络 广东省
在线阅读 下载PDF
基于iTopicModel的关联文本分类算法
7
作者 梁鹏鹏 柴玉梅 王黎明 《计算机工程》 CAS CSCD 北大核心 2011年第21期124-125,130,共3页
针对传统文本分类方法对文档间关联关系考虑不充分的问题,提出一种基于iTopicModel的关联文本分类算法。根据类信息已知的文档归属于各个主题的概率判断主题代表的类信息,利用待分类文档归属于各个主题的概率及文本信息对文档进行分类... 针对传统文本分类方法对文档间关联关系考虑不充分的问题,提出一种基于iTopicModel的关联文本分类算法。根据类信息已知的文档归属于各个主题的概率判断主题代表的类信息,利用待分类文档归属于各个主题的概率及文本信息对文档进行分类。实验结果表明,当文档间的关联关系对类信息影响较大时,TC-iTM的分类性能优于传统文本分类方法。 展开更多
关键词 文本分类 文档网络 主题模型 EM算法
在线阅读 下载PDF
Topic Detection Based on Weak Tie Analysis: A Case Study of LIS Research 被引量:7
8
作者 Ling Wei Haiyun Xu +3 位作者 Zhenmeng Wang Kun Dong Chao Wang Shu Fang 《Journal of Data and Information Science》 2016年第4期81-101,共21页
Purpose: Based on the weak tie theory, this paper proposes a series of connection indicators Acof weak tie subnets and weak tie nodes to detect research topics, recognize their connections, and understand their evolut... Purpose: Based on the weak tie theory, this paper proposes a series of connection indicators Acof weak tie subnets and weak tie nodes to detect research topics, recognize their connections, and understand their evolution.Design/methodology/approach: First, keywords are extracted from article titles and preprocessed. Second, high-frequency keywords are selected to generate weak tie co-occurrence networks. By removing the internal lines of clustered sub-topic networks, we focus on the analysis of weak tie subnets’ composition and functions and the weak tie nodes’ roles.Findings: The research topics’ clusters and themes changed yearly; the subnets clustered with technique-related and methodology-related topics have been the core, important subnets for years; while close subnets are highly independent, research topics are generally concentrated and most topics are application-related; the roles and functions of nodes and weak ties are diversified.Research limitations: The parameter values are somewhat inconsistent; the weak tie subnets and nodes are classified based on empirical observations, and the conclusions are not verified or compared to other methods.Practical implications: The research is valuable for detecting important research topics as well as their roles, interrelations, and evolution trends. Originality/value: To contribute to the strength of weak tie theory, the research translates weak and strong ties concepts to co-occurrence strength, and analyzes weak ties’ functions. Also, the research proposes a quantitative method to classify and measure the topics’ clusters and nodes. 展开更多
关键词 Research topics Weak tie network Weak tie theory Weak tie nodes Library and Information Science(LIS)
在线阅读 下载PDF
Computer Assisted Language Learning Social Networks: What Are They Talking about? 被引量:1
9
作者 Andrew Laghos Efi Nisiforou 《Social Networking》 2018年第3期170-180,共11页
There are many reasons that motivate people to build online communities. The purpose of this study was to identify the topics that learners discuss when they are part of a computer assisted language learning course in... There are many reasons that motivate people to build online communities. The purpose of this study was to identify the topics that learners discuss when they are part of a computer assisted language learning course in order to answer the question “What are they talking about?”. We have examined an e-community of 618 students who were learning the Modern Greek language online. We analyzed their conversation topics directly from the discussion boards of the web-based course and sorted them into the pre-defined topic categories. The results of the study showed that during the first lessons of the course the students contributed more to social discussions which were unrelated to the course material. The reason of this outcome is that the students want to introduce themselves and meet their peers. As they progressed through the course’s lessons, however, their discussion topics became more course material related. The study ends with implications of the results and future research directions. 展开更多
关键词 Computer Assisted Language Learning SOCIAL networks Students’ Discussion topicS
暂未订购
主题模型网络分析:计算传播视野下的舆情文本挖掘新进路 被引量:2
10
作者 张媛 刘兴澳 《情报杂志》 北大核心 2025年第5期122-129,共8页
[研究目的]旨在提出一种新的复杂文本挖掘方法——“主题模型网络分析”(ANTMN),以解决传统舆情文本挖掘方法在动机过强、人工介入过多、主题粗糙等方面的局限,为舆情治理、风险识别和舆论引导提供有效的方法支持。[研究方法]通过文献... [研究目的]旨在提出一种新的复杂文本挖掘方法——“主题模型网络分析”(ANTMN),以解决传统舆情文本挖掘方法在动机过强、人工介入过多、主题粗糙等方面的局限,为舆情治理、风险识别和舆论引导提供有效的方法支持。[研究方法]通过文献梳理分析传统方法的局限性及计算转向的学术进展,通过比较分析论证ANTMN较之现有方法的创新优势。[研究结果/结论]研究发现,ANTMN遵循“主题建模”“网络分析”与“社区检测”的三步法,以“纯归纳取向”获得客观性,以“混合计算取向”超越传统方法的静态局限。ANTMN还在舆情传播研究中表现出较强的实践应用价值,即在经验现象中提出舆情传播问题、在数据驱动中解析舆情传播机制、在趋势预测中建构舆情传播体系。 展开更多
关键词 舆情传播 主题模型网络分析 舆情文本挖掘 计算传播
在线阅读 下载PDF
融合网络结构特征的学科新兴主题识别方法研究
11
作者 杨金庆 罗曼 +2 位作者 程秀峰 夏立新 马廷灿 《情报学报》 北大核心 2025年第6期645-659,共15页
学科新兴主题识别是及时发现科技创新发展动态、追踪学科发展趋势的有效方法。学科新兴主题的涌现是一个复杂的过程,不仅受科学交流过程的影响还受网络自组织过程的影响。学科新兴主题的网络结构在一定程度上嵌入了其特有性质。本文在... 学科新兴主题识别是及时发现科技创新发展动态、追踪学科发展趋势的有效方法。学科新兴主题的涌现是一个复杂的过程,不仅受科学交流过程的影响还受网络自组织过程的影响。学科新兴主题的网络结构在一定程度上嵌入了其特有性质。本文在常见科学交流属性特征的基础上,融合学科主题在网络中的全局和局部网络结构特征,通过随机匹配生成标准实验数据集,先后运用多指标加权融合方法与机器学习分类方法识别学科新兴主题。研究结果表明,多指标加权融合方法对识别影响力排序靠前的学科主题表现较好。但是,P@270高影响力主题仅占60%,低于随机森林分类识别模型的最优性能64.14%,这表明机器学习分类识别方法在拟合复杂过程方面具有优势,而多指标加权融合方法更适用于关注顶尖影响力主题的任务。机器学习可解释分析结果表明,吸纳引用频次较多、网络影响力较高、论文发表较多、关注作者影响力与期刊影响力较强对高影响力主题识别起正向作用;与之相反,结构突变程度高对学科新兴主题识别有负向作用。 展开更多
关键词 学科新兴主题 主题网络 科技创新 科技情报
在线阅读 下载PDF
面向有组织产学研协同创新的合作主题挖掘 被引量:6
12
作者 黄璐 任航 +1 位作者 曹晓丽 陈翔 《科学学研究》 北大核心 2025年第3期548-559,共12页
开展有组织的产学研协同创新,是发挥我国新型举国体制优势、实现产学研深度融合的重要内容。其中,对产学研“合作主题”的有效识别是实现高质量高效率产学研协同创新的首要问题。本文提出了一套基于复杂网络分析和深度学习算法的产学研... 开展有组织的产学研协同创新,是发挥我国新型举国体制优势、实现产学研深度融合的重要内容。其中,对产学研“合作主题”的有效识别是实现高质量高效率产学研协同创新的首要问题。本文提出了一套基于复杂网络分析和深度学习算法的产学研协同创新合作主题挖掘方法。首先,围绕“有组织的产学研协同创新”概念和主题特征进行深度剖析,提出产学研合作主题应具有高价值性和强相关性两大特征;其次,基于论文数据和专利数据分别构建“科学主题词-学研机构”双层网络和“技术主题词-企业”双层网络,其中,SciBERT模型被用来构建科学和技术主题词语义网络,基于Node2Vec的链路预测模型被用来预测未来的科学和技术主题词语义网络;之后,应用复杂网络拓扑结构分析、社区发现、机器学习等方法对主题的新颖性、基础性、广泛性、成长性、前瞻性五大指标进行测度,识别高价值的科学主题和技术主题;最后,对语义相似度指标SimDoc进行改进,计算科学主题和技术主题之间的相关性,遴选产学研协同潜力大的“科学主题-技术主题对”。本文选取人工智能领域开展实证研究,对提出的研究方法进行验证。本研究能为国家、区域和行业组织高层级产学研协同创新提供重要的量化决策参考。 展开更多
关键词 产学研协同创新 产学研合作主题 SciBERT模型 复杂网络分析 有组织
原文传递
融合LDA-BN的船舶碰撞事故致因分析 被引量:1
13
作者 邵波 刘巧 +2 位作者 柯善钢 郑霞忠 贺语琴 《安全与环境学报》 北大核心 2025年第1期157-164,共8页
为探究船舶碰撞事故致因及其关系,提升航运安全管理水平,研究提出融合狄利克雷分布(Latent Dirichlet allocation,LDA)与贝叶斯网络(Bayesian Network,BN)的船舶碰撞事故致因分析方法。首先,运用LDA主题模型挖掘361份船舶碰撞事故调查报... 为探究船舶碰撞事故致因及其关系,提升航运安全管理水平,研究提出融合狄利克雷分布(Latent Dirichlet allocation,LDA)与贝叶斯网络(Bayesian Network,BN)的船舶碰撞事故致因分析方法。首先,运用LDA主题模型挖掘361份船舶碰撞事故调查报告,提取27个事故致因主题;其次,利用事故树方法厘清调查报告中致因间的影响关系,构建事故致因贝叶斯网络结构,使用期望最大化算法进行贝叶斯网络参数学习,确定各节点的条件概率,构建事故致因贝叶斯网络模型;最后,通过逆向推理分析、最大致因链分析及敏感性分析,找出导致船舶碰撞事故发生的主要致因因素。结果显示:安全管理不到位、疏忽瞭望、事发水域通航环境复杂是引发船舶碰撞事故可能性大的致因,航线保持不当、应急处置不当、违规穿越锚地是导致船舶碰撞事故发生的最敏感致因因素。 展开更多
关键词 安全社会工程 船舶碰撞 狄利克雷分布主题模型 贝叶斯网络 事故致因
原文传递
Identification of Influential Users in Online Social Network: A Brief Overview
14
作者 Mahmuda Ferdous Md. Musfique Anwar 《Journal of Computer and Communications》 2023年第7期58-73,共16页
Information networks where users join a network, publish their own content, and create links to other users are called Online Social Networks (OSNs). Nowadays, OSNs have become one of the major platforms to promote bo... Information networks where users join a network, publish their own content, and create links to other users are called Online Social Networks (OSNs). Nowadays, OSNs have become one of the major platforms to promote both new and viral applications as well as disseminate information. Social network analysis is the study of these information networks that leads to uncovering patterns of interaction among the entities. In this regard, finding influential users in OSNs is very important as they play a key role in the success above phenomena. Various approaches exist to detect influential users in OSNs, starting from simply counting the immediate neighbors to more complex machine-learning and message-passing techniques. In this paper, we review the recent existing research works that focused on identifying influential users in OSNs. 展开更多
关键词 Online Social network Trending topics Social Influence Influential User
在线阅读 下载PDF
基于改进标签传播算法的舆情社交网络社区发现 被引量:1
15
作者 钱晓东 王卓 《计算机应用研究》 北大核心 2025年第1期48-55,共8页
通过改进的标签传播算法研究了舆情社交网络中的社交主题发现。针对传统算法容易陷入局部最优的问题,依据节点间相似度选择标签传播时的邻居节点;针对传统算法标签更新时的随机性问题,通过结合舆论动力学模型HK的观点交互过程,依据节点... 通过改进的标签传播算法研究了舆情社交网络中的社交主题发现。针对传统算法容易陷入局部最优的问题,依据节点间相似度选择标签传播时的邻居节点;针对传统算法标签更新时的随机性问题,通过结合舆论动力学模型HK的观点交互过程,依据节点影响力的大小更新标签。实验结果表明,该方法在最好情况下(k=0.9)相较于原算法,在稳定性和模块度指标两方面分别提高了31%和78%,并且优于其他几种改进算法。由此可见,该算法相较于原算法及其他改进算法在舆情社交网络的主题社区发现中表现更好。 展开更多
关键词 标签传播算法 舆情社交网络 HK模型 主题社区发现
在线阅读 下载PDF
基于LDA算法的关键共性技术识别研究——以智能纺织领域为例
16
作者 许菱 郑婧然 +2 位作者 王耀刚 张克 朱文兴 《现代纺织技术》 北大核心 2025年第8期10-18,共9页
关键共性技术研究是推进国家制造业创新发展的重要支撑,准确识别关键共性技术成为推动产业转型升级的一大助力。以专利数据为基础,运用LDA主题模型挖掘出隐藏的高强度技术主题,通过共现率指标评估技术主题的共现程度,以此归纳出共性技... 关键共性技术研究是推进国家制造业创新发展的重要支撑,准确识别关键共性技术成为推动产业转型升级的一大助力。以专利数据为基础,运用LDA主题模型挖掘出隐藏的高强度技术主题,通过共现率指标评估技术主题的共现程度,以此归纳出共性技术。在此基础上,运用网络分析方法,结合度中心性、接近中心性以及结构洞3个拓扑指标将各技术主题的关键程度进行量化分析,进一步识别出关键共性技术。研究发现:智能纺织领域的关键共性技术主要包含在工艺材料、工艺流程和工艺设备中;石墨烯纤维、柔性纳米纤维、聚氨酯整理剂等是工艺材料中的关键共性技术;智能缝纫技术、超疏水涂层技术、水凝胶导电技术等是工艺流程中的关键共性技术;传感器是工艺设备中的关键共性技术。研究结果可对纺织服装产业的技术创新有一定的促进作用。 展开更多
关键词 关键共性技术 LDA主题模型 社会网络分析 智能纺织
在线阅读 下载PDF
A Metric Approach to Hot Topics in Biomedicine via Keyword Co-occurrence 被引量:1
17
作者 Jane H.Qin Jean J.Wang Fred Y.Ye 《Journal of Data and Information Science》 CSCD 2019年第4期13-25,共13页
Purpose:To reveal the research hotpots and relationship among three research hot topics in b iomedicine,namely CRISPR,iPS(induced Pluripotent Stem)cell and Synthetic biology.Design/methodology/approach:We set up their... Purpose:To reveal the research hotpots and relationship among three research hot topics in b iomedicine,namely CRISPR,iPS(induced Pluripotent Stem)cell and Synthetic biology.Design/methodology/approach:We set up their keyword co-occurrence networks with using three indicators and information visualization for metric analysis.Findings:The results reveal the main research hotspots in the three topics are different,but the overlapping keywords in the three topics indicate that they are mutually integrated and interacted each other.Research limitations:All analyses use keywords,without any other forms.Practical implications:We try to find the information distribution and structure of these three hot topics for revealing their research status and interactions,and for promoting biomedical developments.Originality/value:We chose the core keywords in three research hot topics in biomedicine by using h-index. 展开更多
关键词 Keyword co-occurrence network analysis Information visualization BIOMEDICINE Hot topics CRISPR-Cas iPS cell Synthetic biology
在线阅读 下载PDF
LLM-PKE:一种集成大语言模型与多特征网络的专利关键词提取方法研究
18
作者 吕学强 万甜 +2 位作者 马登豪 才藏太 陈玉忠 《数据分析与知识发现》 北大核心 2025年第10期41-53,共13页
【目的】为改善现有关键词提取方法中注意力范围有限、语义表征能力不足以及生成能力受限等问题,提出一种集成大语言模型与多特征网络的专利关键词提取方法(LLM-PKE)。【方法】LLM-PKE方法由三个模块组成。在抽取式关键词提取模块中,通... 【目的】为改善现有关键词提取方法中注意力范围有限、语义表征能力不足以及生成能力受限等问题,提出一种集成大语言模型与多特征网络的专利关键词提取方法(LLM-PKE)。【方法】LLM-PKE方法由三个模块组成。在抽取式关键词提取模块中,通过将主题信息融入Transformer注意力网络,并结合图卷积网络,以提高模型对主题词的敏感度以及对文本特征的提取能力,从而有效抽取关键词。在生成式关键词提取模块中,基于大语言模型生成与专利文本高度相关的关键词。在关键词排序模块中,利用大语言模型为每个关键词生成相似度得分,剔除同义词和相关性较低的词汇,最终获得专利关键词。【结果】相比最优的对比方法,所提方法在F1@5评价指标上提升1.98个百分点。【局限】通过设定阈值进行语义相似度匹配,以去除高相似度关键词。然而,由于不同专利文本中相似性标准的差异性,这种方法的准确性和泛用性可能受到一定限制。【结论】LLM-PKE方法在专利数据集上较现有方法具有更好的抽取效果。 展开更多
关键词 专利关键词提取 主题信息 图卷积网络 大语言模型
原文传递
Building potential patent portfolios: An integrated approach based on topic identification and correlation analysis
19
作者 Xian ZHANG Haiyun XU +2 位作者 Shu FANG Zhengyin HU Shuying LI 《Chinese Journal of Library and Information Science》 2015年第2期39-51,共13页
Purpose: This paper suggests a framework to identify important patents for building potential patent portfolios based on patents owned by different assignees so as to highlight the value of individual patents in tech... Purpose: This paper suggests a framework to identify important patents for building potential patent portfolios based on patents owned by different assignees so as to highlight the value of individual patents in technology transfer and identify potential collaborators for patent assignees. Design/methodology/approach: The analysis framework includes the following steps: l) co-classification analysis based on the International Patent Classification (IPC) codes and Derwent Manual Codes (DMC) to detect sub-tech fields, 2) keyword co-occurrence analysis aiming to understand the core technology information in each patent, and 3) social network analysis used for identifying important technologies and partnerships of key assignees. A case study was conducted with 27,401 chemistry patents filed by a Chinese national research institute. Findings: The results show that this framework is effective in building potential technological patent portfolios based on patents owned by different assignees and identifying future collaborators for the assignees. This integrated approach based on topic identification and correlation analysis that combines network-based analysis with keyword-based analysis can reveal important patented technologies and their connections and help understand detailed technological information mentioned in patents. Research limitations: In keywords analysis, only titles and abstracts of patent documents were used and weights of keywords in different parts of the documents were not considered.Practical implications: The analysis framework provides valuable information for decision- makers of large institutions which have many patents with broad application prospects. Originality/value: Different from previous patent portfolio studies based on the use of a combination of patent analysis indicators, this study provides insights into a method of building patent portfolios to discover the potential of individual patents in technology transfer and promote cooperation among different patent assignees. 展开更多
关键词 Patent portfolio Patent cooperation topic identification Correlation analysis Social network analysis (SNA)
原文传递
基于技术距离测度的产业高价值专利识别研究
20
作者 冉从敬 蒋云龙 +2 位作者 李旺 贾志轩 程凡 《情报学报》 北大核心 2025年第12期1503-1522,共20页
高价值专利识别是抢占产业全球战略高地、推动产业持续高效健康发展的重要课题,可为产业关键核心技术的挖掘提供重要线索。本文从专利技术距离测度视角出发,在进行主题聚类提取领域上位类主题基础上,提出一种基于主题知识贡献距离与主... 高价值专利识别是抢占产业全球战略高地、推动产业持续高效健康发展的重要课题,可为产业关键核心技术的挖掘提供重要线索。本文从专利技术距离测度视角出发,在进行主题聚类提取领域上位类主题基础上,提出一种基于主题知识贡献距离与主题联系程度双维影响下的高价值专利识别方法。在主题知识贡献距离维度上,构建专利间分层专利引用网络,计算各专利与主题的持续知识贡献值,基于知识贡献时间序列计算主题间的动态时间规整(dynamic time warping,DTW)距离,形成主题知识贡献距离矩阵;在主题联系程度维度上,构建主题与专利二分图网络,结合专利共现频率与引用关系强度进行初始强度与全局逻辑计算,形成主题联系程度矩阵。融合双维度矩阵构建专利技术距离矩阵,基于技术距离矩阵进行各专利的绝对技术距离计算,选取阈值范围内的高绝对技术距离专利作为领域内高技术价值的专利。经验证数据集检验,本文方法的精准率达到0.8218,F1指标达到0.8014。基于此,对“生成式人工智能”领域专利进行实证,识别出产业内具有较高价值的专利1437件,并发现识别出的高价值专利集具有较高的转让比例,转让比例达58.59%。本文基于技术本质的视角对专利间的技术差距进行量化,打破了以往仅从外部特征或简单统计数据判断专利价值的局限性,提升了识别的准确性;同时,提出双维度的技术距离影响机理,进一步提升了识别的可解释性。 展开更多
关键词 高价值专利识别 技术距离 主题聚类 专利引用网络 二分图网络
在线阅读 下载PDF
上一页 1 2 38 下一页 到第
使用帮助 返回顶部