期刊文献+
共找到208篇文章
< 1 2 11 >
每页显示 20 50 100
基于BERTopic的高等教育生成式人工智能研究主题识别与内容分析
1
作者 韩丽 许洁 罗晓兰 《大学图书情报学刊》 2026年第2期72-79,共8页
生成式人工智能正深刻变革教育,相关研究文献不断涌现。文章通过收集知网、Scopus和Web of Science中与研究主题相关的中英文文献,利用BERTopic主题建模技术对文献进行主题聚类,挖掘国内外高等教育中生成式人工智能的研究主题,分析研究... 生成式人工智能正深刻变革教育,相关研究文献不断涌现。文章通过收集知网、Scopus和Web of Science中与研究主题相关的中英文文献,利用BERTopic主题建模技术对文献进行主题聚类,挖掘国内外高等教育中生成式人工智能的研究主题,分析研究现状,为教育领域的教学实践和学术研究提供参考。研究结果表明:在个性化学习与人机协同方面,生成式人工智能通过制定个性化学习路径显著提升教学效果;师生对生成式人工智能的接受程度受技术认知和使用体验等因素制约,并直接影响应用成效;教育创新需平衡技术赋能与过度依赖问题;教学设计与课程实践的革新更多体现在教学模式和资源生成方式上,但必须同步构建学术伦理防护与治理机制;人工智能时代亟须人才培养结构的优化升级,要求教育者重新定义核心能力目标。 展开更多
关键词 BERtopic 高等教育 生成式人工智能 研究主题识别 内容分析
在线阅读 下载PDF
基于BERTopic模型的国内政府数据开放研究主题挖掘及内容分析 被引量:2
2
作者 程越欣 杨峰 郭剑明 《图书馆学研究》 北大核心 2025年第5期26-37,65,共13页
目前,政府数据开放已成为加速数字经济发展、推进数字政府建设与促进数字社会转型的重要驱动力。近年来,中国业界和学界对政府数据开放研究议题投入了较高的关注度与研究热情。现阶段亟需对该领域的研究进行系统梳理,以回应数智时代对... 目前,政府数据开放已成为加速数字经济发展、推进数字政府建设与促进数字社会转型的重要驱动力。近年来,中国业界和学界对政府数据开放研究议题投入了较高的关注度与研究热情。现阶段亟需对该领域的研究进行系统梳理,以回应数智时代对政府数据开放研究的理论需求,为相关研究和实践工作提供科学参考。以中国知网数据库收录的2010—2024年间1495篇政府数据开放相关文献作为数据来源,基于主题建模方法BERTopic对政府数据开放领域文献进行主题挖掘和内容分析。政府数据开放研究在过去的十余年间发展迅猛,重点关注涵盖了现实路径、价值共创、法制建构、政策战略分析、信息安全和隐私保护、数据开放开发和流通使用、用户行为、平台评价及元数据管理等方向。展望未来路向,需从夯实顶层设计、导入价值理性、借鉴前沿动向及丰富研究视角4个维度入手,促进政府数据开放领域研究的进步与繁荣。 展开更多
关键词 政府数据 数据开放 BERtopic 主题挖掘 内容分析
原文传递
内容主题约束的无监督关键短语提取方法
3
作者 李伍任 黄于欣 《微电子学与计算机》 2026年第3期14-25,共12页
无监督关键短语提取能够自动识别概括文档核心内容与主题的关键短语,在信息检索、文本摘要和主题建模等任务中具有广泛应用。现有无监督方法通常依赖候选短语与文档在高维语义空间中的相似度计算来评估重要性,虽关注短语与文档整体语义... 无监督关键短语提取能够自动识别概括文档核心内容与主题的关键短语,在信息检索、文本摘要和主题建模等任务中具有广泛应用。现有无监督方法通常依赖候选短语与文档在高维语义空间中的相似度计算来评估重要性,虽关注短语与文档整体语义的相关性,却未能充分建模短语与文档主题之间的一致性,导致提取结果的准确性和语义一致性受限。为此,提出了一种结合内容和主题约束的无监督关键短语提取方法。该方法基于T5模型,通过编码器生成的自注意力得分捕捉候选短语与文档内容的关联性,并利用解码器提示模板计算生成概率,以衡量候选短语的语义相关性和主题一致性。通过自注意力机制和提示生成机制的协同作用,模型能够在无监督条件下提取出与文本语义和主题高度契合的关键短语。在SemEval2017、Inspec和SemEval2010公开数据集上的实验结果表明:所提方法在F1分数上显著优于当前主流无监督方法。 展开更多
关键词 关键短语提取 无监督 内容约束 主题约束
在线阅读 下载PDF
基于BERTopic算法的引文主题实证分析——以一篇高被引诺贝尔生理学或医学奖论文为例 被引量:4
4
作者 郭倩影 赵丹群 《情报理论与实践》 CSSCI 北大核心 2024年第10期183-189,182,共8页
[目的/意义]引文主题识别/分析(CTR/CTA)是引文内容分析(CCA)的一项重要研究议题,通过对引文语料中蕴涵主题信息的识别和提取,可望为论文学术贡献评价、知识扩散及演化分析等问题的解决提供新的研究思路。[过程/方法]以一篇高被引诺贝... [目的/意义]引文主题识别/分析(CTR/CTA)是引文内容分析(CCA)的一项重要研究议题,通过对引文语料中蕴涵主题信息的识别和提取,可望为论文学术贡献评价、知识扩散及演化分析等问题的解决提供新的研究思路。[过程/方法]以一篇高被引诺贝尔生理学或医学获奖关键论文为例,采用BERTopic算法对其引文句语料进行主题识别,并对识别出的引文主题展开多个维度的分析与讨论。[结果/结论]对高被引论文开展引文主题识别分析,有助于更全面细致地揭示其学术贡献内容及演化趋势;BERTopic算法能较好识别案例文献的多个引文主题,且不同引文主题的施引文献特征分布不尽相同;对引文主题重要性、演化趋势及其与原文主题差异性的分析,能多维度刻画研究同行对案例文献学术贡献的认识,表明CTR/CTA研究对学术论文评价具有深入探索价值。 展开更多
关键词 BERtopic算法 引文主题识别 引文主题分析 引文内容分析 学术论文评价
原文传递
Quality of compounded topical 2% diltiazem hydrochloride formulations for anal fissure 被引量:1
5
作者 Monil Shah Laura Sandler +2 位作者 Vishwas Rai Charu Sharma Lakshmi Raghavan 《World Journal of Gastroenterology》 SCIE CAS 2013年第34期5645-5650,共6页
AIM:To investigate the quality of topical 2%diltiazem formulations extemporaneously compounded by retail pharmacies openly offering drug-compounding services.METHODS:A participating healthcare professional wrote 12 pr... AIM:To investigate the quality of topical 2%diltiazem formulations extemporaneously compounded by retail pharmacies openly offering drug-compounding services.METHODS:A participating healthcare professional wrote 12 prescriptions for compounded 2%diltiazem cream,with 2 refills allowed per prescription.The 12sets of prescriptions were filled,at intervals of 1-2 wk between refills,at 12 different independent retail pharmacies that openly offer drug-compounding services in a major metropolitan region.The 36 resultant preparations,provided as jars or tubes,were shipped,as soon as each was filled,at ambient temperature to the study core laboratory for high-performance liquid chromatography(HPLC)analysis,within 10 d of receipt.For the HPLC analysis,8 different samples of the topical diltiazem,each approximately 1 g in weight,were taken from prespecified locations within each container.To initiate the HPLC analysis,each sample was transferredto a 100 mL volumetric flask,to which methanol was added.The HPLC analysis was conducted in accordance with the laboratory-validated method for diltiazem in cream,ointment,and gel formulations.The main outcome measures were potency(percentage of label claim)and content uniformity of the compounded topical 2%diltiazem formulations.RESULTS:Of the 36 prescriptions filled,30 were packaged in jars and 6 were packaged as tubes.The prescriptions were specifically for cream formulations,but6 of the 12 pharmacies compounded 2%diltiazem as an ointment;for another pharmacy,which had inadequate labeling,the dosage form was unknown.The United States Pharmacopoeia(USP)standard for potency is 90%-115%of label claim.Of the 36 preparations,5(13.89%)were suprapotent and 13(36.11%)were subpotent.The suprapotent prescriptions ranged in potency from 117.2%to 128.5%of label claim,and the subpotent prescriptions ranged in potency from34.8%to 89.8%of label claim.Fourteen(38.9%)preparations lacked content uniformity according to the USP standard of 90%-110%potency and<6%relative standard deviation.Of the 30 formulations packaged in jars,12(40%)lacked content uniformity,while of the6 formulations packaged in tubes,2(33.3%)lacked content uniformity.Nine of the 12 pharmacies(75%)failed USP potency or content-uniformity specifications for at least 1 of the 3 prescription fills.For 5 of the 12pharmacies(41.7%),the mean potency across all three prescription fills was<90%of label claim.CONCLUSION:Patients prescribed topical 2%diltiazem for treatment of anal fissure frequently receive compounded formulations that are misbranded with respect to potency and that lack content uniformity. 展开更多
关键词 ANAL FISSURE Pharmacy COMPOUNDING topicAL DILTIAZEM Formulation POTENCY content uniformity
暂未订购
“强度-内容”视域下我国公共数字文化政策主题演化研究
6
作者 侯艳辉 赵文静 王家坤 《山东科技大学学报(社会科学版)》 2025年第4期81-92,共12页
为分析我国公共数字文化政策主题分布及其演化路径,有效揭示政策主题变迁趋势,把握政策主题演化深层机制,为政策制定与应用提供理论支持。收集我国公共数字文化政策文本,运用LDA模型识别政策文本主题及其关键词;构建融合多特征的主题强... 为分析我国公共数字文化政策主题分布及其演化路径,有效揭示政策主题变迁趋势,把握政策主题演化深层机制,为政策制定与应用提供理论支持。收集我国公共数字文化政策文本,运用LDA模型识别政策文本主题及其关键词;构建融合多特征的主题强度表征模型,分析主题强度演化情况;利用Word2Vec模型获取主题关键词最相似词集合,分析主题内容演化情况。研究发现,我国公共数字文化政策主要有三大惠民工程建设、均等化配置、建设与保障管理和数字文化产业发展四大主题,主题演化呈现阶段性变化、科学技术驱动、聚焦发展问题等特点。基于主题演化分析结果,未来公共数字文化建设应紧密围绕国家战略导向,加强科技创新与人才培养;积极响应公众数字文化需求,促进共建共享合作模式;聚焦发展问题与矛盾,缩小不同区域与群体间发展差距。 展开更多
关键词 公共数字文化 主题强度 多特征融合 主题内容 主题演化
在线阅读 下载PDF
从本土神话到全球共享:《黑神话:悟空》的跨文化传播策略研究 被引量:2
7
作者 檀思源 黄雨茜 《北京印刷学院学报》 2025年第7期9-16,49,共9页
电子游戏经历了从娱乐工具到文化传播媒介的演变,成为具有独立“世界体系”的文化载体。《黑神话:悟空》的全球爆红为中国文化“走出去”提供了研究范本。本文基于文化杂糅理论,构建“故事—场景—互动”的三维框架,结合Steam平台玩家... 电子游戏经历了从娱乐工具到文化传播媒介的演变,成为具有独立“世界体系”的文化载体。《黑神话:悟空》的全球爆红为中国文化“走出去”提供了研究范本。本文基于文化杂糅理论,构建“故事—场景—互动”的三维框架,结合Steam平台玩家评论数据,分析其跨文化传播策略及效果。研究发现:在故事层面,通过塑造具有世界共通符号的游戏角色,采用调和型外译策略制造“文化诱饵”,以陌生化改编推动中国神话的“世界化”;在场景层面,借力前沿视听技术,构建中西杂糅式游戏环境,促进文化知识与观念的立体化传播;在互动层面,将《西游记》特色武器动作嵌入西方“魂系”机制,实现文化元素的动态展演。LDA模型与高频词云显示,《黑神话:悟空》成功打破海外对中国游戏的刻板认知,引发“西游热”与“东方热”。但也存在世界机制不完善、互动模式单一等问题。建议游戏开发者通过完善世界机制、创新互动模式提升游戏的可探索性,强化跨文化传播效能。 展开更多
关键词 电子游戏 跨文化传播 《黑神话:悟空》 LDA主题模型 内容分析
在线阅读 下载PDF
地理学中文科技期刊虚拟专题发展情况与优化策略研究
8
作者 郭亿华 《出版与印刷》 2025年第2期36-44,共9页
调查地理学科技期刊虚拟专题发展情况,以促进中国科技期刊虚拟专题的高质量发展。文章以《中文核心期刊要目总览(2023年版)》收录的20种地理学中文核心科技期刊为研究对象,采用网络信息搜索法调研其虚拟专题组织情况,调研内容主要包括... 调查地理学科技期刊虚拟专题发展情况,以促进中国科技期刊虚拟专题的高质量发展。文章以《中文核心期刊要目总览(2023年版)》收录的20种地理学中文核心科技期刊为研究对象,采用网络信息搜索法调研其虚拟专题组织情况,调研内容主要包括虚拟专题的发布数量、发布时间、选题方向、收录论文数量、收录周期、提供信息内容、传播形式及渠道、阅读量等。研究发现,地理学中文核心科技期刊虚拟专题的开展率不高,存在发布较为零散、组织策划视角有所局限、主题聚焦度不足、文章择优意识有待加强、呈现形式单一、推广渠道不够丰富等问题。提出地理学中文科技期刊虚拟专题优化策略:基于期刊文献资源和用户需求制订推送计划,采用多样化的组织策划视角,优选文章以提高虚拟专题学术质量,注重内容加工以形成虚拟专题知识脉络,借助融媒体技术创新呈现形式,多平台发布以扩大学术影响力。 展开更多
关键词 科技期刊 虚拟专题 内容加工 推广渠道 组织策划 地理学
在线阅读 下载PDF
《湖北省领导工作用图》设计特色
9
作者 曾芳 张若星 李巧霞 《地理空间信息》 2025年第9期111-114,共4页
围绕领导宏观决策需求,如何通过地图多维创新设计,挖掘领导工作用图在重大战略解读、生态文明成果展示、区域规划布局呈现、社会经济综合反映等方面的作用,使其更有效地服务于政府管理,值得从业者深入探讨和研究。结合《湖北省领导工作... 围绕领导宏观决策需求,如何通过地图多维创新设计,挖掘领导工作用图在重大战略解读、生态文明成果展示、区域规划布局呈现、社会经济综合反映等方面的作用,使其更有效地服务于政府管理,值得从业者深入探讨和研究。结合《湖北省领导工作用图》编制实践,介绍了图册的主题与定位、设计思路与原则,重点分析了图组设计、热点专题设计、专题内容选取与编排、专题表达设计、美术设计等方面的设计特色,旨在为同类图册的编制设计提供参考和借鉴。 展开更多
关键词 领导工作用图 专题内容设计 图组设计 热点专题设计 专题表达设计 美术设计
在线阅读 下载PDF
面向城市形象治理的多平台UGC主题情感分析研究
10
作者 雷一鸣 路翀 《电脑与信息技术》 2025年第6期96-103,共8页
为满足城市形象治理的计算化需求,构建面向多平台用户生成内容(user-generated content,UGC)的分析流程,以微博、马蜂窝等多平台游记为数据源,采用BERTopic、SnowNLP构建“主题-情感”融合对比框架。研究发现,洛阳与西安的城市形象收敛... 为满足城市形象治理的计算化需求,构建面向多平台用户生成内容(user-generated content,UGC)的分析流程,以微博、马蜂窝等多平台游记为数据源,采用BERTopic、SnowNLP构建“主题-情感”融合对比框架。研究发现,洛阳与西安的城市形象收敛于历史遗迹、古城民俗、特色美食、旅游服务与自然生态5个核心维度,情感分布中洛阳在历史与自然相关主题的正向占比更高,西安在服务与餐饮维度的消极反馈更突出。基于用户消极反馈,提出针对性的治理策略,所构建流程可为城市品牌监测与文旅治理提供轻量化技术路径。 展开更多
关键词 用户生成内容 主题建模 情感分析 数据治理
在线阅读 下载PDF
基于线上线下混合式教学的“空气动力学”课程建设探讨
11
作者 潘乐飞 安效民 +1 位作者 王顺宏 赵久奋 《教育教学论坛》 2025年第18期77-80,共4页
以“空气动力学”课程建设为例,研究了线上线下混合式教学的建设思路与方法、教学实施等。结合火箭军工程大学火力指挥与控制工程专业人才培养方案及教学大纲要求,对“空气动力学”课程的教学目标进行了精准定位;充分利用现代丰富的网... 以“空气动力学”课程建设为例,研究了线上线下混合式教学的建设思路与方法、教学实施等。结合火箭军工程大学火力指挥与控制工程专业人才培养方案及教学大纲要求,对“空气动力学”课程的教学目标进行了精准定位;充分利用现代丰富的网络信息资源,对教学内容进行优化分解,设计了以线下讲授公式推导与机理探究为主,以线上自学基本概念、应用实例为辅的混合式教学;为满足不同本科专业和任职培训教学需求,设计完成了教学案例库及多个教学专题。教学实践证明,混合式教学能够有效提高专业课程的教学效果,对高校课程建设改革具有重要意义。 展开更多
关键词 空气动力学 混合式教学 教学内容优化分解 教学案例库 教学专题
在线阅读 下载PDF
跨文化视角下的中医话语差异:基于微博与X社交平台的主题建模与情感分析
12
作者 陈梦 郭卓 《教育传媒研究》 2025年第5期28-36,共9页
本文采用主题建模(LDA)和情感分析方法,对2019年12月和2020年5月期间微博和X平台的106420条中医相关帖子进行对比分析。研究发现,国内微博平台主要呈现生活化传播特征,内容集中于养生知识、文化传承等实用议题,反映了中医在本土健康管... 本文采用主题建模(LDA)和情感分析方法,对2019年12月和2020年5月期间微博和X平台的106420条中医相关帖子进行对比分析。研究发现,国内微博平台主要呈现生活化传播特征,内容集中于养生知识、文化传承等实用议题,反映了中医在本土健康管理中的深度渗透;而X平台则更关注中医的国际合作与科学验证,体现出全球受众对传统医学现代化转型的期待。情感分析表明,微博以中性讨论为主,内容相对理性;X平台则因涉及文化比较等敏感议题,负面情绪更为突出。研究揭示了中医传播的双重挑战:对内需要强化生活化表达以增强公众认同,对外则需要平衡科学话语与文化阐释以提升国际接受度。基于此,本文建议采取差异化传播策略,兼顾本土实践与国际对话,为中医文化的全球推广提供理论参考与实践指导。 展开更多
关键词 中医 社交媒体平台 用户生成内容 主题建模 情感分析
原文传递
基于LDA模型的主题演化分析:以情报学文献为例 被引量:27
13
作者 朱茂然 王奕磊 +2 位作者 高松 王洪伟 张晓鹏 《北京工业大学学报》 CAS CSCD 北大核心 2018年第7期1047-1053,共7页
为了掌握科研动态和追踪研究热点,需要挖掘文献中的主题及其变化规律,因此,提出了一种基于隐性狄利克雷分布(latent Dirichlet allocation,LDA)的主题演化分析模型.首先,在整个文本集合上使用LDA模型识别主题及其关键词,并计算每个时间... 为了掌握科研动态和追踪研究热点,需要挖掘文献中的主题及其变化规律,因此,提出了一种基于隐性狄利克雷分布(latent Dirichlet allocation,LDA)的主题演化分析模型.首先,在整个文本集合上使用LDA模型识别主题及其关键词,并计算每个时间窗口中文档-主题概率分布;然后,对各个时间窗口下的文本集合分别使用LDA模型计算出主题-词汇概率分布,并计算不同时间窗口下不同主题的相似度,从而得出主题强度的演化趋势;最后,通过相似主题下的词汇的概率分布得到主题内容的变化.可观察到中文情报学领域,"语义分析"等主题的关注度具有持续上升的趋势. 展开更多
关键词 主题演化 主题强度 主题内容 隐性狄利克雷分布
在线阅读 下载PDF
教师教学能力系统构成及水平层级模型研究 被引量:37
14
作者 王磊 魏艳玲 +7 位作者 胡久华 支瑶 黄燕宁 陈颖 尹博远 李艳梅 罗滨 郑长龙 《教师教育研究》 CSSCI 北大核心 2018年第6期16-24,共9页
教学活动是教师工作的中心,教师应对教学活动所必备的教学能力是衡量教师专业素养的核心。本研究针对学科教师培训针对性不强、内容泛化、方式单一、质量监控薄弱等突出问题,采用自上而下与自下而下相结合的方式,基于教师教学任务及实... 教学活动是教师工作的中心,教师应对教学活动所必备的教学能力是衡量教师专业素养的核心。本研究针对学科教师培训针对性不强、内容泛化、方式单一、质量监控薄弱等突出问题,采用自上而下与自下而下相结合的方式,基于教师教学任务及实践工作需要构建包括一级、二级、三级指标体系的教学能力系统,并建立了教学能力水平分级模型。研究认为,对三级维度的教学能力指标进行1-4级分水平描述,对分层递进系统设计与实施教师学科教学能力培训、实时监控培训质量具有重要的指导意义。 展开更多
关键词 教学能力系统 内容主题 层级模型
原文传递
基于内容分析的话题检测研究 被引量:20
15
作者 赵华 赵铁军 +1 位作者 张姝 王浩畅 《哈尔滨工业大学学报》 EI CAS CSCD 北大核心 2006年第10期1740-1743,共4页
通过分析大量的英文报道的特点,针对目前话题检测研究中存在的难以区分两次不同的火车事故或爆炸事件的问题提出了基于内容分析的话题检测算法.该算法以S ingle-Pass聚类策略为基础,通过内容分析将话题表示成两个中心向量:标识中心向量... 通过分析大量的英文报道的特点,针对目前话题检测研究中存在的难以区分两次不同的火车事故或爆炸事件的问题提出了基于内容分析的话题检测算法.该算法以S ingle-Pass聚类策略为基础,通过内容分析将话题表示成两个中心向量:标识中心向量及内容中心向量.实验证明基于内容分析的话题检测算法不但简单易行,而且对于解决上述的“难以区分”问题非常有效. 展开更多
关键词 话题检测 内容分析 错误检测开销 标识词 内容词
在线阅读 下载PDF
2007-2012年精神卫生大众媒体报道分析 被引量:9
16
作者 杜鹃 孟宪鹏 +2 位作者 宋军 魏怡真 黄月明 《中国心理卫生杂志》 CSSCI CSCD 北大核心 2013年第10期723-728,共6页
目的:对部分大众平面媒体有关精神卫生的报道进行回顾性内容分析,为大众传媒开展精神卫生宣传报道提供参考。方法:通过关键词的检索,收集2007-2012年间6家大众媒体上的精神卫生相关报道共605篇,采用内容分析方法对报道的主题和类型等进... 目的:对部分大众平面媒体有关精神卫生的报道进行回顾性内容分析,为大众传媒开展精神卫生宣传报道提供参考。方法:通过关键词的检索,收集2007-2012年间6家大众媒体上的精神卫生相关报道共605篇,采用内容分析方法对报道的主题和类型等进行定量编码分析。结果:6年间精神卫生相关报道的数量逐年增加,一年之中精神卫生报道集中在10月份。报道主题以医疗信息为多(171篇,占28.3%);报道类型主要是消息(占50.5%);信息主要来源于医学专业人员(占65.6%);媒体主要关注的精神障碍是抑郁症(占11.1%)。结论:现阶段精神卫生报道存在短期化、表面化、事件化等问题,建议强化媒体职业健康素养,健全行业规范和行业监督。 展开更多
关键词 精神卫生 大众媒体 主题报道 内容分析 回顾分析
暂未订购
精品课程研究主题衍变及其对精品资源共享课建设的启示 被引量:34
17
作者 王娟 孔亮 《现代教育技术》 CSSCI 2013年第8期95-99,共5页
以"开放和共享"为核心理念的精品课程受到了众多专家、学者的广泛关注。研究采用内容分析法,从研究主题对精品课程的文献进行了比较分析。研究发现:当下精品课程研究的重心已转向精品资源共享课的建设、应用和评估。研究提出... 以"开放和共享"为核心理念的精品课程受到了众多专家、学者的广泛关注。研究采用内容分析法,从研究主题对精品课程的文献进行了比较分析。研究发现:当下精品课程研究的重心已转向精品资源共享课的建设、应用和评估。研究提出了精品资源共享课建设应遵循"精品、开放、共享"的原则,应秉承"文化资产"的建设理念,侧重信息共享、提高教学有效性,注重统一规划,注重宣传推广,完善共享机制等。 展开更多
关键词 精品课程 精品资源共享课 研究主题 内容分析
在线阅读 下载PDF
一种基于文章主题和内容的自动摘要方法 被引量:12
18
作者 陈燕敏 王晓龙 +1 位作者 刘远超 楼喜中 《计算机工程与应用》 CSCD 北大核心 2004年第33期11-14,共4页
文章介绍了一种新的使用自然语言处理技术的自动系统。通过融合基于内容的方法和基于主题的方法,将主题与内容相结合,生成具有良好连贯性和流畅性的。该方法首先对主题词进行分析,动态地处理具有抽象标题和具体标题的文档;然后采用词汇... 文章介绍了一种新的使用自然语言处理技术的自动系统。通过融合基于内容的方法和基于主题的方法,将主题与内容相结合,生成具有良好连贯性和流畅性的。该方法首先对主题词进行分析,动态地处理具有抽象标题和具体标题的文档;然后采用词汇、语法、语义分析等自然语言处理技术,对文章的文本内容进行深入分析;再根据线性加权融合两种分析得到的结果,生成;最后采用指代消解技术使生成的更连贯流畅。与仅基于内容的自动文摘系统相比较,评测结果显示,该系统生成的质量有明显提高。 展开更多
关键词 自动文摘 自然语言处理 主题分析 内容分析 融合
在线阅读 下载PDF
基于LDA主题模型的专利内容分析方法 被引量:58
19
作者 王博 刘盛博 +1 位作者 丁堃 刘则渊 《科研管理》 CSSCI 北大核心 2015年第3期111-117,共7页
主题模型是一种有效提取大规模文本隐含主题的建模方法。本文将Latent Dirichlet Allocation(LDA)主题模型引入专利内容分析领域,实现专利主题划分,解决以往专利主题分类过于粗泛、时效性差、缺乏科学性等问题。并在原有模型基础上构建... 主题模型是一种有效提取大规模文本隐含主题的建模方法。本文将Latent Dirichlet Allocation(LDA)主题模型引入专利内容分析领域,实现专利主题划分,解决以往专利主题分类过于粗泛、时效性差、缺乏科学性等问题。并在原有模型基础上构建LDA机构-主题模型,对专利知识主体和客体联合建模,实现专利主题和机构之间内在关系分析。最后,以通信产业LTE技术领域为例,验证该模型可以有效用于专利主题划分,实现各主题下专利知识主体竞争态势测度。 展开更多
关键词 主题模型(LDA) LDA机构-主题模型 专利内容分析 LTE
原文传递
基于分块的网页主题信息自动提取算法 被引量:6
20
作者 殷贤亮 李猛 《华中科技大学学报(自然科学版)》 EI CAS CSCD 北大核心 2007年第10期39-41,共3页
对互联网上大量存在的基于模板的网页,根据其半结构化的特点,提出了一种网页分块和主题信息自动提取算法.该算法利用网页标记对网页进行分块,改进了传统的文本特征选择方法,把网页块表示成特征向量,并根据有序标记集识别主题内容块.用... 对互联网上大量存在的基于模板的网页,根据其半结构化的特点,提出了一种网页分块和主题信息自动提取算法.该算法利用网页标记对网页进行分块,改进了传统的文本特征选择方法,把网页块表示成特征向量,并根据有序标记集识别主题内容块.用该算法改进了网页分类的预处理过程,提高了分类的速度和准确性.实验表明,对网页进行主题信息提取后再进行分类,可以提高分类系统的查全率和查准率. 展开更多
关键词 网页分块 主题信息 自动提取 特征选择 网页分类
在线阅读 下载PDF
上一页 1 2 11 下一页 到第
使用帮助 返回顶部