期刊文献+
共找到30篇文章
< 1 2 >
每页显示 20 50 100
内容主题约束的无监督关键短语提取方法
1
作者 李伍任 黄于欣 《微电子学与计算机》 2026年第3期14-25,共12页
无监督关键短语提取能够自动识别概括文档核心内容与主题的关键短语,在信息检索、文本摘要和主题建模等任务中具有广泛应用。现有无监督方法通常依赖候选短语与文档在高维语义空间中的相似度计算来评估重要性,虽关注短语与文档整体语义... 无监督关键短语提取能够自动识别概括文档核心内容与主题的关键短语,在信息检索、文本摘要和主题建模等任务中具有广泛应用。现有无监督方法通常依赖候选短语与文档在高维语义空间中的相似度计算来评估重要性,虽关注短语与文档整体语义的相关性,却未能充分建模短语与文档主题之间的一致性,导致提取结果的准确性和语义一致性受限。为此,提出了一种结合内容和主题约束的无监督关键短语提取方法。该方法基于T5模型,通过编码器生成的自注意力得分捕捉候选短语与文档内容的关联性,并利用解码器提示模板计算生成概率,以衡量候选短语的语义相关性和主题一致性。通过自注意力机制和提示生成机制的协同作用,模型能够在无监督条件下提取出与文本语义和主题高度契合的关键短语。在SemEval2017、Inspec和SemEval2010公开数据集上的实验结果表明:所提方法在F1分数上显著优于当前主流无监督方法。 展开更多
关键词 关键短语提取 无监督 内容约束 主题约束
在线阅读 下载PDF
基于语义相似和变分自编码器的非负矩阵分解主题模型
2
作者 徐洋 张月义 +1 位作者 周涵婷 胡静 《现代电子技术》 北大核心 2025年第24期113-120,共8页
为解决传统NMF主题模型难以处理短文本数据稀疏性,以及随机初始化导致聚类结果不稳定的问题,提出一种基于语义相似和变分自编码器的非负矩阵分解主题模型(VSNMF)。该模型在传统的NMF基础上引入单词共现和文本相似度的正则化约束,保证因... 为解决传统NMF主题模型难以处理短文本数据稀疏性,以及随机初始化导致聚类结果不稳定的问题,提出一种基于语义相似和变分自编码器的非负矩阵分解主题模型(VSNMF)。该模型在传统的NMF基础上引入单词共现和文本相似度的正则化约束,保证因子矩阵的近似正交性,从而缓解数据稀疏性的缺点,使模型适应不同长度的文本数据集。同时,利用变分自编码器(VAE)初始化因子矩阵,将编码器最后一层输出的直接作为因子矩阵,以增强模型的收敛性和稳定性。在4个不同长度的文本数据集上,将所提出的VSNMF模型与其他模型进行对比,得出该模型优于对比模型,在BBCNews、BBCsport、AGNews、Snippets数据集上的聚类准确率(ACC)分别为94.3%、96.1%、81.5%、93.8%;基于VAE的初始化方法具有良好的收敛性和稳定性,模型分别经过30、40、40、40次的迭代就已经收敛,聚类准确率的标准差分别为0.3、0.0、1.0、0.0。实验结果表明,VSNMF模型对不同长度的文本数据集具有良好适应性和泛化能力,VAE的初始化方法加快了模型的收敛性,提高了聚类的稳定性。 展开更多
关键词 主题模型 非负矩阵分解 变分自编码器 文本相似度 正则化约束 因子矩阵
在线阅读 下载PDF
时序化LDA的舆情文本动态主题提取 被引量:3
3
作者 万红新 彭云 郑睿颖 《计算机与现代化》 2016年第7期91-94,共4页
随着互联网的发展,网络上产生了大量的舆情文本,提取这些文本的主题可以获取舆情的话题热点和演化趋势。由于舆情文本数据量巨大,并且主题具有随时间动态变化的特点,提出一种加入时间约束先验的LDA主题模型TC-LDA(Time Constrained LDA)... 随着互联网的发展,网络上产生了大量的舆情文本,提取这些文本的主题可以获取舆情的话题热点和演化趋势。由于舆情文本数据量巨大,并且主题具有随时间动态变化的特点,提出一种加入时间约束先验的LDA主题模型TC-LDA(Time Constrained LDA)。TC-LDA可以将文本数据转化为主题向量,大大降低了文本表示的维度,同时加入时间约束知识后实现了LDA的时序化转换,可以提高LDA捕捉动态主题的能力。实验结果表明,TC-LDA在主题词提取的准确率和召回率上与同类主题模型比较,具有更好的效果。 展开更多
关键词 LDA 主题模型 时间约束 主题词
在线阅读 下载PDF
大学生英语写作中评判性思维能力研究 被引量:58
4
作者 刘东虹 《外语教学》 北大核心 2005年第2期46-51,共6页
本文研究任务复杂度是否影响大学生写作实践中的评判性思维。结果显示 ,任务复杂度对受试质疑权威有一定的影响 ;在宽松的时间条件下 ,对于熟悉的话题受试的思想创新程度最高 ;任务复杂度对评判性思维技巧的总体运用没有显著影响。
关键词 评判性思维 话题熟悉度 时间条件
在线阅读 下载PDF
汉语话题结构及其优选分析 被引量:1
5
作者 张孝荣 《安徽师范大学学报(社会科学版)》 CSSCI 北大核心 2009年第3期328-332,共5页
从生成语法的角度分析汉语话题结构会出现移位说与基础生成说、主目语移位与非主目语移位、以及宾语前置句中前置宾语的话题性质与焦点性质这三大矛盾。从优选论的理论出发可以得出汉语中的话题结构都是PROM》SUBJ》NEW这一制约条件等... 从生成语法的角度分析汉语话题结构会出现移位说与基础生成说、主目语移位与非主目语移位、以及宾语前置句中前置宾语的话题性质与焦点性质这三大矛盾。从优选论的理论出发可以得出汉语中的话题结构都是PROM》SUBJ》NEW这一制约条件等级排列制约的结果。宾语前置结构中前置宾语的生成可以通过最短移位ShM这一制约条件加以筛选得出。 展开更多
关键词 话题 优选 制约条件 宾语前置
在线阅读 下载PDF
汉语介词话题标记研究 被引量:1
6
作者 王建国 《江西财经大学学报》 CSSCI 北大核心 2009年第2期72-74,79,共4页
本文描写了汉语介词话题标记类型,并对各种类型进行了对比研究。本文还指出了各种介词话题标记的功能与使用制约因素,描写了各种介词话题标记在使用上出现的频率差异并对出现这种差异的原因做了解释。
关键词 汉语介词话题标记 使用制约 使用频率
在线阅读 下载PDF
汉语话题化结构限制的构式语法新解 被引量:4
7
作者 贾光茂 《汉语学习》 CSSCI 北大核心 2017年第5期20-28,共9页
话题化结构限制在生成语法中一直未能得到令人满意的解释。信息结构假设(BCI)认为提取难度与提取所在构式的背景化程度或认知激活程度有关。汉语中的复杂名词短语、属格语位于句首位置时,容易成为关注焦点,因此这些构式中的成分比较容... 话题化结构限制在生成语法中一直未能得到令人满意的解释。信息结构假设(BCI)认为提取难度与提取所在构式的背景化程度或认知激活程度有关。汉语中的复杂名词短语、属格语位于句首位置时,容易成为关注焦点,因此这些构式中的成分比较容易提取,从而形成所谓主宾不对称现象。双宾构式、及物性构式中宾语能否话题化由事件参与者在语言加工者认知中的激活程度来决定,而认知激活程度又由动词词汇义和构式义共同决定。汉语话题结构中的提取限制主要由构式的信息结构特征决定。 展开更多
关键词 话题化 提取 信息结构 移位限制
原文传递
汉语双主语句的最简句法研究 被引量:2
8
作者 马志刚 田启林 《外语学刊》 CSSCI 北大核心 2018年第4期41-48,共8页
基于语段理论和左向分支限制,本文从语义蕴涵、句法结构和语用意图3方面对“这棵树叶子大”与“这棵树的叶子大”这两类句式的辨析表明:前者为话题--焦点句,因凸显焦点义,其CP分解为独立的话题投射(Top P)和焦点投射(Foc P);... 基于语段理论和左向分支限制,本文从语义蕴涵、句法结构和语用意图3方面对“这棵树叶子大”与“这棵树的叶子大”这两类句式的辨析表明:前者为话题--焦点句,因凸显焦点义,其CP分解为独立的话题投射(Top P)和焦点投射(Foc P);而后者则为单主语句,因表达陈述义,保持其陈述性CP不被分解,因此补语成分“这棵树的叶子”只能整体移至TP的标示语位置作主语。遵循最简句法的推导机制,本文基于实证语料分析既揭示两类汉语句式在信息结构方面的差异,同时也说明二者均可在最简机制中生成;同时还指出,英语句子必备主语的类型学特征以及其领属关系必须实现为显性形式的特点决定英语中不可能存在类似于“这棵树叶子大”这样的句式。 展开更多
关键词 最简方案 语段理论 左向分支限制 双主句 话题 焦点
原文传递
汉英话题标记使用的制约因素对比研究
9
作者 王建国 邵志洪 吴碧宇 《山东外语教学》 北大核心 2014年第1期28-35,共8页
本文从对比的角度对汉英各种话题标记在使用中所受到的句法、语义、语用和话语等方面的制约进行了研究,并讨论了汉英话题形式对选择话题标记的影响。本文的主要发现是:不同类型的汉英话题标记各自在句法、语义、语用或话语功能上受到了... 本文从对比的角度对汉英各种话题标记在使用中所受到的句法、语义、语用和话语等方面的制约进行了研究,并讨论了汉英话题形式对选择话题标记的影响。本文的主要发现是:不同类型的汉英话题标记各自在句法、语义、语用或话语功能上受到了不同的制约;多数汉英相同类型的话题标记在使用中受到了类似的制约;在句法上,汉语和英语的各种类型的话题标记在使用中都受到了制约,且其制约强度在各自语言中都呈现出从大到小的趋势;总体而言,在语义和句法上,汉语话题标记的使用要比英语话题标记的使用所受到的制约小,但在语用上,汉语话题标记要比英语话题标记所受到的制约大,这些说明了两种语言在类型上存在的差异。 展开更多
关键词 汉英话题标记 使用制约 对比研究
在线阅读 下载PDF
违反复杂名词短语限制的语义条件及其语用解释 被引量:1
10
作者 寇鑫 袁毓林 《汉语学报》 CSSCI 北大核心 2019年第2期18-30,95,共14页
复杂名词短语限制(complex noun phrase constraint,CNPC)指关系小句中的名词性成分不能从小句中提取出来作为主句话题。汉语中一些包含关系结构的句子可以违反这一限制。文章首先依据关系化类型和关系结构在主句中的句法位置,讨论违反C... 复杂名词短语限制(complex noun phrase constraint,CNPC)指关系小句中的名词性成分不能从小句中提取出来作为主句话题。汉语中一些包含关系结构的句子可以违反这一限制。文章首先依据关系化类型和关系结构在主句中的句法位置,讨论违反CNPC实例的句法结构特点。然后,结合前人研究中违反CNPC的语义条件的分析,发现违反CNPC的实例在名词成分指称性、主句谓词类型方面均有限制,其中以宾语关系结构作主句主语限制最弱,关系结构作主句宾语限制最强。而在关系结构中加入对比焦点可以打破这些限制,实现关系结构内部成分话题化。最后,文章从语用话题和关系结构的语用功能角度讨论违反CNPC所需的语义条件的原因,认为名词成分指称性和主句谓词类型都是为压制关系结构的话题性而服务的。文章还解释了关系结构作主句主语/宾语时违反CNPC所需条件的不对称性。 展开更多
关键词 复杂名词短语限制 关系结构 关系小句 话题化
原文传递
主题地图约束的合法性验证
11
作者 吴笑凡 丁秋林 +1 位作者 张磊 周良 《现代图书情报技术》 CSSCI 北大核心 2006年第3期36-41,共6页
主题地图作为异构信息检索的重要手段之一,在以分类目录为目的的文件存档和以概念化导航为目的的Web浏览中得到广泛应用。为了保证作为其基础的下层语义网络的完备性和健壮性,验证主题地图在语法和语义上的合法性非常重要。为此,提出了... 主题地图作为异构信息检索的重要手段之一,在以分类目录为目的的文件存档和以概念化导航为目的的Web浏览中得到广泛应用。为了保证作为其基础的下层语义网络的完备性和健壮性,验证主题地图在语法和语义上的合法性非常重要。为此,提出了主题地图模式及约束语言规范,研究了Schema约束和上下文语义约束,并建立了与之相配套的主题地图语义验证器,实现了对于主题地图约束的合法性验证。 展开更多
关键词 主题地图 模式及约束语言规范 Schema约束 上下文语义约束 主题地图语义验证器
在线阅读 下载PDF
基于主题约束的篇章级文本生成方法 被引量:3
12
作者 黄炎 孙海丽 +4 位作者 徐科 余晓阳 王同洋 张新访 路松峰 《北京大学学报(自然科学版)》 EI CAS CSCD 北大核心 2020年第1期9-15,共7页
针对计算机自动生成的文本缺乏主题思想这一问题,提出一种基于主题约束的篇章级文本自动生成方法。该方法围绕用户输入的主题描述语句提取若干主题词;然后对主题词进行扩展和主题聚类,形成文章主题规划;最后利用每个聚类中的关键词信息... 针对计算机自动生成的文本缺乏主题思想这一问题,提出一种基于主题约束的篇章级文本自动生成方法。该方法围绕用户输入的主题描述语句提取若干主题词;然后对主题词进行扩展和主题聚类,形成文章主题规划;最后利用每个聚类中的关键词信息约束每个段落的文本生成。该模型从文本主题分布、注意力评分方法和主题覆盖生成3个方面对现有基于注意力机制的循环神经网络文本生成模型进行了改进。在3个真实数据集上分别与Char-RNN,SC-LSTM和MTA-LSTM基准模型进行对比,并对3个方面的改进进行独立验证。实验结果表明,所提方法在人工评判和BLEU自动评测上均优于基准模型,生成的文本能更好地贴合主题。 展开更多
关键词 文本自动生成 主题约束 循环神经网络(RNN) 长短时记忆网络(LSTM) 注意力机制
在线阅读 下载PDF
面向短文本的增强上下文神经主题模型
13
作者 刘刚 王同礼 +2 位作者 唐宏伟 战凯 杨雯莉 《计算机工程与应用》 CSCD 北大核心 2024年第1期154-164,共11页
目前的主题模型大多数基于自身文本的词共现信息进行建模,并没有引入主题的稀疏约束来提升模型的主题抽取能力,此外短文本本身存在词共现稀疏的问题,该问题严重影响了短文本主题建模的准确性。针对以上问题,提出了一种增强上下文神经主... 目前的主题模型大多数基于自身文本的词共现信息进行建模,并没有引入主题的稀疏约束来提升模型的主题抽取能力,此外短文本本身存在词共现稀疏的问题,该问题严重影响了短文本主题建模的准确性。针对以上问题,提出了一种增强上下文神经主题模型(enhanced context neural topic model,ECNTM)。ECNTM基于主题控制器对主题进行稀疏性约束,过滤掉不相关的主题,同时模型的输入变成BOW向量和SBERT句子嵌入的拼接,在高斯解码器中,通过在嵌入空间中将单词上的主题分布处理为多元高斯分布或高斯混合分布,显式地丰富了短文本有限的上下文信息,解决了短文本词共现特征稀疏问题。在WS、Reuters、KOS、20 NewsGroups四个公开数据集上的实验结果表明,该模型在困惑度、主题一致性以及文本分类准确率上相较基准模型均有明显提升,证明了引入主题稀疏约束特性以及丰富的上下文信息到短文本主题建模的有效性。 展开更多
关键词 神经主题模型 短文本 稀疏约束 变分自编码器 主题建模
在线阅读 下载PDF
基于隐藏主题概率模型的图像结构感知SISR重建方法
14
作者 马丽红 王小娥 +1 位作者 田菁 张宇 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2019年第4期1-9,共9页
在基于示例学习的单幅图像超分辨率(SISR)重建中,假设从低分辨率(LR)到高分辨率(HR)图像块的映射关系是一对一的,但同一LR块会与多个HR块对应,导致了LR与HR块的匹配误差.为解决HR复原块的失配问题,文中首先导出了LR块主题模式的概率模型... 在基于示例学习的单幅图像超分辨率(SISR)重建中,假设从低分辨率(LR)到高分辨率(HR)图像块的映射关系是一对一的,但同一LR块会与多个HR块对应,导致了LR与HR块的匹配误差.为解决HR复原块的失配问题,文中首先导出了LR块主题模式的概率模型,引入信号的隐藏主题这一种新的观察信息.然后提出了一种基于块主题差异和上下文最大概率的结构感知复原机制,通过主题模式与邻域块内容的关联,形成LR块的流形描述;在重构中通过自适应主题决策树选择和节点回归矩阵映射,从相似的LR流形信号中准确区分和复原HR信号.主题模型优化实验结果表明,文中基于主题约束信息的算法比未引入隐藏主题的决策树SISR方法的峰值信噪比(PSNR)值提升了0.25 dB;在5种算法的对比实验中,相对于稀疏字典SISR方法,文中方法的PSNR值平均提升了0.92 dB,表明引入隐藏的主题信息和主题流形结构辨识是可行的. 展开更多
关键词 超分辨率重建 主题概率模型 结构感知 流形约束 节点回归映射
在线阅读 下载PDF
移位性特征与句首名词的句法/语用属性研究 被引量:2
15
作者 马志刚 孙青 《外语学刊》 CSSCI 北大核心 2016年第1期64-69,共6页
现有推导模式认为汉语中的两类保留宾语结构具有悬垂话题并通过主语外置生成句末焦点,但这种生成方式不仅将焦点置于时态投射中,而且有违成分统制和包含关系。此外,依据管约论先时态投射后标句词投射的生成顺序会生成非法语链,而若采用... 现有推导模式认为汉语中的两类保留宾语结构具有悬垂话题并通过主语外置生成句末焦点,但这种生成方式不仅将焦点置于时态投射中,而且有违成分统制和包含关系。此外,依据管约论先时态投射后标句词投射的生成顺序会生成非法语链,而若采用先标句词投射后时态投射的生成顺序则会违反格要求。基于同步探测动态生成结构的最简主张,两类保留宾语结构理想的生成模式是功能语类C和T所携带的非论元探针和论元探针同步探测。Chomsky(2014:7)提出,语言的优化完美仅适用于概念意愿界面(CI interface),基于感觉运动界面的语音外化则是附带现象,而区分移位性特征和一致性特征有助于明晰一致关系的操作和一致性特征的赋值这两个概念。据此经由同步探测生成的保留宾语结构的内部构造中,获得语义解读的既有显性话题又有隐性主语,而获得语音拼读的仅仅是句首的话题。文章从概念必要性的视角论证了该分析方案的优化之处并辅之以一定的实证理据。 展开更多
关键词 移位性特征 话题和/或主语属性 探针-目标一致关系 混合语链
原文传递
局域非对称成分统制、移位性特征和汉语保留宾语结构的再分析——就句末焦点说兼与潘海华、韩景泉(2008)商榷 被引量:4
16
作者 马志刚 《北京第二外国语学院学报》 2013年第2期1-9,共9页
尽管保留宾语结构中的句首名词具有话题属性,但句末焦点说不能解释为何其句首名词还具有主语属性,而且动词后的名词成分更适合做句法宾语而非主语。本文认为,句末焦点说所提议的语义变量允准句首悬垂话题的假设缺乏形式理据,而其推导机... 尽管保留宾语结构中的句首名词具有话题属性,但句末焦点说不能解释为何其句首名词还具有主语属性,而且动词后的名词成分更适合做句法宾语而非主语。本文认为,句末焦点说所提议的语义变量允准句首悬垂话题的假设缺乏形式理据,而其推导机制则有违逆局部性限制和混合语链限制。基于拷贝理论和并行探测理论推导生成保留宾语结构的句法操作不仅符合普适性句法限制,而且表明其句首名词为话题拷贝,而紧随其后的是无语音实现的主语拷贝,因而可将保留宾语结构线性序列上的首位名词视为话题属性和主语属性兼具的句法成分。 展开更多
关键词 领主属宾句 保留宾语被动句 话题和主语 移位性特征 混合语链限制 局域非对称成分统制
在线阅读 下载PDF
语义约束和时间关联LDA的社交媒体主题词链提取 被引量:3
17
作者 万红新 彭云 《小型微型计算机系统》 CSCD 北大核心 2018年第4期742-747,共6页
网络社交媒体文本中蕴含着丰富的评论主题信息,由于数据规模大、自然语言表达以及随时间变化等因素,增加了从文本中提取主题词的难度.根据中文社交媒体的语法结构及语义特征,利用LDA主题模型的文本降维及主题词语获取功能,并结合语义约... 网络社交媒体文本中蕴含着丰富的评论主题信息,由于数据规模大、自然语言表达以及随时间变化等因素,增加了从文本中提取主题词的难度.根据中文社交媒体的语法结构及语义特征,利用LDA主题模型的文本降维及主题词语获取功能,并结合语义约束和时间关联提出了主题词链提取算法及模型.首先利用句法分析、词性关系和语境相关等进行词语语义关系获取,然后将语义和时间嵌入到LDA主题模型,构建符合中文社交媒体文本语法、语义结构特点的动态主题词链提取模型.实验结果表明,该模型可以改善LDA模型的语义理解功能和主题捕捉能力,提高主题词链提取的准确率和召回率. 展开更多
关键词 社交媒体 主题模型 语义约束 LDA模型 时间关联
在线阅读 下载PDF
基于改进LDA主题模型的产品特征抽取 被引量:7
18
作者 佘维军 刘子平 杨卫芳 《计算机与现代化》 2016年第11期1-6,57,共7页
针对LDA主题模型用于产品特征抽取中存在的问题,提出将句法分析和主题模型相结合的SA-LDA方法。首先基于句法分析对产品所在类别下的所有产品评论进行分析抽取显式特征,并聚类产生特征集和观点集,据此构建语料库。接着对待分析产品的每... 针对LDA主题模型用于产品特征抽取中存在的问题,提出将句法分析和主题模型相结合的SA-LDA方法。首先基于句法分析对产品所在类别下的所有产品评论进行分析抽取显式特征,并聚类产生特征集和观点集,据此构建语料库。接着对待分析产品的每条评论,提取主观句并利用改进LDA模型对其主题进行学习,根据语料库构建must-link和cannot-link约束条件,在主题更新时对其进行约束和引导,每个主题对应一个特征类。实验表明,本文方法对显式特征和隐式特征都具有很好的实验效果,且相比传统的方法和其他改进方法在保证召回率的同时对准确率也有一定程度的提高。 展开更多
关键词 潜在狄利克雷分布 主题模型 句法分析 特征抽取 约束条件
在线阅读 下载PDF
提问对回答的话题约束——抗击新冠肺炎与新闻发言人答记者问的会话分析 被引量:11
19
作者 于国栋 《天津外国语大学学报》 2020年第2期100-113,160,F0003,共16页
依据会话分析研究关于相邻对结构的基本理论,以新型冠状病毒感染肺炎爆发期间湖北省人民政府新闻办公室公开举行的新闻发布会为语料,关注答记者问环节中新闻发言人如何回答记者提问。聚焦新闻发言人如何在交际层面接受或忽视记者提问背... 依据会话分析研究关于相邻对结构的基本理论,以新型冠状病毒感染肺炎爆发期间湖北省人民政府新闻办公室公开举行的新闻发布会为语料,关注答记者问环节中新闻发言人如何回答记者提问。聚焦新闻发言人如何在交际层面接受或忽视记者提问背后的话题约束。从社会层面讲,接受话题约束的回答是符合社会规范的交际行为;而忽略话题约束的回答则违背社会规范,阻碍信息传递,影响新闻发言人的形象和身份构建,并可能产生消极的社会影响。希望本研究能够为突发(公共卫生)事件新闻发言人得体应答记者的提问提供一定的参考和启示。 展开更多
关键词 提问 回答 相邻对 话题约束 社会规范
在线阅读 下载PDF
汉语疑问话题的生成与制约条件
20
作者 刘巧丽 《郑州航空工业管理学院学报(社会科学版)》 2007年第5期66-67,共2页
文章以最简方案为理论框架,讨论汉语疑问话题的生成,同时,根据优选论的原理,确定疑问话题生成遵循的制约条件,即特征核查,强疑问话题前置,疑问话题前置,指别性成分前置。
关键词 疑问话题 最简方案 优选论 制约条件
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部