期刊文献+
共找到64篇文章
< 1 2 4 >
每页显示 20 50 100
一种快速文本图像倾斜校正方法 被引量:12
1
作者 曾凡锋 吴飞飞 +1 位作者 肖珂 王晓 《计算机应用与软件》 CSCD 2015年第4期181-185,共5页
为解决复杂拍摄背景下采集到的文本图像难以快速、准确地进行倾斜校正的问题,提出一种新的倾斜文本图像校正方法。该方法通过对选定图像的投影窗口的水平投影统计分析计算,自适应地筛选出只含有文字的文本特征子区。在特征子区内部,通... 为解决复杂拍摄背景下采集到的文本图像难以快速、准确地进行倾斜校正的问题,提出一种新的倾斜文本图像校正方法。该方法通过对选定图像的投影窗口的水平投影统计分析计算,自适应地筛选出只含有文字的文本特征子区。在特征子区内部,通过采用连通域横向搜索法定位文字行并拟合直线计算出文本线的倾斜角度,从而得到文本图像的倾斜角度,最后利用改进的快速旋转变换算法进行倾斜校正。实验结果表明,该倾斜校正方法不受成像背景、复杂版面的影响,具有速度快、精度高、适应性强的优点,可广泛应用于对速度和效率有更高要求的移动终端平台上。 展开更多
关键词 文本子区 文字定位 投影算法 连通域搜索 最小二乘法
在线阅读 下载PDF
基于发现特征子空间模型的文本分类算法 被引量:2
2
作者 周法国 王映龙 +1 位作者 杨炳儒 陈卓 《计算机应用研究》 CSCD 北大核心 2009年第10期3712-3715,3734,共5页
在非结构化数据挖掘结构模型,即发现特征子空间模型(DFSSM)的运行机制下,提出了一种新的文本分类算法——基于DFSSM的文本分类(TCDFSSM)算法。该算法在文本训练及分类阶段的基础上增加了自动反馈阶段,使得TCDFSSM具有自学习能力,并给出... 在非结构化数据挖掘结构模型,即发现特征子空间模型(DFSSM)的运行机制下,提出了一种新的文本分类算法——基于DFSSM的文本分类(TCDFSSM)算法。该算法在文本训练及分类阶段的基础上增加了自动反馈阶段,使得TCDFSSM具有自学习能力,并给出了文本分类过程反馈阈值的选取算法。结果表明,该算法分类效果良好,其自学习能力、适应性及鲁棒性更加优越。 展开更多
关键词 发现特征子空间 文本分类 模式
在线阅读 下载PDF
基于多重文本关系图中clique子团聚类的主题识别方法研究 被引量:4
3
作者 郭红梅 孔贝贝 张智雄 《情报学报》 CSSCI CSCD 北大核心 2017年第5期433-442,共10页
在网络成为最主要科学交流和信息传播渠道的今天,越来越多的机构将其研究成果以电子化形式呈现,这些电子化的文本资源中蕴涵着丰富的语义信息。面对这些海量的资源,科研人员很难在短时间内快速捕获文本中的主旨内容。如何高效准确地呈... 在网络成为最主要科学交流和信息传播渠道的今天,越来越多的机构将其研究成果以电子化形式呈现,这些电子化的文本资源中蕴涵着丰富的语义信息。面对这些海量的资源,科研人员很难在短时间内快速捕获文本中的主旨内容。如何高效准确地呈现文本资源中的核心主题,辅助科研人员对文本集中的重要关联信息进行聚焦,提高科研效率,一直是文本挖掘研究中的一个重要问题。在对现有有益研究成果借鉴的基础上,结合文本中术语和术语关系的特点,论文提出将文本中的术语和术语间的共现、句法和语义关系利用图结构进行表示,识别文本关系图中的紧密关联子团,基于所得到的紧密关联子团聚类来揭示文本子主题的整体研究思路。开展了两个方面的研究:①将文本集中的术语和术语间各种关系属性进行叠加归并,构建多重文本关系叠加模型;②基于clique子团间相似性距离和语义标识,进行聚类识别文本集中所包含的重要子主题。论文采用"migraine disorders"主题中近五年的文献构建文本集,对提出的方法开展了2个有效性实验。实验1与文本中领域专家所给出的标引词按语义类型分组结果对比,结果表明论文提出的方法与领域专家给出的标引词语义类型分组结果具有一致性;实验2与目前广泛使用的LDA方法结果进行对比,在准确率和召回率上都较LDA方法有所提高。2个实验均证明了文中方法的有效性。 展开更多
关键词 clique子团 多重文本关系 文本主题识别
在线阅读 下载PDF
多文本融合下的深度翻译研究 被引量:10
4
作者 梅明玉 《中国科技翻译》 北大核心 2020年第2期42-46,共5页
深度翻译是在多重文本支撑的基础上完成的,其中副文本和潜文本可以对理解文化典籍、医书等的深层内容起到支撑作用,也对作者的隐含意图产生明晰作用。对于古诗词等内容,则附翻译可以起到诠释作用。译者要有多文本融合的把控能力,做到作... 深度翻译是在多重文本支撑的基础上完成的,其中副文本和潜文本可以对理解文化典籍、医书等的深层内容起到支撑作用,也对作者的隐含意图产生明晰作用。对于古诗词等内容,则附翻译可以起到诠释作用。译者要有多文本融合的把控能力,做到作者、译者、译本和读者的有机结合。 展开更多
关键词 副文本 潜文本 深度翻译 附翻译
原文传递
论文学史叙事的故事性 被引量:4
5
作者 乔国强 《南京社会科学》 CSSCI 北大核心 2021年第1期117-126,共10页
本文要论证的主要观点是文学史叙事故事性的三个基本特征,即"往事""差异"以及"建构"。这三个基本特征具体体现在文学史框架的构建、文学史文本的开放性以及文学史的潜文本和超文本。这三者或有部分重叠之... 本文要论证的主要观点是文学史叙事故事性的三个基本特征,即"往事""差异"以及"建构"。这三个基本特征具体体现在文学史框架的构建、文学史文本的开放性以及文学史的潜文本和超文本。这三者或有部分重叠之处,不过它们还是有所不同:文学史框架揭示的是因其支撑性和约束性而演绎出来的故事;文学史文本的开放性主要指向阐释的多种可能性,不同的阐释演化出不同的故事;文学史的潜文本和超文本道出了文学史文本内部和文学史文本与外部相关联的故事。 展开更多
关键词 文学史叙事 故事性 文学史框架 开放性 潜文本 超文本
原文传递
基于图文有效信息量的网页正文定位 被引量:2
6
作者 梁正友 欧杰 俞闽敏 《计算机工程》 CAS CSCD 北大核心 2011年第23期276-278,共3页
在现有的网页抽取技术中,正文定位方法仅考虑网页文本信息,当正文图片信息较多、文本信息偏少时,容易出现偏差,且定位准确率较低。针对该问题,从信息论角度出发,结合网页中的文本信息图片信息,设计一种对网页中图片信息量和有效信息量... 在现有的网页抽取技术中,正文定位方法仅考虑网页文本信息,当正文图片信息较多、文本信息偏少时,容易出现偏差,且定位准确率较低。针对该问题,从信息论角度出发,结合网页中的文本信息图片信息,设计一种对网页中图片信息量和有效信息量的估算方法,在此基础上,提出一种基于图文信息量的网页正文定位算法。实验结果表明,该算法在不同正文文本量的情况下,均具有较高的定位准确率。 展开更多
关键词 正文定位 最小正文子树 有效信息率 网页 图文
在线阅读 下载PDF
清代徐燨戏曲版本与副文本的互文性阐释 被引量:4
7
作者 杜桂萍 孙蒙蒙 《陕西师范大学学报(哲学社会科学版)》 CSSCI 北大核心 2022年第2期147-159,共13页
清代戏曲作品副文本繁多,与正文本的关系颇为复杂。随着版本的变迁、副文本数量的增减,彼此之间的指涉关系极为隐秘而多元,需借助各类副文本乃至正文本之互文性关系进行综合解读。徐燨的戏曲作品《镜光缘》和《写心剧》皆版本复杂,仅从... 清代戏曲作品副文本繁多,与正文本的关系颇为复杂。随着版本的变迁、副文本数量的增减,彼此之间的指涉关系极为隐秘而多元,需借助各类副文本乃至正文本之互文性关系进行综合解读。徐燨的戏曲作品《镜光缘》和《写心剧》皆版本复杂,仅从版本变迁的视角即可发现有关作者生平经历、戏曲创作乃至戏曲主题的诸多特殊性,互文性解读为徐燨戏曲创作的阐释提供了多维的、有效的、价值丰沛的言说策略。 展开更多
关键词 清代戏曲 徐燨 副文本 互文性
在线阅读 下载PDF
“瘴气”之名与实商榷 被引量:8
8
作者 左鹏 《南开学报(哲学社会科学版)》 CSSCI 北大核心 2011年第5期29-39,共11页
通过对文本的分析,可知"瘴"字的出现要比"瘴"的观念出现得晚;"瘴气"最初写作"障气",见于《淮南子》,此书中的"障气"一词虽然有异文作"水气",但这可能是传写之误;"障... 通过对文本的分析,可知"瘴"字的出现要比"瘴"的观念出现得晚;"瘴气"最初写作"障气",见于《淮南子》,此书中的"障气"一词虽然有异文作"水气",但这可能是传写之误;"障气"的观念在当时大概只是一种个体认识,还不是社会的普遍知识。从医学地理学的角度分析,瘴气的分布应该会随着气候的变化而南北推移,而不是不断南移;瘴气大体上是以疟疾,尤其是恶性疟疾为主的疾病,这是前人通过流行病学调查与临床诊治所得出的结论,某些质疑并不能否定其正确性。 展开更多
关键词 异文 恶性疟疾 医学地理学
原文传递
为了温暖而偷——文本世界理论分析《偷窃物》 被引量:5
9
作者 贾晓庆 张德禄 《山东外语教学》 北大核心 2013年第1期42-46,67,共6页
文本世界理论主要分析读者如何和处于"分裂的语篇世界"的作者进行有效交流。运用该理论分析美国当代著名作家珍妮弗·伊根的小说《暴徒袭过》之第一章《偷窃物》,可以解释读者如何在阅读时建构文本世界和各种亚世界,从而... 文本世界理论主要分析读者如何和处于"分裂的语篇世界"的作者进行有效交流。运用该理论分析美国当代著名作家珍妮弗·伊根的小说《暴徒袭过》之第一章《偷窃物》,可以解释读者如何在阅读时建构文本世界和各种亚世界,从而和空间上、文化上相隔遥远的作者进行交流,感受到她对现代人孤独境遇的同情,以及她对现代人经历痛苦之后必将获得幸福的希望和信心。 展开更多
关键词 《偷窃物》 文本世界 亚世界 语篇世界
在线阅读 下载PDF
基于笔画相关加权的视频图像文字识别 被引量:4
10
作者 苏畅 胡晓冬 +1 位作者 王斌辅 尚凤军 《计算机应用》 CSCD 北大核心 2012年第8期2305-2308,2312,共5页
为了提取影视视频图像中的字幕信息,提出一套鲁棒的方法:首先采用图像的边缘特征对字幕信息进行区域定位,并给出结合边缘信息的方法对图像文字进行二值化;其次,采用投影法和区域生成方法定位单个文字;最后,充分考虑到文字笔画的拓扑结构... 为了提取影视视频图像中的字幕信息,提出一套鲁棒的方法:首先采用图像的边缘特征对字幕信息进行区域定位,并给出结合边缘信息的方法对图像文字进行二值化;其次,采用投影法和区域生成方法定位单个文字;最后,充分考虑到文字笔画的拓扑结构,进行相邻子网格笔画结构相关性的判定,并采用笔画模糊隶属度完成弹性网格特征的提取。该方法在复杂的背景图像中能够有效得到文字的二值图像,并保证了提取特征的稳定性、健壮性,对二值化后的影视字幕的识别率达到92.1%,实验结果表明了方法的有效性。 展开更多
关键词 视频图像 文字识别 文本定位 二值化 子网格特征 笔画相关性
在线阅读 下载PDF
基于子图像VCH的文本检测与定位方法研究 被引量:4
11
作者 张佑生 彭青松 +1 位作者 汪荣贵 偶春生 《武汉大学学报(信息科学版)》 EI CSCD 北大核心 2003年第3期354-358,共5页
提出了一种基于子图像的变异灰度直方图 (VCH)的检测与定位文本的方法 ,对子图像VCH的映射特征及其与图像文本的对应关系作了分析 ,并给出文本检测与定位的有效算法。该算法通过对行分割子图像VCH C中的凸台和列分割子图像VCH R中的凹... 提出了一种基于子图像的变异灰度直方图 (VCH)的检测与定位文本的方法 ,对子图像VCH的映射特征及其与图像文本的对应关系作了分析 ,并给出文本检测与定位的有效算法。该算法通过对行分割子图像VCH C中的凸台和列分割子图像VCH R中的凹谷的识别与定位 ,实现在图像中快速检测与定位文本。文章给出了计算试验的结果 。 展开更多
关键词 变异灰度直方图 子图像 基于内容的检索 文本检测与定位
在线阅读 下载PDF
运用文本领域的常识改善基于支撑向量机的文本分类器性能 被引量:16
12
作者 李辉 史忠植 许卓群 《中文信息学报》 CSCD 北大核心 2002年第2期7-13,共7页
本文提出了一种提高中文文本分类器推广性能的方法。一般而言 ,采用机器学习的方法对文本集合进行训练 ,可以获得文本分类器。本文引入了文本语义不变性常识 ,并将其融合到文本分类器中 ,提出了改进文本分类器的方法。与支撑向量机相结... 本文提出了一种提高中文文本分类器推广性能的方法。一般而言 ,采用机器学习的方法对文本集合进行训练 ,可以获得文本分类器。本文引入了文本语义不变性常识 ,并将其融合到文本分类器中 ,提出了改进文本分类器的方法。与支撑向量机相结合 ,设计并实现了改进的文本分类器。对中文文本分类的实验表明 。 展开更多
关键词 文本分类器 同语义文档子段替换 人工文档样本 相容性条件 支撑向量机 文本信息机理
在线阅读 下载PDF
《黄山来的姑娘》:雇佣劳动的性别化寓言 被引量:1
13
作者 马春花 《南开学报(哲学社会科学版)》 CSSCI 北大核心 2016年第4期7-16,共10页
作为20世纪80年代初期的一部重要电影,《黄山来的姑娘》再现了打工妹群体在当代中国的"发生政治",其既是改革开放的现代性项目对于雇佣劳动力主体的性别化再生产,又隐喻了在历史和现实的交错中建构起来的新社会差序结构。电... 作为20世纪80年代初期的一部重要电影,《黄山来的姑娘》再现了打工妹群体在当代中国的"发生政治",其既是改革开放的现代性项目对于雇佣劳动力主体的性别化再生产,又隐喻了在历史和现实的交错中建构起来的新社会差序结构。电影不仅是对一个理想的保姆形象的呼唤,更是即将展开的中国特色社会主义市场经济,对某种身份制雇佣劳动力的意识形态询唤。然而,在这个合乎时代需要的"臣服的主文本"之外,尚存在一个"抵抗的次文本",女性姊妹情谊、社会主义伦理为这种"弱者的抵抗"提供了情感与政治资源。 展开更多
关键词 《黄山来的姑娘》 雇佣劳动 性别政治 抵抗的次文本
原文传递
基于多重文本术语关系叠加识别文本核心主题的有效性探索 被引量:7
14
作者 郭红梅 张智雄 《情报学报》 CSSCI CSCD 北大核心 2017年第11期1157-1164,共8页
目前基于图或网络进行文本主题挖掘的研究大多是基于单一文本术语关系,而文本是由一系列具有语义信息的术语,按照一定的逻辑结构构成的,这些术语除了物理位置上共现关系外,还存在句法上的支配从属关系和隐含的语义关联,仅利用单一术语... 目前基于图或网络进行文本主题挖掘的研究大多是基于单一文本术语关系,而文本是由一系列具有语义信息的术语,按照一定的逻辑结构构成的,这些术语除了物理位置上共现关系外,还存在句法上的支配从属关系和隐含的语义关联,仅利用单一术语关系对文本内容进行分析难免会造成信息的丢失,因此本文尝试将术语间的共现、句法和语义三种关系进行叠加,探索基于多重文本术语关系识别核心主题的有效性。文中选取PubMed数据库2012-2014年"migraine disorders"主题相关的249篇论文进行实验,结果表明术语和关系的叠加使文本主题信息更为凸显,同时存在三种关系的术语和边可表征文本的重要内容。对同时存在三种关系的术语和边组成多重文本术语关系图深度分析显示,叠加术语关系图中所包含的clique子团的边数和结点数少于术语共现关系图,但多于术语语义和句法关系图;在凝聚度最大的前20个clique中,叠加术语关系图中所含clique的凝聚度要高于共现、句法和语义三者中的任何一个,且这种差异具有统计学意义。多重术语关系的叠加平衡共现、句法和语义三种关系,在减少术语共现关系影响的同时增加术语语义和句法关系的优势,将三者含有的信息量进行叠加,克服了单独考虑一种术语关系时造成的信息丢失。 展开更多
关键词 文本术语关系叠加 文本主题识别 clique子团
在线阅读 下载PDF
多主题文本摘要抽取的研究与实现 被引量:5
15
作者 廖涛 刘宗田 王利 《计算机工程》 CAS CSCD 北大核心 2011年第6期21-23,共3页
研究自动摘要技术,结合统计与文本关系图并基于复杂网络中的社区划分算法,提出一种多主题文本摘要抽取方法。抽取文本中权重较高的句子,通过句子的相似度计算建立文本关系图,利用社区划分算法解决子主题划分的问题。实验结果表明,该方... 研究自动摘要技术,结合统计与文本关系图并基于复杂网络中的社区划分算法,提出一种多主题文本摘要抽取方法。抽取文本中权重较高的句子,通过句子的相似度计算建立文本关系图,利用社区划分算法解决子主题划分的问题。实验结果表明,该方法对多主题文本摘要的抽取质量较好,能抽取出较多的子主题。 展开更多
关键词 多主题文本 自动摘要 统计模型 文本关系图 子主题社区划分
在线阅读 下载PDF
文本世界与戏剧人物塑造——以阿瑟·米勒的两部时空剧为例 被引量:4
16
作者 方颖 《外国语文》 北大核心 2016年第6期26-31,共6页
本文以阿瑟·米勒两部时空剧为例,借助Wmatrix3.0语料库分析工具,旨在说明Paul Werth的文本世界假说能有效阐释戏剧情境如何动态地影响人物性格。结论是:(1)指示词与指称词的变化表明时空切换,有助于识别文本内的"指示亚世界&q... 本文以阿瑟·米勒两部时空剧为例,借助Wmatrix3.0语料库分析工具,旨在说明Paul Werth的文本世界假说能有效阐释戏剧情境如何动态地影响人物性格。结论是:(1)指示词与指称词的变化表明时空切换,有助于识别文本内的"指示亚世界",由此构建相关的文本"现实世界"和"过去世界"的语料库,对比不同"世界"中的人物特征。(2)态度亚世界和认识亚世界涉及人物的欲望、梦想、猜测等,检索分析其关键语义域可探知人物在不同时空世界中的心态和价值取向。(3)分析非主角人物的"态度世界"和"认识世界"可揭示其与主角之间的矛盾冲突及其性格的演变。(4)跨界分析反复出现的关键语义域有助认知人物性格中固化的弱点及其文本蕴含的喻义。 展开更多
关键词 文本世界 动态情境 人物性格 文本亚世界 Wmatrix语料库工具
在线阅读 下载PDF
亚文学:当下文学发展的新形态 被引量:1
17
作者 葛娟 《南京师大学报(社会科学版)》 CSSCI 北大核心 2011年第5期156-160,共5页
亚文学是一种被认为次于正统文学的流行写作,正以其通俗化的内容和似是而非的文学形式被大众广为接受并占领市场,成为当下文学发展的新形态。与文学文本对应,亚文学文本亦可以分为散文、小说、诗歌和戏剧四大类别,并呈现为多种文本形态... 亚文学是一种被认为次于正统文学的流行写作,正以其通俗化的内容和似是而非的文学形式被大众广为接受并占领市场,成为当下文学发展的新形态。与文学文本对应,亚文学文本亦可以分为散文、小说、诗歌和戏剧四大类别,并呈现为多种文本形态。亚文学作为文学的扩容和变异,首先可以看作是当下文学存在方式的变化,同时也标示着文学转型的发生,对此文学理论和批评应当予以关注。 展开更多
关键词 亚文学 文本建制 新形态
在线阅读 下载PDF
基于主题子空间的文本模糊C均值聚类方法 被引量:2
18
作者 吉翔华 陈超 +1 位作者 邵正荣 俞能海 《小型微型计算机系统》 CSCD 北大核心 2007年第12期2225-2228,共4页
模糊C均值聚类作为聚类的一种有效方法在数据挖掘和信息检索等领域得到广泛的应用,初始中心和初始隶属度矩阵的建立是决定模糊C均值聚类效果的关键.本文提出一种基于文本主题空间的模糊C均值聚类算法TS2FCM(Topic Sub-Space based Fuzzy... 模糊C均值聚类作为聚类的一种有效方法在数据挖掘和信息检索等领域得到广泛的应用,初始中心和初始隶属度矩阵的建立是决定模糊C均值聚类效果的关键.本文提出一种基于文本主题空间的模糊C均值聚类算法TS2FCM(Topic Sub-Space based Fuzzy C-Means),通过对能够代表文本主题的关键短语(salient phrase)的提取来建立主题子空间,利用主题子空间中的文本向量来提取初始中心和初始隶属度矩阵.实验表明,TS2FCM取得了较好的聚类效果. 展开更多
关键词 TS2FCM 主题子空间 模糊C均值聚类 文本聚类
在线阅读 下载PDF
《一地鸡毛》文本构建策略新探 被引量:1
19
作者 曾广丽 《三峡大学学报(人文社会科学版)》 2004年第6期53-55,共3页
中篇小说《一地鸡毛》以描写人物日常生活的烦恼达到对于政治体制结构的透视 ,创造了一个次政治文本 ,主人公关涉到的七组关系构成了文本的内在结构并因此而隐喻了人的生活现实
关键词 《一地鸡毛》 文本 幻灭 中篇小说 主人公 生活现实 人物 构建策略 新探 创造性
在线阅读 下载PDF
基于频繁子树模式的评价对象抽取 被引量:1
20
作者 田卫东 苗惠君 《计算机工程》 CAS CSCD 北大核心 2017年第4期222-227,共6页
现有的评价对象抽取方法多基于启发式规则或者基于词性、词形等特征的机器学习方法,未能较好地利用依存分析所揭示出的深层句法关联关系。为此,基于从依存关系树库所挖掘的频繁树模式,提出一种针对中文评论性短文本的评价对象抽取方法... 现有的评价对象抽取方法多基于启发式规则或者基于词性、词形等特征的机器学习方法,未能较好地利用依存分析所揭示出的深层句法关联关系。为此,基于从依存关系树库所挖掘的频繁树模式,提出一种针对中文评论性短文本的评价对象抽取方法。该方法基于依存关系频繁子树模式进行短文本的初始标注,采用错误驱动框架的方法提炼出能反映评价对象特征的频繁子树模式有序模式规则集,并利用该规则集进行评价对象的抽取。实验结果表明,该方法具有较好的稳定性与准确性,在召回率和F1值等评价指标上优于基于支持向量机的方法。 展开更多
关键词 依存句法 短文本 频繁子树模式 错误驱动 支持向量机
在线阅读 下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部