期刊文献+
共找到139篇文章
< 1 2 7 >
每页显示 20 50 100
Performance Analysis of Optimized Content Extraction for Cyrillic Mongolian Learning Text Materials in the Database
1
作者 Bat-Erdene Nyandag Ru Li G. Indruska 《Journal of Computer and Communications》 2016年第10期79-89,共12页
This paper had developed and tested optimized content extraction algorithm using NLP method, TFIDF method for word of weight, VSM for information search, cosine method for similar quality calculation from learning doc... This paper had developed and tested optimized content extraction algorithm using NLP method, TFIDF method for word of weight, VSM for information search, cosine method for similar quality calculation from learning document at the distance learning system database. This test covered following things: 1) to parse word structure at the distance learning system database documents and Cyrillic Mongolian language documents at the section, to form new documents by algorithm for identifying word stem;2) to test optimized content extraction from text material based on e-test results (key word, correct answer, base form with affix and new form formed by word stem without affix) at distance learning system, also to search key word by automatically selecting using word extraction algorithm;3) to test Boolean and probabilistic retrieval method through extended vector space retrieval method. This chapter covers: to process document content extraction retrieval algorithm, to propose recommendations query through word stem, not depending on word position based on Cyrillic Mongolian language documents distinction. 展开更多
关键词 Cyrillic Mongolian Language Content Extraction formatting Learning text Materials Style
在线阅读 下载PDF
Construction of an Automatic Bengali Text Summarizer Using Machine Learning Approaches
2
作者 Busrat Jahan Mahfuja Khatun +2 位作者 Zinat Ara Zabu Afranul Hoque Sayed Uddin Rayhan 《Journal of Data Analysis and Information Processing》 2022年第1期43-57,共15页
In our study, we chose python as the programming platform for finding an Automatic Bengali Document Summarizer. English has sufficient tools to process and receive summarized records. However, there is no specifically... In our study, we chose python as the programming platform for finding an Automatic Bengali Document Summarizer. English has sufficient tools to process and receive summarized records. However, there is no specifically applicable to Bengali since Bengali has a lot of ambiguity, it differs from English in terms of grammar. Afterward, this language holds an important place because this language is spoken by 26 core people all over the world. As a result, it has taken a new method to summarize Bengali documents. The proposed system has been designed by using the following stages: pre-processing the sample doc/input doc, word tagging, pronoun replacement, sentence ranking, as well as summary. Pronoun replacement has been used to reduce the incidence of swinging pronouns in the performance review. We ranked sentences based on sentence frequency, numerical figures, and pronoun replacement. Checking the similarity between two sentences in order to exclude one since it has less duplication. Hereby, we’ve taken 3000 data as input from newspaper and book documents and learned the words to be appropriate with syntax. In addition, to evaluate the performance of the designed summarizer, the design system looked at the different documents. According to the assessment method, the recall, precision, and F-score were 0.70, 0.82 and 0.74, respectively, representing 70%, 82% and 74% recall, precision, and F-score. It has been found that the proper pronoun replacement was 72%. 展开更多
关键词 Natural Language Processing formatting Bangla text Summarizer Bengali Language Processing Word Tagging Pronoun Replacement Sentence Ranking
在线阅读 下载PDF
史诗《玛纳斯》的文本生成与汉语翻译研究
3
作者 周玉婷 《民族翻译》 2025年第4期33-41,93,共10页
作为中国三大史诗之一,《玛纳斯》备受关注,经过几代人的共同努力,实现了从口头传承、文本记录到文本翻译的发展过程。本文重点关注了这一发展过程,通过梳理《玛纳斯》自新中国成立初期到现今的汉译情况,对其文本生成过程、成就、特点... 作为中国三大史诗之一,《玛纳斯》备受关注,经过几代人的共同努力,实现了从口头传承、文本记录到文本翻译的发展过程。本文重点关注了这一发展过程,通过梳理《玛纳斯》自新中国成立初期到现今的汉译情况,对其文本生成过程、成就、特点、趋势等相关问题进行了探讨,认为《玛纳斯》汉译工作逐步实现了专业化、多样化和系统化,这标志着《玛纳斯》汉译事业不断走向成熟,为史诗传承与传播奠定了坚实基础。 展开更多
关键词 《玛纳斯》 文本生成 汉译史
在线阅读 下载PDF
出土文献视域下中国早期古书形成的主要特征
4
作者 余建平 《浙江大学学报(人文社会科学版)》 北大核心 2025年第5期62-74,共13页
结合新近出土和传世文献,可大体将中国早期古书的形成分为两个重要阶段:其一,章按同类聚结的原则,以一定次序组合成篇;其二,篇按一定次序聚结成书。这两个阶段反映出中国早期古书成书的三个主要特征。一是同类聚结。短章因形式相似、主... 结合新近出土和传世文献,可大体将中国早期古书的形成分为两个重要阶段:其一,章按同类聚结的原则,以一定次序组合成篇;其二,篇按一定次序聚结成书。这两个阶段反映出中国早期古书成书的三个主要特征。一是同类聚结。短章因形式相似、主题相关等原因而聚结成篇,篇因文本相似、人物相关或主题相同等因素而聚结成书。二是文本的合并、组合与改动。受编者或抄手主观改动、抄写、错简等多种因素的影响,部分短章和篇在流传过程中可能被合并、节录、改动而生成新的篇章。三是篇章次序。次序体现了作者或编者对各篇章组织结构的理解。次序一旦形成,并不意味着完全定型,也会受编者或抄手主观改动、抄写、错简等多种因素的影响而发生变动。 展开更多
关键词 古书形成 出土文献
原文传递
研究生学位论文电子版的收集与利用──清华大学的实践与探索 被引量:12
5
作者 窦天芳 姜爱蓉 《大学图书馆学报》 CSSCI 北大核心 2001年第4期50-52,共3页
介绍清华大学图书馆从2000年开始利用校园网收集研究生学位论文电子版全文的思路、措施以及技术手段,对收集电子版全文中出现的问题进行了归纳分析,并对这项工作的进一步完善提出了建议。
关键词 学位论文 计算机网络 电子全文 收集工作 研究生教育 电子全文格式
在线阅读 下载PDF
基于汉字结构的自然型文本水印算法 被引量:11
6
作者 李庆诚 张振华 张金 《计算机应用研究》 CSCD 北大核心 2009年第4期1520-1522,1527,共4页
从汉字分类思维的角度,在充分利用汉字的二维象形性以及人眼视觉冗余特性的基础上,提出一种将结构化汉字字形拆分再重组的自然型文本水印算法。该算法通过汉字字形的拆分,增加了文档内容编码冗余,提高了水印信道容量,并通过调整汉字显... 从汉字分类思维的角度,在充分利用汉字的二维象形性以及人眼视觉冗余特性的基础上,提出一种将结构化汉字字形拆分再重组的自然型文本水印算法。该算法通过汉字字形的拆分,增加了文档内容编码冗余,提高了水印信道容量,并通过调整汉字显示属性,增强水印的隐蔽性。最后对其进行实验验证,证明该算法兼具格式水印隐蔽性和语义水印鲁棒性的双重优点,并具有嵌入空间大的特点。 展开更多
关键词 汉字结构 自然型文本水印 格式水印
在线阅读 下载PDF
面向RTF文件的Word漏洞分析 被引量:3
7
作者 乐德广 章亮 +2 位作者 郑力新 李鑫 陈经途 《华侨大学学报(自然科学版)》 CAS 北大核心 2015年第1期17-22,共6页
针对Word软件在富文本格式(RTF)文档解析的漏洞利用攻击,通过对Word程序的逆向分析,研究其在RTF文档解析中产生缓冲区溢出漏洞的原理,并提出一种基于指令回溯及特征数据构造的漏洞分析方法.通过该方法分析Word漏洞的触发原因、触发点和... 针对Word软件在富文本格式(RTF)文档解析的漏洞利用攻击,通过对Word程序的逆向分析,研究其在RTF文档解析中产生缓冲区溢出漏洞的原理,并提出一种基于指令回溯及特征数据构造的漏洞分析方法.通过该方法分析Word漏洞的触发原因、触发点和触发机制,给出了面向RTF文档的缓冲区溢出漏洞的分析流程.实验测试结果证明:该方法能有效检测出Word的RTF文档解析漏洞. 展开更多
关键词 富文本格式 文档 软件安全 Word漏洞利用
在线阅读 下载PDF
基于文本格式的Excel数据导入 被引量:7
8
作者 刘玉敏 宋金波 赵玉峰 《科学技术与工程》 2010年第1期291-293,310,共4页
应用Visual C#,采用文本格式将数据写入到Excel的方法,与以前采用的应用Excel的COM组件,利用cell属性直接写入的方法不同。由于引用的组件版本不同。会出现与版本不兼容的现象。采用直接以文本的格式写入,就不会涉及版本的问题。通过对... 应用Visual C#,采用文本格式将数据写入到Excel的方法,与以前采用的应用Excel的COM组件,利用cell属性直接写入的方法不同。由于引用的组件版本不同。会出现与版本不兼容的现象。采用直接以文本的格式写入,就不会涉及版本的问题。通过对天然气生产运行辅助决策系统的开发,验证了采用文本方式写入的方法具有良好的兼容性。 展开更多
关键词 VISUAL C# EXCEL COM组件 文本格式
在线阅读 下载PDF
基于RTF格式的文本脆弱水印算法 被引量:5
9
作者 邹昕光 孙圣和 《计算机工程》 CAS CSCD 北大核心 2007年第4期131-133,共3页
文本水印算法容易受到格式化和存储攻击。该文提出一种基于RTF格式的文本脆弱水印算法,能够抵抗格式化和存储攻击,并且对文本段落拷贝时,文本水印不丢失。对文本段落的任何修改都能在水印提取验证段检测出来。分析了3种水印攻击手段。... 文本水印算法容易受到格式化和存储攻击。该文提出一种基于RTF格式的文本脆弱水印算法,能够抵抗格式化和存储攻击,并且对文本段落拷贝时,文本水印不丢失。对文本段落的任何修改都能在水印提取验证段检测出来。分析了3种水印攻击手段。介绍了该水印的实现算法,并对文本水印攻击检测给出了实验结果。 展开更多
关键词 脆弱水印 RTF 信息隐藏 SHA-1 BASE64
在线阅读 下载PDF
速度、步幅与窗口对引导式中文文本阅读工效的影响 被引量:8
10
作者 水仁德 符德江 +1 位作者 李忠平 沈模卫 《心理科学》 CSSCI CSCD 北大核心 2001年第2期141-144,233,共5页
引导式显示是在视觉显示终端 (VDT)上呈现动态文本的主要方式之一。本研究考察了显示窗口大小、跳动步幅、显示速度等因素对引导式中文文本的阅读工效的影响。实验中采用了 3(跳动步幅 ,被试内变量 )× 3(显示速度 ,被试内变量 )... 引导式显示是在视觉显示终端 (VDT)上呈现动态文本的主要方式之一。本研究考察了显示窗口大小、跳动步幅、显示速度等因素对引导式中文文本的阅读工效的影响。实验中采用了 3(跳动步幅 ,被试内变量 )× 3(显示速度 ,被试内变量 )× 2 (显示窗口大小 ,被试间变量 )的混合设计 ,共有 18个被试参加了实验。结果发现 :( 1)跳动步幅、显示速度和窗口大小均影响中文文本的阅读工效 ;( 2 )达到最佳阅读工效的实验条件在速度和步幅上分别集中于 2 0 0~ 40 0字 /分和 1~ 3字 /步。最后本文结合中文阅读的相关眼动研究 。 展开更多
关键词 速度 步幅 窗口 引导式 中文文本 阅读工效 程序设计
在线阅读 下载PDF
基于单词间字符统计特征的文本数字水印 被引量:7
11
作者 胡晶晶 孙星明 《计算机工程》 EI CAS CSCD 北大核心 2005年第23期116-118,共3页
由于文本文档的特殊性,文本数字水印技术主要集中在基于格式方面。该文提出了一种同时基于单词间字符内容及格式之统计特征的文本数字水印算法,并讨论和分析了这一算法较传统的完全基于格式的文本数字水印的优点。
关键词 文本数字水印 内容 格式 统计特征 版权保护
在线阅读 下载PDF
一种富文本分类方法的设计和实现 被引量:2
12
作者 朱斐 刁红军 吕强 《计算机应用与软件》 CSCD 北大核心 2007年第12期121-122,127,共3页
综合考虑了富文本中的标题、关键词、主题、结构、词形、风格等描述信息,实现了一种富文本分类的方法。根据描述信息的范围和影响力不同给予相应的权重,改进了传统文本分类算法,使具有明显分类特征的特征发挥了较好的分类效果,抑制了权... 综合考虑了富文本中的标题、关键词、主题、结构、词形、风格等描述信息,实现了一种富文本分类的方法。根据描述信息的范围和影响力不同给予相应的权重,改进了传统文本分类算法,使具有明显分类特征的特征发挥了较好的分类效果,抑制了权重较小的特征的干扰。实验表明,这种方法具有较好的准确率和召回率。 展开更多
关键词 文本分类 富文本分类 OpenDocument分类建模 特征选择
在线阅读 下载PDF
一种基于词编码的中文文档格式 被引量:1
13
作者 焦慧 刘迁 贾惠波 《计算机科学》 CSCD 北大核心 2008年第10期162-164,共3页
分析了汉语自动分词问题产生的根源和面临的困难,针对性地提出了一种基于词的中文编码方法和中文文档新格式,实现了以词作为中文文本的最小信息载体,使中文文本分析可以在词平台上实现,避免了自动分词对中文信息处理带来的障碍。基于中... 分析了汉语自动分词问题产生的根源和面临的困难,针对性地提出了一种基于词的中文编码方法和中文文档新格式,实现了以词作为中文文本的最小信息载体,使中文文本分析可以在词平台上实现,避免了自动分词对中文信息处理带来的障碍。基于中文词的编码方法,以每个词作为一个单位,对词进行编码。此方法避开了中文的自动分词问题,特别是解决了歧义切分的难题,并提出了一种利用文档格式解决未登录词问题的新思路。采用统计分析方法对词平台基础上的关键词自动抽取进行了实验研究,取得良好效果。 展开更多
关键词 中文信息处理 词典码 文档格式 自动分词
在线阅读 下载PDF
格式化文本水印性能评估基准研究 被引量:7
14
作者 陈青 邢晓溪 《计算机应用研究》 CSCD 北大核心 2014年第9期2764-2768,共5页
针对目前没有测试基准对格式化文本水印算法鲁棒性进行评估和比较,提出了格式化文本水印性能评估基准。回顾了水印系统通用的框架,分析并确定了影响水印系统性能的参数和文本文档的视觉质量评级标准。借鉴图像水印性能评估基准的攻击分... 针对目前没有测试基准对格式化文本水印算法鲁棒性进行评估和比较,提出了格式化文本水印性能评估基准。回顾了水印系统通用的框架,分析并确定了影响水印系统性能的参数和文本文档的视觉质量评级标准。借鉴图像水印性能评估基准的攻击分类,提出了Word特有的去除攻击、几何攻击、密码攻击和协议攻击的攻击分类方法,同时阐述了Word特有的攻击模式。对两种不同的文本水印算法进行了攻击强度—鲁棒性、攻击强度—视觉质量和嵌入数据量—鲁棒性测试,实验结果表明,该系统在文本水印算法评估和设计中具有有效性和实用性。 展开更多
关键词 格式化文本 鲁棒性 文本水印攻击 性能评估 基准
在线阅读 下载PDF
《清实录》稿底正副本及满汉蒙文本形成考论 被引量:8
15
作者 谢贵安 《史学集刊》 CSSCI 北大核心 2008年第2期92-101,共10页
《清实录》修纂先据档案等原始史料编成稿本(底本),然后缮成正本(小黄绫本)呈审,再据呈审本缮成各定本(皇史宬尊藏本、盛京崇谟阁尊藏本、乾清宫御览小红绫本、内阁实录库副本以及国史馆缮写副本)。在满、汉、蒙古文诸文本的形成过程中... 《清实录》修纂先据档案等原始史料编成稿本(底本),然后缮成正本(小黄绫本)呈审,再据呈审本缮成各定本(皇史宬尊藏本、盛京崇谟阁尊藏本、乾清宫御览小红绫本、内阁实录库副本以及国史馆缮写副本)。在满、汉、蒙古文诸文本的形成过程中,是先据满文档案纂成满文本实录,然后再译成汉文本实录,最后再据汉文本译成蒙古文本实录,但康熙以后的史料大都来自汉档和汉籍,史臣亦日渐丧失精通满文和蒙古文的能力,因此从雍正所修《清圣祖实录》始,满、汉文本之间的纂修顺序颠倒了过来,即先据汉文档案纂成汉文本实录,然后再分别译成满文本实录和蒙古文实录。这一改变,反映了汉文作为清帝国共同语言地位的确立以及清朝汉化进程的加深。 展开更多
关键词 清实录 版本 文本 形成
在线阅读 下载PDF
平滑滚动引导式和快速系列视觉呈现式中文文本阅读工效研究 被引量:5
16
作者 沈模卫 陈新 陶嵘 《心理科学》 CSSCI CSCD 北大核心 2001年第4期393-395,435,共4页
本研究在机控速度条件下 ,考察了显示窗口大小 (10字和 2 0字 )、显示速度 (30 0字 /分和 6 0 0字 /分 )和文本显示方式 (平滑滚动的引导式和快速系列视觉呈现 )等因素对VDT中文文本阅读工效的影响。实验结果发现 :(1) 30 0字 /分的显... 本研究在机控速度条件下 ,考察了显示窗口大小 (10字和 2 0字 )、显示速度 (30 0字 /分和 6 0 0字 /分 )和文本显示方式 (平滑滚动的引导式和快速系列视觉呈现 )等因素对VDT中文文本阅读工效的影响。实验结果发现 :(1) 30 0字 /分的显示速度有利于阅读理解 ;(2 )在本实验条件下 ,平滑滚动引导式的可读性优于快速系列视觉呈现式。最后 ,作者结合有关中文眼动研究理论 。 展开更多
关键词 引导 阅读理解 滚动 可读性 文眼 作者 实验结果 平滑 视觉 快速
在线阅读 下载PDF
电子课业手写批注系统的实现 被引量:1
17
作者 邹溪 董险峰 《吉林大学学报(信息科学版)》 CAS 2013年第5期535-539,共5页
为解决网络教学中远程作业批改的问题,提出了电子课业的一种手写批注方法,阐述了该系统的开发背景、技术路线、关键技术及其功能与应用。系统以富文本格式打开文档,通过安装的钩子监视处理窗体的诸多消息,显示或重绘批注留痕,自行创建... 为解决网络教学中远程作业批改的问题,提出了电子课业的一种手写批注方法,阐述了该系统的开发背景、技术路线、关键技术及其功能与应用。系统以富文本格式打开文档,通过安装的钩子监视处理窗体的诸多消息,显示或重绘批注留痕,自行创建坐标系,将文本层与批注层进行逻辑上的叠加,形成整体的批注场景。实验结果证明,该系统是电子课业手写批注的公共平台,具有很好的教学效果和推广价值。 展开更多
关键词 手写批注 电子课业 富文本格式
在线阅读 下载PDF
接受美学在中国影视艺术中遭遇尴尬 被引量:5
18
作者 邵茹波 《重庆工商大学学报(社会科学版)》 2007年第1期148-150,共3页
将接受美学的观点与影视批评的观点有机地结合起来,从接受美学的三个角度——效果价值评判、审美期待视界和本文召唤结构出发,分析接受美学在中国影视艺术中遭遇的尴尬,指出这实际上也是中国影视艺术自身的尴尬。
关键词 接受美学 影视艺术 效果价值评判 审美期待视界 本文召唤结构
在线阅读 下载PDF
词切分与字间距对引导式汉语文本阅读工效的影响 被引量:15
19
作者 沈模卫 李忠平 张光强 《心理学报》 CSSCI CSCD 北大核心 2001年第5期410-415,共6页
采用两个实验分别考察了词切分和字间距对引导式汉语文本的阅读工效的影响。实验结果表明 :(1)不同步幅下的阅读工效差异显著 ,其中 3字 /步条件下的阅读绩效最高 ,但词切分并未能提高阅读绩效 ,其中消失 1词 /步条件反而妨碍了阅读理... 采用两个实验分别考察了词切分和字间距对引导式汉语文本的阅读工效的影响。实验结果表明 :(1)不同步幅下的阅读工效差异显著 ,其中 3字 /步条件下的阅读绩效最高 ,但词切分并未能提高阅读绩效 ,其中消失 1词 /步条件反而妨碍了阅读理解 ,出现 1词 /步条件也未能显著提高阅读工效 ;(2 )字间距对汉语文本阅读工效有显著影响 ;(3) 10字窗口下 ,步幅效应和字间距效应都显著 ;2 0字窗口下 ,二者都不显著。 展开更多
关键词 词切分 字间距 引导式 阅读工效 汉语文本
在线阅读 下载PDF
基于文本格式的文本信息隐藏方法研究综述 被引量:3
20
作者 张楠 李洪敏 +1 位作者 卢敏 柯明敏 《信息化研究》 2017年第3期1-6,共6页
信息隐藏是信息安全的重要学科分支。文本文档存在的广泛性使得基于文本文档的信息隐藏研究在数字水印和隐蔽通信领域具有重要应用价值。本文介绍了文本信息隐藏的概念、特点和分类,重点阐述了基于文本格式的信息隐藏方法的特点,从文本... 信息隐藏是信息安全的重要学科分支。文本文档存在的广泛性使得基于文本文档的信息隐藏研究在数字水印和隐蔽通信领域具有重要应用价值。本文介绍了文本信息隐藏的概念、特点和分类,重点阐述了基于文本格式的信息隐藏方法的特点,从文本格式的段落格式、字符特征、不可见字符和固定文件格式四个方面分析了该领域的研究现状,归纳总结现有方法存在的重要问题,指出未来该领域的研究方向和发展趋势,给基于文本格式的信息隐藏研究提供了参考依据。 展开更多
关键词 信息隐藏 文本隐藏 文本格式 综述
在线阅读 下载PDF
上一页 1 2 7 下一页 到第
使用帮助 返回顶部