期刊文献+
共找到99篇文章
< 1 2 5 >
每页显示 20 50 100
Text extraction method for historical Tibetan document images based on block projections 被引量:3
1
作者 段立娟 张西群 +1 位作者 马龙龙 吴健 《Optoelectronics Letters》 EI 2017年第6期457-461,共5页
Text extraction is an important initial step in digitizing the historical documents. In this paper, we present a text extraction method for historical Tibetan document images based on block projections. The task of te... Text extraction is an important initial step in digitizing the historical documents. In this paper, we present a text extraction method for historical Tibetan document images based on block projections. The task of text extraction is considered as text area detection and location problem. The images are divided equally into blocks and the blocks are filtered by the information of the categories of connected components and corner point density. By analyzing the filtered blocks' projections, the approximate text areas can be located, and the text regions are extracted. Experiments on the dataset of historical Tibetan documents demonstrate the effectiveness of the proposed method. 展开更多
关键词 HISTORICAL TIBETAN document filtered blockS bounding CORNER APPROXIMATE projection COORDINATE
原文传递
自适应混合检索增强大模型的农作物病虫害智能问答方法
2
作者 杨俊 杨婉霞 +2 位作者 杨森 何亮 张娣 《智慧农业(中英文)》 2026年第1期52-61,共10页
[目的/意义]充分发挥隐含在农业大数据中的分散、异构和无关联农业知识的潜在应用价值,通过构建知识库,结合检索技术用于增强大模型输出专业的农业知识,为促进农业知识快速服务于生产实践提供有效手段。[方法]提出了检索增强大模型的农... [目的/意义]充分发挥隐含在农业大数据中的分散、异构和无关联农业知识的潜在应用价值,通过构建知识库,结合检索技术用于增强大模型输出专业的农业知识,为促进农业知识快速服务于生产实践提供有效手段。[方法]提出了检索增强大模型的农作物病虫害智能问答方法,该方法通过自建知识库并协同优化分块策略、自适应检索机制与结构化提示工程,实现了农业病虫害领域知识有效增强大模型的精准专业问答。具体提出了自适应混合检索增强生成方法(Retrieval-Augmented Generation,RAG),首先在固定长度分块时引入重叠机制缓解语义割裂,同时,采用向量语义相似度匹配与主题高度相关的文本分块加以存储。根据问题复杂度设计了动态路由的单跳(BM25算法)检索与多跳检索。然后将文本方法与多种基线方法在不同查询类型和不同复杂度查询等多方面进行了对比实验。[结果和讨论]本研究方法在Qwen1.5-7B-Chat模型上的效果最佳,准确率达到89.6%,对单跳与多跳查询的准确率分别达到0.921和0.748,较Self-RAG与Adaptive-RAG多跳查询的准确率分别提升0.082和0.059,说明本研究方法能更好地推理多跳等复杂查询。[结论]本研究方法在生成答案的准确性、相关性和全面性方面具有显著优势。未来的工作将探索融合多模态知识库。 展开更多
关键词 自适应混合检索 文本分块 病虫害 智能问答
在线阅读 下载PDF
景观认知视角下历史街区场所精神演进研究——以元、明、清时期北京什刹海为例
3
作者 米雪松 刘彤彤 +1 位作者 王苗 钱丰 《景观设计》 2026年第1期8-11,共4页
针对历史街区“物质保留、精神消逝”的困境,以元、明、清时期的什刹海为例,运用文本挖掘技术,从景观认知视角探究其场所精神的历史演进,并从空间、功能与情感三个维度展开解析。结果表明,什刹海场所精神的演变历程为从元朝作为社交场... 针对历史街区“物质保留、精神消逝”的困境,以元、明、清时期的什刹海为例,运用文本挖掘技术,从景观认知视角探究其场所精神的历史演进,并从空间、功能与情感三个维度展开解析。结果表明,什刹海场所精神的演变历程为从元朝作为社交场所展现的离愁别绪,到明朝作为宗教空间赋予的精神寄托,再到清朝文人雅集所形成的文化认同。关联分析表明,场所精神源于物质空间、活动实践与情感体验三者的相互驱动与历史累积。研究成果可为历史街区的当代保护提供理论参照与实践启示。 展开更多
关键词 历史街区 场所精神 景观认知 什刹海 文本挖掘
原文传递
历史文化街区空间品质与游客感知失配研究
4
作者 李璇 张佳宇 解丹 《城市建筑》 2025年第23期96-100,共5页
历史文化街区是文化资源与旅游功能的复杂融合体,运用多源数据开展历史文化街区空间品质与游客感知研究,对历史文化街区的可持续发展具有重大意义。本研究依托街景数据、网络文本数据、POI数据等,结合图片识别、文本分析、耦合分析等方... 历史文化街区是文化资源与旅游功能的复杂融合体,运用多源数据开展历史文化街区空间品质与游客感知研究,对历史文化街区的可持续发展具有重大意义。本研究依托街景数据、网络文本数据、POI数据等,结合图片识别、文本分析、耦合分析等方法,探究历史文化街区空间品质与游客感知的失配状况。研究发现:①空间品质与游客感知高耦合区域集中于中部,并向南北方向逐渐递减;②失配空间占比达39.9%,适配程度仍有不足,失配区域主要集中在南侧道路与纵向道路区域。最后,依据失配要素及其分布情况剖析原因。 展开更多
关键词 历史文化街区 网络文本数据 空间品质 游客感知 五大道
在线阅读 下载PDF
基于改进扩散模型结合条件控制的文本图像生成算法
5
作者 杜洪波 薛皓元 朱立军 《南京信息工程大学学报》 北大核心 2025年第5期611-623,共13页
针对现有的文本图像生成方法存在图像保真度低、图像生成操作难度大、仅适用于特定的任务场景等问题,提出一种新型的基于扩散模型的文本生成图像方法.该方法将扩散模型作为主要网络,设计一种新型结构的残差块,有效提升模型生成性能;通... 针对现有的文本图像生成方法存在图像保真度低、图像生成操作难度大、仅适用于特定的任务场景等问题,提出一种新型的基于扩散模型的文本生成图像方法.该方法将扩散模型作为主要网络,设计一种新型结构的残差块,有效提升模型生成性能;通过添加注意力模块CBAM来改进噪声估计网络,增强了模型对图像关键信息的提取能力,进一步提高了生成图像质量;结合条件控制网络,有效地实现了特定姿势的文本图像生成.与KNN-Diffusion、CogView2、text-StyleGAN、SimpleDiffusion等方法在数据集CelebA-HQ上做了定性、定量分析以及消融实验,根据评价指标以及生成结果显示,本文方法能够有效提高文本生成图像的质量,FID平均下降36.4%,Inception Score(IS)和结构相似性指数(SSIM)分别平均提高11.4%和3.9%,验证了本文算法的有效性.同时,本文模型结合了ControlNet网络,实现了定向动作的文本图像生成. 展开更多
关键词 扩散模型 文本图像生成 条件控制 残差块 CBAM
在线阅读 下载PDF
面向散文阅读理解简答题的多片段答案关键句抽取方法 被引量:1
6
作者 侯祺积 李旸 +2 位作者 王素格 何东欢 李书琪 《中文信息学报》 北大核心 2025年第6期67-76,共10页
机器阅读理解是自然语言处理领域中一个非常重要的研究方向,近年来发布了许多中文阅读理解任务的数据集,但散文数据集的构建工作还略显不足。该文从散文阅读理解简答题的角度,构建了散文阅读理解简答题答案关键句数据集。在散文阅读理... 机器阅读理解是自然语言处理领域中一个非常重要的研究方向,近年来发布了许多中文阅读理解任务的数据集,但散文数据集的构建工作还略显不足。该文从散文阅读理解简答题的角度,构建了散文阅读理解简答题答案关键句数据集。在散文阅读理解简答题中,散文文本较长,答案关键句分散在多个段落中,现有模型对长文本输入的底层设计存在局限性。为此,该文提出一种多片段答案关键句抽取方法。该方法融合词形匹配和词语语义相似度,构建了问题与句子的相似度计算模型;设计了分块处理策略,缓解了长文本输入信息缺失问题;构建了问题与文本的相关性判别模型,实现了多片段答案关键句抽取。在该文构建的数据集上与其他方法进行比较实验,实验结果表明,该方法性能优于其他对比方法。 展开更多
关键词 散文阅读理解 多片段抽取 关键句抽取 文本分块 相关性得分
在线阅读 下载PDF
基于网络文本数据的重庆市金刚碑历史文化街区游客感知研究 被引量:2
7
作者 李欣 黄弘礼 肖洪未 《重庆建筑》 2025年第9期11-15,共5页
游客感知是历史文化街区旅游开发评价的重要因素。通过分析游客感知的实时数据,可以动态监测和反馈街区保护开发的效果,为街区的可持续发展提供指导。以重庆市金刚碑历史文化街区为研究对象,利用网络爬虫技术获取并整理了2016—2024年... 游客感知是历史文化街区旅游开发评价的重要因素。通过分析游客感知的实时数据,可以动态监测和反馈街区保护开发的效果,为街区的可持续发展提供指导。以重庆市金刚碑历史文化街区为研究对象,利用网络爬虫技术获取并整理了2016—2024年的网络文本数据,运用ROST CM6软件对文本进行词频特征分析、语义网络分析和情感分析,研究游客对金刚碑的旅游形象感知,为金刚碑的保护提供引导。研究表明,游客对金刚碑的情感态度整体上趋于良好,积极感知远大于消极感知;然而,部分游客对旅游体验与氛围、交通、街区配套设施等方面持消极态度。最后,根据以上分析结果,结合街区的发展现状和现实问题,从形象感知、体验感知、功能感知三个方面提出了建议,为金刚碑的保护与管理决策制定提供依据。 展开更多
关键词 网络文本 历史文化街区 游客感知 爬虫技术 金刚碑
在线阅读 下载PDF
面向大语言模型的大模型提示幻觉问题研究
8
作者 林海 王超 《国外电子测量技术》 2025年第7期237-243,共7页
为避免大语言模型存在的幻觉问题,提出一种面向大语言模型的大模型提示幻觉问题解决方法。首先以知识蒸馏链式模型为基础,通过在模型中引入代码块,用于引导知识图谱检索方向,并将代码作为思维链的提示文本,形成外部知识输入向大语言模... 为避免大语言模型存在的幻觉问题,提出一种面向大语言模型的大模型提示幻觉问题解决方法。首先以知识蒸馏链式模型为基础,通过在模型中引入代码块,用于引导知识图谱检索方向,并将代码作为思维链的提示文本,形成外部知识输入向大语言模型提供更准确的信息,提出改进知识蒸馏链式模型;然后利用改进知识蒸馏链式模型对大语言模型的推理过程进行解析,提升大语言模型的准确性;最后以GPT-4和Llama 3.3大语言模型为例,在公开数据集上对本方法进行仿真验证。结果表明,引入代码块可提升知识蒸馏链式模型对上下文的学习能力,更好地解决大模型提示幻觉问题,HIT@1、HIT@3、HIT@5分别提升了15.64%、13.38%、13.28%;基于改进知识蒸馏链式模型的大模型提示幻觉问题解决方法,HIT@1、HIT@3、HIT@5达到95%以上。由此得出,本方法可有效避免大语言幻觉现象,增强大语言模型的准确性和可验证性。 展开更多
关键词 大语言模型 知识蒸馏链式模型 代码块 幻觉问题 提示文本
原文传递
青岛鱼山历史文化街区公共空间旅游行为冲突评价与更新策略 被引量:3
9
作者 卢彦冰 聂彤 《城市建筑》 2025年第13期54-57,共4页
近年来我国旅游业在存量发展、“网红”效应、文化自信等因素的影响下,形式日益多样,一些带有地方特色的历史城区也因此成为热门旅游地。本研究以青岛鱼山历史文化街区作为研究对象,利用百度热力图对街区的整体活力进行分区判断,按照分... 近年来我国旅游业在存量发展、“网红”效应、文化自信等因素的影响下,形式日益多样,一些带有地方特色的历史城区也因此成为热门旅游地。本研究以青岛鱼山历史文化街区作为研究对象,利用百度热力图对街区的整体活力进行分区判断,按照分区的冲突程度划分三个等级,以此区分区域优化的顺序。再将与街区相关的网络评论文本进行词频分析,得到街区空间更新相关的人群需求。从以上两个角度对鱼山历史文化街区公共空间中的旅游行为冲突进行调查和评价,最后从旅游空间提升的角度提出相应的历史街区更新建议。 展开更多
关键词 行为冲突 百度热力图 网络评论文本分析 更新策略
在线阅读 下载PDF
《云合奇踪》玉茗堂本和余古斋本的异文比较
10
作者 李颖超 《哈尔滨师范大学社会科学学报》 2025年第3期139-145,共7页
《云合奇踪》(即《英烈传》)这部历史演义小说有众多刊刻版本,各版本之间存在诸多异文。通过对现存明代最早刊刻的玉茗堂本和稍晚刊刻的余古斋本《云合奇踪》的校勘比较,发现两种版本在内容上基本一致,出现的异文存在一定的规律。与玉... 《云合奇踪》(即《英烈传》)这部历史演义小说有众多刊刻版本,各版本之间存在诸多异文。通过对现存明代最早刊刻的玉茗堂本和稍晚刊刻的余古斋本《云合奇踪》的校勘比较,发现两种版本在内容上基本一致,出现的异文存在一定的规律。与玉茗堂本《云合奇踪》相比,余古斋本的异文多属有意为之。这些异文说明小说的创作意图与主题由最初的侧重于颂扬先祖谋篇立业之光辉,转为侧重于还原历史,展现了不同社会时期对历史记载的态度和需求的差异,表现了不同时代背景下的文化动向和受众群体的新期待,体现了著作人创作意图的不断创新发展。 展开更多
关键词 《云合奇踪》 玉茗堂本 余古斋本 异文比较
在线阅读 下载PDF
Web页面清洗技术的研究与实现 被引量:20
11
作者 周源远 王继成 +1 位作者 郑刚 张福炎 《计算机工程》 CAS CSCD 北大核心 2002年第9期48-50,197,共4页
文章提出了Web页面清洗的概念,给出了一种基于规则的Web页面清洗方案,并实现了基于此方案的系统。文中的页面清洗建立在Web页面的DOM树结构上,并通过人工判定的方法进行了实验和评估。实验结果表明该方案切实可行、清洗方法具有较快的... 文章提出了Web页面清洗的概念,给出了一种基于规则的Web页面清洗方案,并实现了基于此方案的系统。文中的页面清洗建立在Web页面的DOM树结构上,并通过人工判定的方法进行了实验和评估。实验结果表明该方案切实可行、清洗方法具有较快的速度和准确性。 展开更多
关键词 WEB页面 清洗技术 文本块 链接块 DOM 解析器 Internet 信息检索
在线阅读 下载PDF
基于隐马尔可夫模型的文本信息抽取 被引量:52
12
作者 刘云中 林亚平 陈治平 《系统仿真学报》 CAS CSCD 2004年第3期507-510,共4页
文本信息抽取是处理海量文本的重要手段,将隐马尔可夫模型应用到信息抽取领域是一个比较新的研究课题。提出了一种基于隐马尔可夫模型的文本信息抽取算法。该算法利用文本排版格式、分隔符等信息,对文本进行分块,在分块的基础上结合隐... 文本信息抽取是处理海量文本的重要手段,将隐马尔可夫模型应用到信息抽取领域是一个比较新的研究课题。提出了一种基于隐马尔可夫模型的文本信息抽取算法。该算法利用文本排版格式、分隔符等信息,对文本进行分块,在分块的基础上结合隐马尔可夫模型进行文本信息抽取。仿真结果表明,新的算法在精确度和召回率方面有明显的提高。 展开更多
关键词 隐马尔可夫模型 信息抽取 文本分块 机器学习
在线阅读 下载PDF
多民族交融视野下的11—13世纪白伞盖信仰研究
13
作者 张永富 《中国藏学》 北大核心 2025年第5期36-50,213-214,共17页
文章通过重新解读4篇西夏文《大白伞盖陀罗尼经》发愿文(年代分别为1185年、不详、1244年、1271年),基本还原了该经在西夏至蒙元时期的传译和雕印史,指出在凉州会盟之前,经略河西的阔端身边已然聚集了一批以正觉金刚(Buddhavajra)为代... 文章通过重新解读4篇西夏文《大白伞盖陀罗尼经》发愿文(年代分别为1185年、不详、1244年、1271年),基本还原了该经在西夏至蒙元时期的传译和雕印史,指出在凉州会盟之前,经略河西的阔端身边已然聚集了一批以正觉金刚(Buddhavajra)为代表的吐蕃、党项等多民族僧人,直接或间接地促成了凉州会盟这一重大历史事件。同时,通过梳理11—13世纪辽金刻经、《夷坚志》中的白伞盖故事、回鹘文《白伞盖经》以及元代举行白伞盖佛事等史料,梳理出这一时期白伞盖信仰在党项聚居的河西地区、契丹和女真聚居的华北地区、汉族聚居的南方地区以及在回鹘和蒙古内部传播的历史,揭示了白伞盖信仰在敦煌时期至元朝之间数百年间不仅没有中断,而且在西至敦煌河西、东至华北、南至福建以及四川的广袤大地上已然拥有了跨民族、跨语言、跨地域的广泛影响力。 展开更多
关键词 《大白伞盖陀罗尼经》发愿文 西夏文 白伞盖信仰 辽金刻经 回鹘文
原文传递
基于文本块密度和标签路径覆盖率的网页正文抽取 被引量:5
14
作者 刘鹏程 胡骏 吴共庆 《计算机应用研究》 CSCD 北大核心 2018年第6期1645-1650,共6页
大多数网页除了正文信息外,还包括导航、广告和免责声明等噪声信息。为了提高网页正文抽取的准确性,提出了一种基于文本块密度和标签路径覆盖率的抽取方法(CETD-TPC)。结合网页文本块密度特征和标签路径特征的优点,设计了融合两种特征... 大多数网页除了正文信息外,还包括导航、广告和免责声明等噪声信息。为了提高网页正文抽取的准确性,提出了一种基于文本块密度和标签路径覆盖率的抽取方法(CETD-TPC)。结合网页文本块密度特征和标签路径特征的优点,设计了融合两种特征的新特征,利用新特征抽取网页中的最佳文本块,最后,抽取该文本块中的正文内容。该方法有效地解决了网页正文中噪声块信息过滤和短文本难以抽取的问题,且无须训练和人工处理。在Clean Eval数据集和从知名网站上随机选取的新闻网页数据集上的实验结果表明,CETD-TPC方法在不同数据源上均具有很好的适用性,抽取性能优于CETR、CETD和CEPR算法。 展开更多
关键词 正文抽取 文本块密度 标签路径覆盖率 特征融合
在线阅读 下载PDF
基于特征和隐马尔可夫模型的文本信息抽取 被引量:3
15
作者 常军林 吴笑伟 +1 位作者 吴芬芬 刘磊 《河南科技大学学报(自然科学版)》 CAS 2008年第2期55-57,70,共4页
基于文本分块提出一种新的文本信息抽取技术,该技术利用文本的语义特征和结构特征,抽取具有特征的状态,以此结果为基础,进一步运用改进的隐马尔可夫模型,抽取剩余的无特征状态。对美国CMU大学CORA搜索引擎研制组提供的数据集中的100篇... 基于文本分块提出一种新的文本信息抽取技术,该技术利用文本的语义特征和结构特征,抽取具有特征的状态,以此结果为基础,进一步运用改进的隐马尔可夫模型,抽取剩余的无特征状态。对美国CMU大学CORA搜索引擎研制组提供的数据集中的100篇进行测试,结果显示精确度和召回率比基于单词和传统隐马尔可夫模型的方法都有所提高,并进一步提高了效率。 展开更多
关键词 文本分块 特征提取 隐马尔可夫模型
在线阅读 下载PDF
一种启发式的信息抽取算法 被引量:3
16
作者 吴芬芬 刘磊 肖宪 《吉林大学学报(理学版)》 CAS CSCD 北大核心 2007年第1期73-76,共4页
提出一种启发式的信息抽取算法,并利用该算法建立一个信息抽取系统.该系统基于文本分块,利用文本的语义特征和结构特征,抽取具有特征的状态,在此基础上,利用反向动态规划和正向A*算法,抽取剩余的无特征状态.通过对100篇论文头部进行测... 提出一种启发式的信息抽取算法,并利用该算法建立一个信息抽取系统.该系统基于文本分块,利用文本的语义特征和结构特征,抽取具有特征的状态,在此基础上,利用反向动态规划和正向A*算法,抽取剩余的无特征状态.通过对100篇论文头部进行测试的结果表明,精确度和召回率比基于单词和传统Viterbi算法的方法均有所提高,启发式算法的性能优于Viterbi算法. 展开更多
关键词 启发式算法 文本分块 A^*算法
在线阅读 下载PDF
中文搜索引擎分块倒排索引存储模式 被引量:10
17
作者 马健 张太红 陈燕红 《计算机应用》 CSCD 北大核心 2013年第7期2031-2036,共6页
针对开源搜索引擎ASPSeek中的倒排索引的内部结构和访问模式,抽象出了倒排索引的形式化定义。为解决ASPSeek倒排索引更新困难和直接采用操作系统文件缓冲访问机制带来的效率问题,以125万张中文农业网页为样本,结合其特点,提出了一种块... 针对开源搜索引擎ASPSeek中的倒排索引的内部结构和访问模式,抽象出了倒排索引的形式化定义。为解决ASPSeek倒排索引更新困难和直接采用操作系统文件缓冲访问机制带来的效率问题,以125万张中文农业网页为样本,结合其特点,提出了一种块大小可变的分块倒排索引存储模式和基于CLOCK替代策略的专用缓冲管理机制。实验结果表明在禁用和启用缓冲的情况下,分块访问模式检索效率都优于ASPSeek。在启用缓冲并使用16万中文词条或5万高频中文词条作为测试集合的条件下,分块存储模式在访问倒排索引100万次后的检索时间趋于常量,即使以全部的827309个词条作为测试集合的条件下,分块存储模式在访问倒排索引200万次后的检索时间趋于收敛。 展开更多
关键词 倒排索引 搜索引擎 全文检索 分块结构 检索效率
在线阅读 下载PDF
基于文本分块的多模板隐马尔可夫模型的文本信息抽取 被引量:4
18
作者 王雷 陈治平 李志成 《山东大学学报(理学版)》 CAS CSCD 北大核心 2006年第3期25-28,共4页
针对文本信息抽取中训练数据来源的多样化,不利于学习到最优的模型参数的问题,提出了一种基于多模板隐马尔可夫模型的文本信息抽取算法.新算法利用文本排版格式、分隔符等信息,对文本进行分块,在此基础上,通过对训练数据分成多个形式模... 针对文本信息抽取中训练数据来源的多样化,不利于学习到最优的模型参数的问题,提出了一种基于多模板隐马尔可夫模型的文本信息抽取算法.新算法利用文本排版格式、分隔符等信息,对文本进行分块,在此基础上,通过对训练数据分成多个形式模板训练隐马尔可夫初始概率及转移概率参数,最后,结合统一训练的释放概率参数,对文本信息进行抽取.实验结果表明,新算法在精确度和召回率指标上比简单隐马尔可夫模型具有更好的性能. 展开更多
关键词 文本信息抽取 隐马尔可夫模型 多模板 文本分块
在线阅读 下载PDF
一种基于启发式搜索的论文元数据提取算法 被引量:1
19
作者 张付志 侯娜 +1 位作者 刘慧 马玉静 《计算机应用与软件》 CSCD 2009年第9期86-88,94,共4页
随着大量的科研论文以电子文档的形式出现,为了高效地检索这些科研文献资料,从中精确地抽取这些论文头部的元数据信息显得十分有必要。在条件随机场模型的基础上,提出了一种启发式搜索算法来对论文头部的元数据信息进行提取。该算法首... 随着大量的科研论文以电子文档的形式出现,为了高效地检索这些科研文献资料,从中精确地抽取这些论文头部的元数据信息显得十分有必要。在条件随机场模型的基础上,提出了一种启发式搜索算法来对论文头部的元数据信息进行提取。该算法首先利用文本分块技术和特征提取规则来对文本进行预处理,然后结合条件随机场概率模型利用启发式搜索来进行元数据的提取。实验结果表明,在相同概率模型的基础上,该算法有着较好的性能,在精确度和召回率方面都有了明显的提高。 展开更多
关键词 信息提取 元数据提取 条件随机场 文本分块 启发式搜索
在线阅读 下载PDF
基于汉字结构知识的鲁棒性公开文本水印 被引量:4
20
作者 周新民 孙星明 刘超 《计算机工程与应用》 CSCD 北大核心 2006年第8期165-167,169,共4页
针对中文文本存在的版权保护问题,文章提出了一种新的文本水印算法。该方法通过汉字数学表达式,获取汉字的结构类型和笔画数,利用汉字的结构类型将整个文档分成两块,在各块中由汉字笔画数和水印比特位共同确定水印加载的位置,通过设置... 针对中文文本存在的版权保护问题,文章提出了一种新的文本水印算法。该方法通过汉字数学表达式,获取汉字的结构类型和笔画数,利用汉字的结构类型将整个文档分成两块,在各块中由汉字笔画数和水印比特位共同确定水印加载的位置,通过设置字体下划线以嵌入水印。水印提取时不需要原始文档和原始水印,通过块校验和海明校验可将破坏的水印比特位进行恢复。实验结果表明该算法具有较好的透明性和鲁棒性。 展开更多
关键词 文本水印 汉字结构知识 海明校验 文本分块 版权保护
在线阅读 下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部