期刊文献+
共找到109篇文章
< 1 2 6 >
每页显示 20 50 100
Winnowing算法和动态规划算法在作业剽窃检测中的应用和比较 被引量:4
1
作者 张量 刘秀敏 刘秀娟 《计算机工程与科学》 CSCD 北大核心 2009年第6期147-149,共3页
信息数字化后使抄袭、剽窃变得更加容易了,为了杜绝学生作业中出现的抄袭现象,急需高效的剽窃检测技术,帮助教师对学生作业的抄袭情况实施监督检测。本文分别用具有除噪和过滤功能的Winnowing算法和动态规划算法对学生作业进行剽窃检测... 信息数字化后使抄袭、剽窃变得更加容易了,为了杜绝学生作业中出现的抄袭现象,急需高效的剽窃检测技术,帮助教师对学生作业的抄袭情况实施监督检测。本文分别用具有除噪和过滤功能的Winnowing算法和动态规划算法对学生作业进行剽窃检测。通过对文档间相似度的对比,实现了对作业剽窃程度的检测。实验结果表明,Winnowing算法更加有效、更加可靠。 展开更多
关键词 剽窃检测 winnowing算法 动态规划算法 最长公共子序列
在线阅读 下载PDF
一种Winnow线性分类器及其在TREC Novelty任务中的应用 被引量:2
2
作者 潘文锋 孙健 王斌 《计算机工程与应用》 CSCD 北大核心 2004年第23期59-61,共3页
文本检索会议(TextREtrievalConference,TREC)是目前国际上信息检索领域最重要的学术交流与国际评测活动。笔者等人代表中科院计算所参加了2003年TREC的Novelty任务。在该任务中,实现了Winnow线性分类器在检测relevant句子和novel句子... 文本检索会议(TextREtrievalConference,TREC)是目前国际上信息检索领域最重要的学术交流与国际评测活动。笔者等人代表中科院计算所参加了2003年TREC的Novelty任务。在该任务中,实现了Winnow线性分类器在检测relevant句子和novel句子中的应用。实验表明,这种简单的分类方法表现了较好的性能。 展开更多
关键词 文本检索会议 winnow 文本分类 NOVELTY 信息检索 线性分类器 TREC
在线阅读 下载PDF
一种扩展Winnowing剽窃检测算法 被引量:2
3
作者 段旭良 杨洋 +1 位作者 王曼韬 穆炯 《计算机工程与科学》 CSCD 北大核心 2017年第12期2245-2251,共7页
剽窃是目前学术界和教育界面临的普遍问题,成熟的商业化剽窃检测系统运行时间和经济代价高,不适合实时性、轻量级的学生作业等日常检测。对基于文本指纹的Winnowing剽窃检测算法进行扩展,在提取指纹的同时记录文本定位及其长度信息,给... 剽窃是目前学术界和教育界面临的普遍问题,成熟的商业化剽窃检测系统运行时间和经济代价高,不适合实时性、轻量级的学生作业等日常检测。对基于文本指纹的Winnowing剽窃检测算法进行扩展,在提取指纹的同时记录文本定位及其长度信息,给出了指纹提取、文本定位、剽窃指纹索引合并等算法,实现了剽窃文本的检测、定位、标记。实验结果及算法在应用系统中实际运行状况表明,算法的扩展对其性能影响不大,普通硬件配置条件下即可满足中小规模应用需求。扩展算法在原算法轻量级、高效率、可靠性和灵活度高等特点基础上,进一步拓展了Winnowing的功能,增强了原算法的适应性和应用价值。 展开更多
关键词 winnowING 剽窃检测 相似检测 剽窃文本定位 文本指纹
在线阅读 下载PDF
开放的同行评议新模式分析与研究——以The Winnower平台为例 被引量:8
4
作者 张晓 黄雪梅 《图书馆学刊》 2016年第9期24-27,共4页
近年来,伴随着开放获取运动的蓬勃发展,开放获取期刊平台开始出现并发展起来。以The Winnower平台为例,通过介绍该开放获取期刊平台的发展历程、同行评议的模式、管理方法和平台特色等,对目前开放的同行评议新模式进行分析和研究,挖掘... 近年来,伴随着开放获取运动的蓬勃发展,开放获取期刊平台开始出现并发展起来。以The Winnower平台为例,通过介绍该开放获取期刊平台的发展历程、同行评议的模式、管理方法和平台特色等,对目前开放的同行评议新模式进行分析和研究,挖掘与借鉴国外评议模式的精华,再以国内的中国科技论文在线平台作为参照,探索我国开放期刊的同行评议在新环境下面临的挑战与应走的特色道路,期望对我国开放获取期刊的同行评议提供有价值和可操作性的参考建议。 展开更多
关键词 开放获取 同行评议 The winnower
在线阅读 下载PDF
Winnowing指纹串匹配的重复数据删除算法 被引量:6
5
作者 王青松 葛慧 《计算机应用》 CSCD 北大核心 2018年第3期677-681,714,共6页
针对可变长度分块(CDC)的重复数据删除算法的分块大小难以控制、指纹计算对比开销大、需要预先设置参数问题,提出Winnowing指纹串匹配的重复数据删除算法(DWFM)。首先,在数据分块前引入分块大小预测模型,较准确地根据应用场景计算出合... 针对可变长度分块(CDC)的重复数据删除算法的分块大小难以控制、指纹计算对比开销大、需要预先设置参数问题,提出Winnowing指纹串匹配的重复数据删除算法(DWFM)。首先,在数据分块前引入分块大小预测模型,较准确地根据应用场景计算出合适的分块大小;然后,在计算指纹时采用ASCII/Unicode编码方式作为数据块指纹;最后,在确定分块边界时,提出指纹串匹配的分块算法,不需要预先设置参数,使得指纹计算和对比开销减少。在多种数据集上的实验结果表明,相比固定长度分块(FSP)和CDC算法,DWFM在数据的重删率上提升10%左右,在指纹计算和对比开销方面减少了18%左右。因此,DWFM的分块大小和边界更加符合数据特性,减少了参数设置对重复数据删除算法性能的影响,在处理不同类型的数据时,可以有效地消除更多的重复数据。 展开更多
关键词 重复数据删除 数据分块 指纹串匹配 winnowING 分块预测
在线阅读 下载PDF
基于CAPTCHA和Winnow算法的垃圾短信过滤研究 被引量:1
6
作者 王世卿 张燕丽 《计算机工程与设计》 CSCD 北大核心 2011年第1期313-315,357,共4页
为识别并过滤掉日益增多的垃圾短信,提出了基于全自动人机识别系统(CAPTCHA)和Winnow算法的过滤方法。在CAPTCHA方法中,根据用户能否正确辨认图片,人类和计算机能被辨别,该方法能有效地过滤计算机发送的组垃圾短信。改进的Winnow过滤器... 为识别并过滤掉日益增多的垃圾短信,提出了基于全自动人机识别系统(CAPTCHA)和Winnow算法的过滤方法。在CAPTCHA方法中,根据用户能否正确辨认图片,人类和计算机能被辨别,该方法能有效地过滤计算机发送的组垃圾短信。改进的Winnow过滤器可以直接处理原始文本,节省了中文分词时间,而且利用了复合分类思想,提高了分类精度。实验结果表明,CAPTCHA和改进的Winnow算法相结合能较准确地过滤掉垃圾短信。 展开更多
关键词 全自动人机识别系统 winnow算法 垃圾短信 中文分词 复合分类
在线阅读 下载PDF
基于Winnow算法的垃圾邮件过滤器研究 被引量:1
7
作者 陈峰 《计算机应用》 CSCD 北大核心 2009年第B12期21-23,26,共4页
实现了基本的Winnow算法、Balanced Winnow算法和带反馈学习功能的Winnow算法,并将其成功地应用于大规模垃圾邮件过滤,分别在SEWM2007和SEWM2008数据集上对上述三个算法进行了对比实验。实验结果表明,Winnow算法及其变体在分类效果和效... 实现了基本的Winnow算法、Balanced Winnow算法和带反馈学习功能的Winnow算法,并将其成功地应用于大规模垃圾邮件过滤,分别在SEWM2007和SEWM2008数据集上对上述三个算法进行了对比实验。实验结果表明,Winnow算法及其变体在分类效果和效率上都优于Logiistic算法。 展开更多
关键词 垃圾邮件过滤 winnow算法 LOGISTIC回归
在线阅读 下载PDF
基于改进的Winnow算法的剪接位点识别
8
作者 晏春 倪青山 +1 位作者 杜耀华 王正志 《生命科学研究》 CAS CSCD 2005年第3期218-226,共9页
DNA序列功能位点的识别是目前生物信息学领域的一个研究热点,剪接位点的识别就是其中之一.为了充分利用剪接位点的特征模式,从而更好地识别剪接位点,建立了一个基于改进Winnow算法的剪接位点识别系统.与其他方法相比较,改进的Winnow算... DNA序列功能位点的识别是目前生物信息学领域的一个研究热点,剪接位点的识别就是其中之一.为了充分利用剪接位点的特征模式,从而更好地识别剪接位点,建立了一个基于改进Winnow算法的剪接位点识别系统.与其他方法相比较,改进的Winnow算法具有更好的鲁棒性,适用于高维特征空间,能够融合多种模式信息,即使在包含很多不相关特征的情况下,也能有很好的性能.同时在训练的时候,对特征集进行了剪枝,把一些对识别几乎没有贡献的特征去除,这样做对结果的影响可以忽略,而且提高了算法的效率.通过实验验证,改进的Winnow算法可以很好地识别剪接位点,其多个性能指标达到或超过目前国际上流行的剪接位点识别软件. 展开更多
关键词 剪接位点识别 改进winnow算法 信息融合 乘法权更新方法 特征分析
在线阅读 下载PDF
基于Winnow的中文邮件分类器的设计
9
作者 朱巧明 周志军 李培峰 《电子学报》 EI CAS CSCD 北大核心 2005年第B12期2481-2484,共4页
本文首先通过建立实验用中文邮件语料库,提出了用Winnow算法实现邮件分类器,并讨论了其特点,然后,文章提出了通过建立分类规则库改善邮件分类器的分类效果.实验证明,该方法能有效提高邮件分类的可信度.
关键词 winnow 中文邮件分类 中文邮件语料库 分类器
在线阅读 下载PDF
Winnowing算法在作业剽窃检测中的应用 被引量:1
10
作者 李香云 葛华 《安徽科技学院学报》 2013年第4期42-45,共4页
本文介绍了文档剽窃检测算法——Winnowing算法。该算法利用划分字符串,哈希每个字符串的值,最后通过一定的选取策略选出某些哈希值作为文档的指纹,通过对指纹的比较判断不同文本间的相似度,并判断文档之间是否存在剽窃现象。
关键词 剽窃检测 winnowing算法 文档指纹
在线阅读 下载PDF
基于Winnow的中文邮件分类器的设计
11
作者 朱巧明 周志军 李培峰 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2005年第z1期807-812,共6页
首先通过建立实验用中文邮件语料库,提出了用Winnow算法实现邮件分类器,并讨论了其特点.然后,提出了通过建立分类规则库改善邮件分类器的分类效果.实验证明,该方法能有效提高邮件分类的可信度.
关键词 winnow 中文邮件分类 中文邮件语料库 分类器
在线阅读 下载PDF
基于Winnow算法的反垃圾邮件引擎的设计与实现 被引量:2
12
作者 张丽 黄东 《计算机技术与发展》 2006年第4期170-172,175,共4页
电子邮件(e-mail)是人们日常生活中不可缺少的通信手段之一,但是垃圾邮件却给人们带来了很大的危害。文中主要是针对中文垃圾邮件,给出了一种基于Winnow算法的基于邮件内容的反垃圾邮件引擎原型的设计,对于未知邮件可以达到较好的区分... 电子邮件(e-mail)是人们日常生活中不可缺少的通信手段之一,但是垃圾邮件却给人们带来了很大的危害。文中主要是针对中文垃圾邮件,给出了一种基于Winnow算法的基于邮件内容的反垃圾邮件引擎原型的设计,对于未知邮件可以达到较好的区分效果。首先对邮件的内容进行解码、分词,采用信息增益选取特征项;然后采用Winnow算法构造分类器;最后采用部分邮件样本进行测试,测试结果可以进行反馈学习。最后的测试数据分析表明系统达到了比较好的效果。 展开更多
关键词 垃圾邮件 文本分类 特征选择 特征提取 winnow算法 反馈
在线阅读 下载PDF
基于改进平衡Winnow算法的短信过滤系统 被引量:1
13
作者 闫红静 邸书灵 《微型机与应用》 2010年第19期10-12,18,共4页
将黑白名单技术与Balanced Winnow算法相结合,实现对垃圾短信的过滤。采用CHI特征提取算法并对权重计算方法进行改进,同时提出了去除训练样本中野点的想法,通过判定去除野点,减缓在训练过程中出现的抖动现象。实验表明这种改进对于提高... 将黑白名单技术与Balanced Winnow算法相结合,实现对垃圾短信的过滤。采用CHI特征提取算法并对权重计算方法进行改进,同时提出了去除训练样本中野点的想法,通过判定去除野点,减缓在训练过程中出现的抖动现象。实验表明这种改进对于提高训练速度及提高短信过滤的性能均有很好的作用。 展开更多
关键词 BALANCED winnow 短信过滤 CHI 野点
在线阅读 下载PDF
Substrate,Hormone,Winnowing,and Stratification Influence the Seed Germination of Ilex asprella(Hook.et Arn.)Champ.ex Benth
14
作者 Yuquan Huang Fan Wei +4 位作者 QingMa Yang Lin Jinpeng Huang Yanxia Zhu Danfeng Tang 《Phyton-International Journal of Experimental Botany》 SCIE 2023年第7期2105-2116,共12页
Ilex asprella(Hook.et Arn.)Champ.ex Benth is one of the most important traditional Chinese medicines in southern China.The seeds of Ilex asprella usually have extremely low germination due to their dormancy characteri... Ilex asprella(Hook.et Arn.)Champ.ex Benth is one of the most important traditional Chinese medicines in southern China.The seeds of Ilex asprella usually have extremely low germination due to their dormancy characteristics,which severely impacts the efficiency of seedling raising and increases labor costs.In this study,to improve the seed germination of I.asprella,the effects of germination substrate,hormone,winnowing,and stratification treatments on the seed germination of I.asprella were investigated.The results of the germination matrix showed that the highest germination percentage of 45.2%was achieved under the 20℃/10℃day/night temperature and vermiculite germination medium conditions.The results of hormone treatments revealed that 100–400 mg/L of gibberellin(GA)and 50–100 mg/L of salicylic acid(SA)were found to be effective in releasing the dormancy of I.asprella seeds.Moreover,winnowing could effectively eliminate unsaturated seeds and impurities,thus improving the seed germination of I.asprella.Furthermore,warm temperature(15℃)stratification could expand the temperature range of I.asprella’s seed germination,which was beneficial for seed germination of I.asprella and for seed nursery at room temperature in production practice.The present study obtained a method to break dormancy and increase seed germination in I.asprella,thereby forming a groundwork for improving the efficiency of large-scale planting of I.asprella. 展开更多
关键词 Ilex asprella seed germination SUBSTRATE winnowING HORMONE STRATIFICATION
在线阅读 下载PDF
Gender Identification on Twitter Using the Modified Balanced Winnow
15
作者 William Deitrick Zachary Miller +3 位作者 Benjamin Valyou Brian Dickinson Timothy Munson Wei Hu 《Communications and Network》 2012年第3期189-195,共7页
With the rapid growth of web-based social networking technologies in recent years, author identification and analysis have proven increasingly useful. Authorship analysis provides information about a document’s autho... With the rapid growth of web-based social networking technologies in recent years, author identification and analysis have proven increasingly useful. Authorship analysis provides information about a document’s author, often including the author’s gender. Men and women are known to write in distinctly different ways, and these differences can be successfully used to make a gender prediction. Making use of these distinctions between male and female authors, this study demonstrates the use of a simple stream-based neural network to automatically discriminate gender on manually labeled tweets from the Twitter social network. This neural network, the Modified Balanced Winnow, was employed in two ways;the effectiveness of data stream mining was initially examined with an extensive list of n-gram features. Feature selection techniques were then evaluated by drastically reducing the feature list using WEKA’s attribute selection algorithms. This study demonstrates the effectiveness of the stream mining approach, achieving an accuracy of 82.48%, a 20.81% increase above the baseline prediction. Using feature selection methods improved the results by an additional 16.03%, to an accuracy of 98.51%. 展开更多
关键词 GENDER IDENTIFICATION TWITTER MODIFIED BALANCED winnow Neural Networks Stream Data Mining Feature Selection
暂未订购
零信任环境下的多层次身份认证数据流安全检测算法 被引量:5
16
作者 顾健华 冯建华 +1 位作者 高泽芳 文成江 《现代电子技术》 北大核心 2025年第1期85-89,共5页
身份认证数据流中的敏感信息可能在传输过程中被攻击者截获,并用于恶意目的,导致隐私泄露、身份盗用等风险,为确保网络安全性,提高主体身份认证安全性,提出零信任环境下的多层次身份认证数据流安全检测算法。采用改进的文档指纹检测算... 身份认证数据流中的敏感信息可能在传输过程中被攻击者截获,并用于恶意目的,导致隐私泄露、身份盗用等风险,为确保网络安全性,提高主体身份认证安全性,提出零信任环境下的多层次身份认证数据流安全检测算法。采用改进的文档指纹检测算法实现多层次身份认证过程中主体和客体交互数据流安全监测。通过Rabin-Karp算法实现身份认证数据文档的分块,采用Winnow算法划分身份认证数据分块文档边界后,得到身份认证数据文档指纹,将其与指纹库中的指纹进行匹配对比,识别出多层次身份认证数据流中的异常数据,实现多层次身份认证数据流安全检测。实验结果表明,该算法具有较好的身份认证数据流安全检测能力,有效地降低了网络威胁频率,提升了网络安全性。 展开更多
关键词 零信任 多层次身份认证 数据流安全检测 文档指纹检测算法 Rabin-Karp算法 winnow算法
在线阅读 下载PDF
两级风选关键参数对叶丝质量的影响研究
17
作者 郭阳 汪涛 +4 位作者 宁程彬 王宇 刘先成 程德强 许志强 《科技创新与应用》 2025年第2期76-79,共4页
目前烟草行业主要从叶丝的净化和误剔率方面研究两级风选的控制技术,但鲜有研究其关键参数对风选后叶丝质量影响的报道。该项目在保证风选稳定性的基础上,从风选风量和除尘风量变化对烟丝感官质量和物理质量的影响程度入手,研究两级风... 目前烟草行业主要从叶丝的净化和误剔率方面研究两级风选的控制技术,但鲜有研究其关键参数对风选后叶丝质量影响的报道。该项目在保证风选稳定性的基础上,从风选风量和除尘风量变化对烟丝感官质量和物理质量的影响程度入手,研究两级风选的控制技术及方法。同时,对比分析风选前不同烟丝来料特性对风选效果的影响。研究结果表明,系统中风选风量的大小、除尘风量的占比对风选后烟丝感官质量影响重大,气流烘后烟丝因温度较高且含有大量蒸汽使其柔韧性及抗造碎性均较薄板烘后烟丝强,故风选后烟丝缠绕率较高。该研究结果可充分发挥两级风选设备对产品质量的贡献度,以及为该设备在工艺控制方面提供理论依据和技术支持。 展开更多
关键词 两级风选 风选风量 除尘风量 感官质量 物理质量 烟丝质量特性 风选稳定性
在线阅读 下载PDF
核桃壳仁可循环风选装置的设计与优化
18
作者 杨斌 宛双林 任博 《林业机械与木工设备》 2025年第6期17-22,共6页
针对核桃壳仁分离设备采用等截面腔体进行风选导致的核仁损失率较高的问题,设计了具有低速区的腔体结构,使得腔体内物料在气流作用下运动时,能够实现多次被风选的效果,进而降低核仁损失率。观察试验现象可知,随着腔体的变径宽度的增加,... 针对核桃壳仁分离设备采用等截面腔体进行风选导致的核仁损失率较高的问题,设计了具有低速区的腔体结构,使得腔体内物料在气流作用下运动时,能够实现多次被风选的效果,进而降低核仁损失率。观察试验现象可知,随着腔体的变径宽度的增加,壳仁分离设备的综合风选率呈现先增加后降低的趋势;随着风机频率的增大,综合清选率呈现先增加后降低的趋势。根据中心复合试验结果,采用Design-Expert 13完成了响应曲面优化,得到了综合清选率的预测模型,可循环风选的壳仁分离设备的最优参数搭配为:风机频率为46.31Hz,入风口倾角为84.96°,变径段宽度为95.22 mm。 展开更多
关键词 核桃 壳仁分离 风选 参数优化
在线阅读 下载PDF
一种基于Winnowing分块的重复数据删除备份与恢复系统设计与实现 被引量:3
19
作者 黄传波 胡晓勤 +1 位作者 马晓旭 王喆 《四川大学学报(自然科学版)》 CAS CSCD 北大核心 2012年第3期535-542,共8页
针对海量数据中存在的大量冗余信息,本文设计并实现了一种基于重复数据删除的文件备份与恢复系统,该系统采用改进的Winnowing动态分块算法,将文件分割成不同长度的数据块,并结合摘要算法、索引表、数据压缩等技术,确保服务器仅存储数据... 针对海量数据中存在的大量冗余信息,本文设计并实现了一种基于重复数据删除的文件备份与恢复系统,该系统采用改进的Winnowing动态分块算法,将文件分割成不同长度的数据块,并结合摘要算法、索引表、数据压缩等技术,确保服务器仅存储数据块唯一副本,以达到重复数据的删除目的.实验表明,该系统相比cwRsync能较更好的减少网络流量,并且相比传统的压缩技术能更进一步减少磁盘空间占用率. 展开更多
关键词 winnowING 重复数据删除 文件备份与恢复
原文传递
蛇床收获分离物的漂浮系数试验
20
作者 张良龙 王方艳 连政国 《农机化研究》 北大核心 2025年第9期187-192,共6页
目前,我国蛇床生产存在种植困难、机械化作业困难、收获损失大、人工成本高、工作效率低等问题。结合蛇床机械化收获过程中存在的问题,通过测定蛇床分离物的物性参数,确定了蛇床种子、叶片、茎秆的悬浮速度与漂浮系数,得出风选蛇床分离... 目前,我国蛇床生产存在种植困难、机械化作业困难、收获损失大、人工成本高、工作效率低等问题。结合蛇床机械化收获过程中存在的问题,通过测定蛇床分离物的物性参数,确定了蛇床种子、叶片、茎秆的悬浮速度与漂浮系数,得出风选蛇床分离物最佳风速。蛇床分离物种子、叶片、茎秆的漂浮系数分别为0.065~0.069、0.052~0.055、0.033~0.036,为降低蛇床种子机械化收获的损失提供有效的基础数据。试验结果表明,蛇床茎秆漂浮系数远大于种子、叶片的漂浮系数,可通过风选方式进行分选。蛇床种子与叶片的受风面积和质量都有所差异,综合之下蛇床种子与叶片的漂浮系数相似,使得仅靠风力清选有一定难度。因此,选择适宜的收获期,保持蛇床一定的含水率,既可减少叶片、茎秆的占比,又可提高各种分离物漂浮系数的差异。 展开更多
关键词 蛇床 风选 分离物 漂浮系数 悬浮速度
在线阅读 下载PDF
上一页 1 2 6 下一页 到第
使用帮助 返回顶部