期刊文献+
共找到354篇文章
< 1 2 18 >
每页显示 20 50 100
基于小规模异构语言模型一致性委员会的数据剪枝方法
1
作者 王凯文 王蕴哲 +3 位作者 谈威 傅启明 陆悠 陈建平 《计算机应用研究》 北大核心 2026年第1期110-119,共10页
大型语言模型(LLMs)的微调效果高度依赖于训练数据的质量,但现有的基于单模型困惑度的数据评估方法存在困惑度偏差(低困惑度样本可能仍被错误预测)和跨模型分歧(不同模型对同一样本的困惑度不一致)的局限性。为此,该研究提出了一种基于... 大型语言模型(LLMs)的微调效果高度依赖于训练数据的质量,但现有的基于单模型困惑度的数据评估方法存在困惑度偏差(低困惑度样本可能仍被错误预测)和跨模型分歧(不同模型对同一样本的困惑度不一致)的局限性。为此,该研究提出了一种基于异构小语言模型委员会一致性的方法,从两个方面评估数据价值:一方面计算多模型对同一数据样本的困惑度的变异系数来量化模型间分歧;另一方面结合预测结果与基准答案的相似性来计算预测难度。综合这两方面的评估结果,提出MMCS(多模型一致性)指标,用于高质量训练数据筛选。实验结果表明,基于MMCS筛选的数据在两种主流LLM和三个公开数据集上的微调性能优于传统方法,在36次对比实验中有27次取得最优效果,为高效数据剪枝提供了新的思路,证实了基于多模型分歧的评估方法在提升数据边际效益方面的有效性。 展开更多
关键词 大语言模型 数据修剪 多模型委员会 困惑度
在线阅读 下载PDF
The inextricable perplexity: Simple analysis on the theme of Ulysses
2
作者 王金凤 吴格非 《Sino-US English Teaching》 2010年第11期66-69,共4页
Joyce began his literary career with strong discontent with his social condition. Ulysses is Joyce's optimum work, which takes 3 Dublin characters' experience in one day as the main line to show the paralysation and... Joyce began his literary career with strong discontent with his social condition. Ulysses is Joyce's optimum work, which takes 3 Dublin characters' experience in one day as the main line to show the paralysation and crisis of the whole Western society, people's emptiness on their minds, loneliness on their feelings and labefaction on their spirits, also, it showed the inextricable perplexity. To treat the theme of inextricable perplexity, this paper is trying to set about the inextricable Catholic Church and identity problems, with the ideas of Alick West-the outstanding English Marxist literary critic of the 20th century. 展开更多
关键词 JOYCE ULYSSES Alick West inextricable perplexity
在线阅读 下载PDF
Perplexities in Development -An Interview with a Social Psychologist
3
《China Today》 1997年第1期49-51,共3页
关键词 An Interview with a Social Psychologist perplexities in Development
在线阅读 下载PDF
基于一主线两主体三阶段五过程的农产品安全性检测课程教学改革 被引量:1
4
作者 王文光 李劼 +2 位作者 刘伟 时静 戚飞 《农业工程》 2025年第1期154-158,共5页
以学生职业能力发展需求为出发点,以完成某个指标的检测为主线,在农产品安全性检测课程教学中,秉承以教师为主导、学生为主体教育理念,将教学过程分为课前探究、课中导学和课后拓展3个教学阶段,课中教学采用习旧知、析意义、知方法、学... 以学生职业能力发展需求为出发点,以完成某个指标的检测为主线,在农产品安全性检测课程教学中,秉承以教师为主导、学生为主体教育理念,将教学过程分为课前探究、课中导学和课后拓展3个教学阶段,课中教学采用习旧知、析意义、知方法、学技能和评效果5步高效互动,解决传统教学中学生学困率高、学习兴趣低的痛点。实现良好的育人效果,是一个可复制、可推广,学科知识内化,师生互动充分,能充分调动学生学习积极性的教学改革案例。 展开更多
关键词 农产品 安全性检测 学困率 学习兴趣 教学改革
在线阅读 下载PDF
基于困惑度计算的AIGC生成内容检测与应用
5
作者 赖永明 洪毅强 《龙岩学院学报》 2025年第2期14-19,共6页
AIGC已被广泛用于生成文章、故事、作业与其他类型的书面内容,在带来便利性的同时,也引发了人们对于学术文章和学生作业存在作弊可能性的担忧。为了应对这一风险,探索针对AIGC生成内容的技术检测方法,提出了一种基于已开放获取的GPT-2... AIGC已被广泛用于生成文章、故事、作业与其他类型的书面内容,在带来便利性的同时,也引发了人们对于学术文章和学生作业存在作弊可能性的担忧。为了应对这一风险,探索针对AIGC生成内容的技术检测方法,提出了一种基于已开放获取的GPT-2预训练模型权重,在自主构建的数据集上,以滑动窗口方式计算上下文文本困惑度值,用以检测输入文本是否属于AIGC生成内容,并将其应用至学生作业检测。结果显示,该方法有效地区分了AIGC生成内容与学生编写内容,以低成本、高效率的方式解决了AIGC引发的抄袭作弊问题。 展开更多
关键词 AIGC GPT 困惑度 作弊检测 分类
在线阅读 下载PDF
基于动态主题情感模型的文本聚类算法
6
作者 胡萍 《吉林大学学报(理学版)》 北大核心 2025年第2期528-536,共9页
针对目前已有的相关主题模型中,对大众情感因素考虑不足,难以精准挖掘,同时对社交文本的实时动态演化考虑弱化了模型聚类能力的问题,通过在模型中增加情感层以提取社交文本情感极性特征,并引入先验分布函数,提出一种基于动态主题情感模... 针对目前已有的相关主题模型中,对大众情感因素考虑不足,难以精准挖掘,同时对社交文本的实时动态演化考虑弱化了模型聚类能力的问题,通过在模型中增加情感层以提取社交文本情感极性特征,并引入先验分布函数,提出一种基于动态主题情感模型的文本聚类算法.利用真实新冠疫情Twitter文本数据集进行实验,实验结果表明,该模型的性能优于基线模型,提高了情感特征区分度,使文本主题与对应的情感极性联合生成时间节点,进而使模型有处理时间演化的能力. 展开更多
关键词 动态主题情感模型 文本挖掘 情感标签 时间戳 文本聚类 困惑度
在线阅读 下载PDF
Utilizing Fine-Tuning of Large Language Models for Generating Synthetic Payloads:Enhancing Web Application Cybersecurity through Innovative Penetration Testing Techniques
7
作者 Stefan Cirkovic Vladimir Mladenovic +2 位作者 Siniša Tomic Dalibor Drljaca Olga Ristic 《Computers, Materials & Continua》 2025年第3期4409-4430,共22页
With the increasing use of web applications,challenges in the field of cybersecurity are becoming more complex.This paper explores the application of fine-tuned large language models(LLMs)for the automatic generation ... With the increasing use of web applications,challenges in the field of cybersecurity are becoming more complex.This paper explores the application of fine-tuned large language models(LLMs)for the automatic generation of synthetic attacks,including XSS(Cross-Site Scripting),SQL Injections,and Command Injections.A web application has been developed that allows penetration testers to quickly generate high-quality payloads without the need for in-depth knowledge of artificial intelligence.The fine-tuned language model demonstrates the capability to produce synthetic payloads that closely resemble real-world attacks.This approach not only improves the model’s precision and dependability but also serves as a practical resource for cybersecurity professionals to enhance the security of web applications.The methodology and structured implementation underscore the importance and potential of advanced language models in cybersecurity,illustrating their effectiveness in generating high-quality synthetic data for penetration testing purposes.The research results demonstrate that this approach enables the identification of vulnerabilities that traditional methods may not uncover,providing deeper insights into potential threats and enhancing overall security measures.The performance evaluation of the model indicated satisfactory results,while further hyperparameter optimization could improve accuracy and generalization capabilities.This research represents a significant step forward in improving web application security and opens new opportunities for the use of LLMs in security testing,thereby contributing to the development of more effective cybersecurity strategies. 展开更多
关键词 LLM GPT-2 XSS SQL injection command injection evaluation loss perplexity
在线阅读 下载PDF
特瑞尔“光之场域”与后现代“迷茫幻游”:以《阿顿王朝》为中心的感知研究
8
作者 傅春禹 《上海视觉》 2025年第2期1-9,共9页
光艺术既能丰富视觉,有时又会使视觉迷失。本文将特瑞尔的光艺术置入后现代的语境之中,从多学科角度探寻其诸多“光场”在呈现和感知方式上与后现代“迷茫幻游”征候间的共情。文章将这些光设计中所涉技术和目的提炼为“场域屏蔽”“视... 光艺术既能丰富视觉,有时又会使视觉迷失。本文将特瑞尔的光艺术置入后现代的语境之中,从多学科角度探寻其诸多“光场”在呈现和感知方式上与后现代“迷茫幻游”征候间的共情。文章将这些光设计中所涉技术和目的提炼为“场域屏蔽”“视觉聚焦”“感知失焦”三个层面,并以此阐明特瑞尔始终宣谕的“先抑后扬”和“大道至简”的东方哲思,进而从另一种角度洞察其沉浸与慢赏体验背后所隐含对心灵的自省和疗愈。 展开更多
关键词 詹姆斯·特瑞尔 《阿顿王朝》 光之场域 迷茫幻游 后现代 视觉感知
在线阅读 下载PDF
“保钓曲未散,人已迟暮年”:小说《昨日之怒》《惑》《远方有风雷》评析
9
作者 刘玉山 《黑河学院学报》 2025年第10期135-139,共5页
20世纪70年代中国台湾留美学生参与的保钓运动对他们的人生轨迹产生了一定的影响,相应由三位当事人先后创作出保钓题材三部小说《昨日之怒》《惑》和《远方有风雷》,小说富含当年保钓运动的实况记载,参加保钓运动的原因及背景、保钓左... 20世纪70年代中国台湾留美学生参与的保钓运动对他们的人生轨迹产生了一定的影响,相应由三位当事人先后创作出保钓题材三部小说《昨日之怒》《惑》和《远方有风雷》,小说富含当年保钓运动的实况记载,参加保钓运动的原因及背景、保钓左右派的斗争、保钓左派的读书会和对保钓历史意义在小说中得到充分体现。 展开更多
关键词 《昨日之怒》 《惑》 《远方有风雷》 保钓运动 留美学生
在线阅读 下载PDF
中华优秀传统文化融入大学生职业生涯教育的历史进程、现实困惑与路径优化
10
作者 唐艳 《衡阳师范学院学报》 2025年第1期135-141,共7页
中华优秀传统文化融入大学生职业生涯教育经历了初步尝试、徘徊停滞、恢复发展、主动融入与创新等四个发展阶段,面临着教育目标不够明确、教育内容缺乏系统性、教育方式不能满足本土化教学需要等现实困惑。要想使中华优秀传统文化更好... 中华优秀传统文化融入大学生职业生涯教育经历了初步尝试、徘徊停滞、恢复发展、主动融入与创新等四个发展阶段,面临着教育目标不够明确、教育内容缺乏系统性、教育方式不能满足本土化教学需要等现实困惑。要想使中华优秀传统文化更好地融入大学生职业生涯教育,就要明确以“立德树人”为核心价值的教育目标,形成以“刚健自强”为核心精神的教育内容体系,构建以“因材施教”为核心理念的教育方法体系。 展开更多
关键词 中华优秀传统文化 大学生职业生涯教育 历史进程 现实困惑 路径优化
在线阅读 下载PDF
基于权重微博链的改进LDA微博主题模型 被引量:9
11
作者 李鹏 于岩 +2 位作者 李英乐 李星 何赞园 《计算机应用研究》 CSCD 北大核心 2016年第7期2018-2021,共4页
社交网络尤其是微博中含有大量的短文本。短文本不同于传统的文本,其携带的语义特征信息密度低,很难对其进行准确的主题挖掘。针对这一问题,提出根据微博发布时间与原创、转发、评论微博等社交行为信息分配权重,使用背景知识丰富语义特... 社交网络尤其是微博中含有大量的短文本。短文本不同于传统的文本,其携带的语义特征信息密度低,很难对其进行准确的主题挖掘。针对这一问题,提出根据微博发布时间与原创、转发、评论微博等社交行为信息分配权重,使用背景知识丰富语义特征的微博链结构与基于此改进的LDA主题模型。实验结果表明,相比于标准的LDA模型,本模型的perplexity值更低,即具有较低的预测不确定度。 展开更多
关键词 短文本 主题挖掘 微博链 潜在狄利克雷分布 perplexITY
在线阅读 下载PDF
一种基于LDA主题模型的话题发现方法 被引量:22
12
作者 郭蓝天 李扬 +2 位作者 慕德俊 杨涛 李哲 《西北工业大学学报》 EI CAS CSCD 北大核心 2016年第4期698-702,共5页
话题发现是提取热点话题并掌握其演化规律的关键技术之一。针对社交网络中海量短文本信息具有高维性导致主题模型难以处理以及主题分布不均导致主题不明确的问题,提出一种基于LDA(latent dirichlet allocation)主题模型的CBOW-LDA主题... 话题发现是提取热点话题并掌握其演化规律的关键技术之一。针对社交网络中海量短文本信息具有高维性导致主题模型难以处理以及主题分布不均导致主题不明确的问题,提出一种基于LDA(latent dirichlet allocation)主题模型的CBOW-LDA主题建模方法,通过引入基于CBOW(continuous bag-of-word)模型的词向量化方法对目标语料进行相似词的聚类,能够有效降低LDA模型输入文本的维度,并且使主题更明确。通过在真实数据集上计算分析,与现有基于词频权重的词向量化LDA方法相比,在相同主题词数情况下困惑度可降低约3%。 展开更多
关键词 词向量 LDA模型 话题发现 困惑度
在线阅读 下载PDF
作者主题演化模型及其在研究兴趣演化分析中的应用 被引量:25
13
作者 史庆伟 乔晓东 +1 位作者 徐硕 农国武 《情报学报》 CSSCI 北大核心 2013年第9期912-919,共8页
从海量科技文献中自动挖掘隐含主题、研究人员的研究兴趣及其演化规律是信息服务迈向知识服务需要解决的关键问题之一。目前的方法多从静态的角度分析文献主题、科研人员的研究兴趣,而演化分析的方法主要集中文档的内部特征,即文档内... 从海量科技文献中自动挖掘隐含主题、研究人员的研究兴趣及其演化规律是信息服务迈向知识服务需要解决的关键问题之一。目前的方法多从静态的角度分析文献主题、科研人员的研究兴趣,而演化分析的方法主要集中文档的内部特征,即文档内容本身,很少考虑作者等外部特征。基于此,本文在AT和ToT模型的基础上构建了作者主题演化(AToT)模型,并给出了一种估计AToT模型参数的吉布斯采样方法。该模型集成了AT和ToT模型的优势,不仅可以揭示科技文献中隐含的主题、作者的研究兴趣,而且可以挖掘研究兴趣随时间变化的规律。最后,以1740篇NIPS会议论文集作为实验数据,通过与AT模型的对比分析验证了AToT模型的可行性和有效性。 展开更多
关键词 主题模型 作者主题演化模型 研究兴趣演化分析 吉布斯采样 困惑度
在线阅读 下载PDF
现代汉语熵的计算及语言模型中稀疏事件的概率估计 被引量:7
14
作者 黄萱菁 吴立德 +1 位作者 郭以昆 刘秉伟 《电子学报》 EI CAS CSCD 北大核心 2000年第8期110-112,共3页
文本文在大规模语料的基础上 ,利用语言模型中稀疏事件的概率估计方法对汉语的熵进行计算 ,并讨论了语料规模等因素对熵的影响 .在 4年的人民日报的语料规模下 ,所求得的零阶熵、一阶熵、二阶熵分别为 9 6 2 ,6 18和 4 89比特 .
关键词 现代汉语 语言模型 稀疏事件 概率估计
在线阅读 下载PDF
审稿专家的困惑及应对措施 被引量:13
15
作者 曾莉 吴惠勤 +2 位作者 黄晓兰 宾仁茂 陈丽淳 《编辑学报》 CSSCI 北大核心 2008年第3期243-244,共2页
从分析部分审稿意见不能令期刊编辑部满意的情况出发,找到困扰审稿专家的症结。认为在审稿意见书中应将刊物对各种类型的稿件的态度明确告知审稿专家,以方便审稿专家审稿。
关键词 审稿意见书设计 科技期刊 审稿专家 困惑
在线阅读 下载PDF
语言模型复杂度度量与汉语熵的估算 被引量:7
16
作者 张仰森 曹元大 俞士汶 《小型微型计算机系统》 CSCD 北大核心 2006年第10期1931-1934,共4页
运用信息论理论,从信息熵的角度对统计语言模型的复杂度度量方法进行了定量化的推理与描述,得出了语言模型对语言熵的估算值越小,说明该模型对语言的描述越精确以及两个n-1元文法模型插值形成的新模型,其性能好于n-1元文法模型,但不及n... 运用信息论理论,从信息熵的角度对统计语言模型的复杂度度量方法进行了定量化的推理与描述,得出了语言模型对语言熵的估算值越小,说明该模型对语言的描述越精确以及两个n-1元文法模型插值形成的新模型,其性能好于n-1元文法模型,但不及n元文法模型的结论.并对应用语言模型估算汉语信息熵的方法进行了探讨. 展开更多
关键词 语言模型 复杂度 语言模型评价
在线阅读 下载PDF
大学生人际信任在成人依恋和人际困扰间的中介作用 被引量:10
17
作者 许学华 麻丽丽 李菲 《中国心理卫生杂志》 CSSCI CSCD 北大核心 2016年第11期864-868,共5页
目的:探讨大学生人际信任在成人依恋和人际困扰间的中介作用。方法:选取323名大学生,采用亲密关系经历量表(ECR)测量成人依恋(包括依恋焦虑和依恋回避2个维度),人际信任量表(ITS)测量人际信任、人际关系综合诊断量表(IRCDS)测量人际困... 目的:探讨大学生人际信任在成人依恋和人际困扰间的中介作用。方法:选取323名大学生,采用亲密关系经历量表(ECR)测量成人依恋(包括依恋焦虑和依恋回避2个维度),人际信任量表(ITS)测量人际信任、人际关系综合诊断量表(IRCDS)测量人际困扰。根据ECR得分将研究对象分为安全型依恋者和不安全型依恋者(不安全型依恋包括恐惧型、专注型和冷漠型依恋)。结果:大学生成人依恋类型以恐惧型为主(占39.0%);安全型依恋者的ITS得分高于3种不安全依恋者,安全型和冷漠型依恋者的IRCDS得分低于专注型和恐惧型依恋者(均P<0.001);通径分析表明,人际信任在依恋焦虑和依恋回避影响人际困扰中均起部分中介作用,中介效应量占总效应量的比例分别为5.3%和14.2%。结论:大学生成人依恋状况值得重视,成人依恋既直接预测人际困扰,又通过人际信任间接预测人际困扰。 展开更多
关键词 大学生 成人依恋 人际信任 人际困扰 中介效应
在线阅读 下载PDF
大学教学的品性、发展困惑及改革路径选择 被引量:31
18
作者 何云峰 丁三青 《中国高教研究》 CSSCI 北大核心 2012年第4期104-107,共4页
作为大学原初职能的教学本应具有丰富内涵。站在时代发展高度,重新审视得出大学教学具有哲学性、生命性、学术性、实践性和复杂性等特性,并着重分析反思了大学教学改革表面繁荣背后存在的大学教学中心虚位、教学主体缺位、管理主体错位... 作为大学原初职能的教学本应具有丰富内涵。站在时代发展高度,重新审视得出大学教学具有哲学性、生命性、学术性、实践性和复杂性等特性,并着重分析反思了大学教学改革表面繁荣背后存在的大学教学中心虚位、教学主体缺位、管理主体错位、教学改革难以上位的发展困惑,针对性地指出相应的改革路径。 展开更多
关键词 大学教学 教学品性 发展困惑 教学改革
原文传递
科技文献中作者研究兴趣动态发现 被引量:13
19
作者 史庆伟 李艳妮 郭朋亮 《计算机应用》 CSCD 北大核心 2013年第11期3080-3083,共4页
针对挖掘大规模科技文献中作者、主题和时间及其关系的问题,考虑科技文献的内外部特征,提出了一个作者主题演化(AToT)模型。模型中文档表示为一定概率比例的主题混合体,每个主题对应一个词项上的多项分布和一个随时间变化的贝塔分布,主... 针对挖掘大规模科技文献中作者、主题和时间及其关系的问题,考虑科技文献的内外部特征,提出了一个作者主题演化(AToT)模型。模型中文档表示为一定概率比例的主题混合体,每个主题对应一个词项上的多项分布和一个随时间变化的贝塔分布,主题-词项分布不仅由文档中单词共现决定,同时受文档时间戳影响,每个作者也对应一个主题上的多项分布。主题-词项分布与作者-主题分布分别用来描述主题随时间变化的规律和作者研究兴趣的变化规律。采用吉布斯采样的方法,通过学习文档集可以获得模型的参数。在1700篇NIPS会议论文集上的实验结果显示,作者主题演化模型可以描述文档集中潜在的主题演化规律,动态发现作者研究兴趣的变化,可以预测与主题相关的作者,与作者主题模型相比计算困惑度更低。 展开更多
关键词 主题模型 时序分析 无监督学习 文本模型 困惑度
在线阅读 下载PDF
科技情报分析中LDA主题模型最优主题数确定方法研究 被引量:157
20
作者 关鹏 王曰芬 《现代图书情报技术》 CSSCI 2016年第9期42-50,共9页
【目的】有效确定科技情报分析中LDA主题模型的最优主题数目。【方法】利用主题相似度度量潜在主题之间的差异,同时结合困惑度提出一种确定LDA最优主题数目的方法,该方法既考虑主题抽取效果同时也考虑模型对新文档的泛化能力。【结果】... 【目的】有效确定科技情报分析中LDA主题模型的最优主题数目。【方法】利用主题相似度度量潜在主题之间的差异,同时结合困惑度提出一种确定LDA最优主题数目的方法,该方法既考虑主题抽取效果同时也考虑模型对新文档的泛化能力。【结果】获取国内新能源领域的科技文献作为数据集,实证结果表明本文提出的最优LDA主题数确定方法与单纯使用困惑度相比,具有更高的主题抽取查准率(91.67%)、F值(86.27%)及科技文献推荐精度(71.25%)。【局限】未针对其他类型的数据集进行新方法的验证,如微博短文本、XML文档等。【结论】本文方法能够有效地从科技文献数据集中抽取辨识度较高的主题,并能够提高科技文献推荐效果。 展开更多
关键词 LDA主题模型 相似度 困惑度 科技情报分析
原文传递
上一页 1 2 18 下一页 到第
使用帮助 返回顶部