近年来,大语言模型(large language models,LLMs)在自然语言处理(natural language processing,NLP)等领域取得了显著进展,展现出强大的语言理解与生成能力。然而,在实际应用过程中,大语言模型仍然面临诸多挑战。其中,幻觉(hallucinati...近年来,大语言模型(large language models,LLMs)在自然语言处理(natural language processing,NLP)等领域取得了显著进展,展现出强大的语言理解与生成能力。然而,在实际应用过程中,大语言模型仍然面临诸多挑战。其中,幻觉(hallucination)问题引起了学术界和工业界的广泛关注。如何有效检测大语言模型幻觉,成为确保其在文本生成等下游任务可靠、安全、可信应用的关键挑战。该研究着重对大语言模型幻觉检测方法进行综述:首先,介绍了大语言模型概念,进一步明确了幻觉的定义与分类,系统梳理了大语言模型从构建到部署应用全生命周期各环节的特点,并深入分析了幻觉的产生机制与诱因;其次,立足于实际应用需求,考虑到在不同任务场景下模型透明度的差异等因素,将幻觉检测方法划分为针对白盒模型和黑盒模型2类,并进行了重点梳理和深入对比;而后,分析总结了现阶段主流的幻觉检测基准,为后续开展幻觉检测奠定基础;最后,指出了大语言模型幻觉检测的各种潜在研究方法和新的挑战。展开更多
目的探讨我国药品临床综合评价政策的优化思路。方法采用ROST CM 6软件对国务院及各部委2014年1月至2024年10月出台的21项药品临床综合评价相关政策文件进行文本挖掘,构建政策一致性(PMC)指数模型,并对其进行量化分析,计算PMC指数和PMC...目的探讨我国药品临床综合评价政策的优化思路。方法采用ROST CM 6软件对国务院及各部委2014年1月至2024年10月出台的21项药品临床综合评价相关政策文件进行文本挖掘,构建政策一致性(PMC)指数模型,并对其进行量化分析,计算PMC指数和PMC凹陷指数,进行PMC曲面分析。结果21项政策文件评价结果中,仅有1项为优秀,2项为合格,其余均为良好;PMC指数均值为5.94,PMC凹陷指数均值为4.06,整体处于良好状态,但仍有提升空间。结论我国药品临床综合评价政策基本完善,建议加强各部委联合发文,畅通政策衔接;拓展政策内容中的评价对象,重视评价质量控制;强调评价结果服务于国家药物政策决策及对企业的反哺作用。展开更多
The inconsistence of firewall/VPN(Virtual Private Network) rule makes a huge maintainable cost. With development of Multinational Company, SOHO office, E-government the number of firewalls/VPN will increase rapidly. R...The inconsistence of firewall/VPN(Virtual Private Network) rule makes a huge maintainable cost. With development of Multinational Company, SOHO office, E-government the number of firewalls/VPN will increase rapidly. Rule table in stand-alone or network will be increased in geometric series accordingly. Checking the consistence of rule table manually is inadequate. A formal approach can define semantic consistence, make a theoretic foundation of intelligent management about rule tables. In this paper, a kind of formalization of host rules and network ones for auto rule-validation based on SET theory were proporsed and a rule validation scheme was defined. The analysis results show the superior performance of the methods and demonstrate its potential for the intelligent management based on rule tables.展开更多
目的基于文献计量学总结国内外仿制药领域的研究现状及趋势,为进一步研究提供参考。方法通过检索收集中国学术期刊全文数据库(CNKI)、Web of Science数据库中收录的相关文献,借助CiteSpace6.3R2、VOSview1.6.20、文献计量学在线分析平...目的基于文献计量学总结国内外仿制药领域的研究现状及趋势,为进一步研究提供参考。方法通过检索收集中国学术期刊全文数据库(CNKI)、Web of Science数据库中收录的相关文献,借助CiteSpace6.3R2、VOSview1.6.20、文献计量学在线分析平台等探讨本领域的作者机构合作、国家合作概况,并分析关键词共现、聚类、突现等,并对分析结果可视化展示。结果共纳入2564篇文献,其中中文文献641篇,英文文献1923篇。刊文趋势表明,国内外仿制药领域研究的发展趋势基本相同。目前本领域研究已有国际化趋势,但我国的国际合作中心性为0。关键词分析显示,国内外仿制药领域研究内容在保持一致的前提下各有侧重,其研究内容与热点可相互补充借鉴。结论系统分析了2000—2024年间仿制药领域的相关文献,总结了目前全球仿制药领域的研究现状及趋势,并进一步指出国内外研究的异同,可为本领域的进一步研究提供指导。展开更多
图像异常检测旨在识别并定位图像中的异常区域,针对现有算法中不同层次特征信息利用不充分的问题,提出了基于多层次特征融合网络的图像异常检测算法。通过使用融合了异常先验知识的伪异常数据生成算法,对训练集进行了异常数据扩充,将异...图像异常检测旨在识别并定位图像中的异常区域,针对现有算法中不同层次特征信息利用不充分的问题,提出了基于多层次特征融合网络的图像异常检测算法。通过使用融合了异常先验知识的伪异常数据生成算法,对训练集进行了异常数据扩充,将异常检测任务转化为监督学习任务;构建了多层次特征融合网络,将神经网络中不同层次特征进行融合,丰富了特征中的低层纹理信息和高层语义信息,使得用于异常检测的特征更具区分性;训练时,设计了分数约束损失和一致性约束损失,并结合特征约束损失对整个网络模型进行训练。实验结果表明,MVTec数据集上图像级检测接收机工作特性曲线下面积(area under the receiver operating characteristic, AUROC)平均值为98.7%,像素级定位AUROC平均值为97.9%,每区域重叠率平均值为94.2%,均高于现有的异常检测算法。展开更多
文摘近年来,大语言模型(large language models,LLMs)在自然语言处理(natural language processing,NLP)等领域取得了显著进展,展现出强大的语言理解与生成能力。然而,在实际应用过程中,大语言模型仍然面临诸多挑战。其中,幻觉(hallucination)问题引起了学术界和工业界的广泛关注。如何有效检测大语言模型幻觉,成为确保其在文本生成等下游任务可靠、安全、可信应用的关键挑战。该研究着重对大语言模型幻觉检测方法进行综述:首先,介绍了大语言模型概念,进一步明确了幻觉的定义与分类,系统梳理了大语言模型从构建到部署应用全生命周期各环节的特点,并深入分析了幻觉的产生机制与诱因;其次,立足于实际应用需求,考虑到在不同任务场景下模型透明度的差异等因素,将幻觉检测方法划分为针对白盒模型和黑盒模型2类,并进行了重点梳理和深入对比;而后,分析总结了现阶段主流的幻觉检测基准,为后续开展幻觉检测奠定基础;最后,指出了大语言模型幻觉检测的各种潜在研究方法和新的挑战。
文摘目的探讨我国药品临床综合评价政策的优化思路。方法采用ROST CM 6软件对国务院及各部委2014年1月至2024年10月出台的21项药品临床综合评价相关政策文件进行文本挖掘,构建政策一致性(PMC)指数模型,并对其进行量化分析,计算PMC指数和PMC凹陷指数,进行PMC曲面分析。结果21项政策文件评价结果中,仅有1项为优秀,2项为合格,其余均为良好;PMC指数均值为5.94,PMC凹陷指数均值为4.06,整体处于良好状态,但仍有提升空间。结论我国药品临床综合评价政策基本完善,建议加强各部委联合发文,畅通政策衔接;拓展政策内容中的评价对象,重视评价质量控制;强调评价结果服务于国家药物政策决策及对企业的反哺作用。
文摘The inconsistence of firewall/VPN(Virtual Private Network) rule makes a huge maintainable cost. With development of Multinational Company, SOHO office, E-government the number of firewalls/VPN will increase rapidly. Rule table in stand-alone or network will be increased in geometric series accordingly. Checking the consistence of rule table manually is inadequate. A formal approach can define semantic consistence, make a theoretic foundation of intelligent management about rule tables. In this paper, a kind of formalization of host rules and network ones for auto rule-validation based on SET theory were proporsed and a rule validation scheme was defined. The analysis results show the superior performance of the methods and demonstrate its potential for the intelligent management based on rule tables.
文摘目的基于文献计量学总结国内外仿制药领域的研究现状及趋势,为进一步研究提供参考。方法通过检索收集中国学术期刊全文数据库(CNKI)、Web of Science数据库中收录的相关文献,借助CiteSpace6.3R2、VOSview1.6.20、文献计量学在线分析平台等探讨本领域的作者机构合作、国家合作概况,并分析关键词共现、聚类、突现等,并对分析结果可视化展示。结果共纳入2564篇文献,其中中文文献641篇,英文文献1923篇。刊文趋势表明,国内外仿制药领域研究的发展趋势基本相同。目前本领域研究已有国际化趋势,但我国的国际合作中心性为0。关键词分析显示,国内外仿制药领域研究内容在保持一致的前提下各有侧重,其研究内容与热点可相互补充借鉴。结论系统分析了2000—2024年间仿制药领域的相关文献,总结了目前全球仿制药领域的研究现状及趋势,并进一步指出国内外研究的异同,可为本领域的进一步研究提供指导。
文摘图像异常检测旨在识别并定位图像中的异常区域,针对现有算法中不同层次特征信息利用不充分的问题,提出了基于多层次特征融合网络的图像异常检测算法。通过使用融合了异常先验知识的伪异常数据生成算法,对训练集进行了异常数据扩充,将异常检测任务转化为监督学习任务;构建了多层次特征融合网络,将神经网络中不同层次特征进行融合,丰富了特征中的低层纹理信息和高层语义信息,使得用于异常检测的特征更具区分性;训练时,设计了分数约束损失和一致性约束损失,并结合特征约束损失对整个网络模型进行训练。实验结果表明,MVTec数据集上图像级检测接收机工作特性曲线下面积(area under the receiver operating characteristic, AUROC)平均值为98.7%,像素级定位AUROC平均值为97.9%,每区域重叠率平均值为94.2%,均高于现有的异常检测算法。