期刊文献+
共找到44篇文章
< 1 2 3 >
每页显示 20 50 100
DiTing:A large-scale Chinese seismic benchmark dataset for artificial intelligence in seismology 被引量:11
1
作者 Ming Zhao Zhuowei Xiao +1 位作者 Shi Chen Lihua Fang 《Earthquake Science》 2023年第2期84-94,共11页
In recent years,artificial intelligence technology has exhibited great potential in seismic signal recognition,setting off a new wave of research.Vast amounts of high-quality labeled data are required to develop and a... In recent years,artificial intelligence technology has exhibited great potential in seismic signal recognition,setting off a new wave of research.Vast amounts of high-quality labeled data are required to develop and apply artificial intelligence in seismology research.In this study,based on the 2013–2020 seismic cataloging reports of the China Earthquake Networks Center,we constructed an artificial intelligence seismological training dataset(“DiTing”)with the largest known total time length.Data were recorded using broadband and short-period seismometers.The obtained dataset included 2,734,748 threecomponent waveform traces from 787,010 regional seismic events,the corresponding P-and S-phase arrival time labels,and 641,025 P-wave first-motion polarity labels.All waveforms were sampled at 50 Hz and cut to a time length of 180 s starting from a random number of seconds before the occurrence of an earthquake.Each three-component waveform contained a considerable amount of descriptive information,such as the epicentral distance,back azimuth,and signal-to-noise ratios.The magnitudes of seismic events,epicentral distance,signal-to-noise ratio of P-wave data,and signal-to-noise ratio of S-wave data ranged from 0 to 7.7,0 to 330 km,–0.05 to 5.31 dB,and–0.05 to 4.73 dB,respectively.The dataset compiled in this study can serve as a high-quality benchmark for machine learning model development and data-driven seismological research on earthquake detection,seismic phase picking,first-motion polarity determination,earthquake magnitude prediction,early warning systems,and strong ground-motion prediction.Such research will further promote the development and application of artificial intelligence in seismology. 展开更多
关键词 artificial intelligence benchmark dataset earthquake detection seismic phase identification first-motion polarity
在线阅读 下载PDF
QpefBD:A Benchmark Dataset Applied to Machine Learning for Minute-Scale Quantitative Precipitation Estimation and Forecasting 被引量:2
2
作者 Anyuan XIONG Na LIU +5 位作者 Yujia LIU Shulin ZHI Linlin WU Yongjian XIN Yan SHI Yunjian ZHAN 《Journal of Meteorological Research》 SCIE CSCD 2022年第1期93-106,共14页
Nowcasts of strong convective precipitation and radar-based quantitative precipitation estimations have always been hot yet challenging issues in meteorological sciences.Data-driven machine learning,especially deep le... Nowcasts of strong convective precipitation and radar-based quantitative precipitation estimations have always been hot yet challenging issues in meteorological sciences.Data-driven machine learning,especially deep learning,provides a new technical approach for the quantitative estimation and forecasting of precipitation.A high-quality,large-sample,and labeled training dataset is critical for the successful application of machine-learning technology to a specific field.The present study develops a benchmark dataset that can be applied to machine learning for minutescale quantitative precipitation estimation and forecasting(QpefBD),containing 231,978 samples of 3185 heavy precipitation events that occurred in 6 provinces of central and eastern China from April to October 2016-2018.Each individual sample consists of 8 products of weather radars at 6-min intervals within the time window of the corresponding event and products of 27 physical quantities at hourly intervals that describe the atmospheric dynamic and thermodynamic conditions.Two data labels,i.e.,ground precipitation intensity and areal coverage of heavy precipitation at 6-min intervals,are also included.The present study describes the basic components of the dataset and data processing and provides metrics for the evaluation of model performance on precipitation estimation and forecasting.Based on these evaluation metrics,some simple and commonly used methods are applied to evaluate precipitation estimates and forecasts.The results can serve as the benchmark reference for the performance evaluation of machine learning models using this dataset.This paper also gives some suggestions and scenarios of the QpefBD application.We believe that the application of this benchmark dataset will promote interdisciplinary collaboration between meteorological sciences and artificial intelligence sciences,providing a new way for the identification and forecast of heavy precipitation. 展开更多
关键词 machine learning benchmark dataset quantitative precipitation estimation precipitation forecast
原文传递
Local earthquakes detection: A benchmark dataset of 3-component seismograms built on a global scale 被引量:5
3
作者 Fabrizio Magrini Dario Jozinovic +2 位作者 Fabio Cammarano Alberto Michelini Lapo Boschi 《Artificial Intelligence in Geosciences》 2020年第1期1-10,共10页
Machine learning is becoming increasingly important in scientific and technological progress,due to its ability to create models that describe complex data and generalize well.The wealth of publicly-available seismic ... Machine learning is becoming increasingly important in scientific and technological progress,due to its ability to create models that describe complex data and generalize well.The wealth of publicly-available seismic data nowadays requires automated,fast,and reliable tools to carry out a multitude of tasks,such as the detection of small,local earthquakes in areas characterized by sparsity of receivers.A similar application of machine learning,however,should be built on a large amount of labeled seismograms,which is neither immediate to obtain nor to compile.In this study we present a large dataset of seismograms recorded along the vertical,north,and east components of 1487 broad-band or very broad-band receivers distributed worldwide;this includes 629,0953-component seismograms generated by 304,878 local earthquakes and labeled as EQ,and 615,847 ones labeled as noise(AN).Application of machine learning to this dataset shows that a simple Convolutional Neural Network of 67,939 parameters allows discriminating between earthquakes and noise single-station recordings,even if applied in regions not represented in the training set.Achieving an accuracy of 96.7,95.3,and 93.2% on training,validation,and test set,respectively,we prove that the large variety of geological and tectonic settings covered by our data supports the generalization capabilities of the algorithm,and makes it applicable to real-time detection of local events.We make the database publicly available,intending to provide the seismological and broader scientific community with a benchmark for time-series to be used as a testing ground in signal processing. 展开更多
关键词 benchmark dataset Earthquake detection algorithm Supervised machine leaming SEISMOLOGY
在线阅读 下载PDF
面向人脸视频防伪检测的大规模中文数据测评基准
4
作者 贝毅君 娄恒瑞 +7 位作者 高克威 宋杰 王蕊 金苍宏 雷杰 宋明黎 胡秉德 冯尊磊 《中国图象图形学报》 北大核心 2026年第1期82-98,共17页
目的针对生成式人工智能(artificial intelligence generated content,AIGC)技术生成的高逼真伪造人脸视频对人类视觉感知的欺骗性问题,以及当前人脸防伪检测算法评估体系在中文数据层面有效性和应用性验证方面的空白,旨在构建面向中文... 目的针对生成式人工智能(artificial intelligence generated content,AIGC)技术生成的高逼真伪造人脸视频对人类视觉感知的欺骗性问题,以及当前人脸防伪检测算法评估体系在中文数据层面有效性和应用性验证方面的空白,旨在构建面向中文场景的量化评估基准以推动防伪检测技术迭代发展。方法提出面向大规模中文人脸伪造视频的CHN-DF(Chinese-deepfake)数据集,详细阐述数据采集、伪造样本生成及质量评估的全流程构建方法。通过多维度实验验证数据集复杂性,兼顾跨模态伪造技术覆盖、环境干扰因子完备性等复杂因素,并建立基于深度检测模型的系统性评测基准。结果发布全球首个包含434727样本的中文人脸视频防伪数据集,实验显示该数据集鉴别难度高,在16种包含SOTA(state-of-the-art)与主流防伪模型的测评中视觉与视听结合的准确率分别控制在85%与70%以下。构建的评测基准覆盖了视觉与听觉模态场景,在跨域泛化性测试中显示模型准确率性能波动平均幅度达19.6%,显著揭示现有算法的应用局限性。结论构建的中文防伪评测基准有效填补领域空白,通过系统性实验阐明数据集特性与算法性能的关联机制,提出针对模型鲁棒性增强、跨模态泛化能力提升等关键发展方向,为面向中文场景的量化评估以及人脸视频防伪技术的实际部署提供数据支撑与实践指导。CHN-DF数据集在线发布地址为:https://doi.org/10.57760/sciencedb.j00240.00067和https://github.com/HengruiLou/CHN-DF. 展开更多
关键词 深度伪造 人脸伪造视频 人脸防伪评测基准 中文数据集 多模态
原文传递
面向长文档检索增强生成的基准数据集
5
作者 刘宜欣 刘祥根 +3 位作者 刘文 邓洪波 张子野 穆骅 《计算机应用》 北大核心 2026年第2期386-394,共9页
随着预训练语言模型(PLM)的发展,检索增强生成(RAG)作为一个新兴任务受到广泛关注。全面客观地评价RAG可以揭示现有方法的局限并指明研究方向,然而,现有的研究针对RAG的系统性评估基准不足,尤其是在长文档场景中。针对这一问题,提出一... 随着预训练语言模型(PLM)的发展,检索增强生成(RAG)作为一个新兴任务受到广泛关注。全面客观地评价RAG可以揭示现有方法的局限并指明研究方向,然而,现有的研究针对RAG的系统性评估基准不足,尤其是在长文档场景中。针对这一问题,提出一种基于焦点片段的自动问答构建策略,旨在高效而准确地构建大规模问答数据集。基于该策略,构建首个专门针对长文档的双语RAG评估基准数据集LoRAG,涵盖法律、金融和文学等多领域的英汉双语文档,英文文档平均长度达5.7万词元,中文文档平均长度为7.6万词元。通过LoRAG数据集,对RAG的检索与生成这两个关键阶段进行系统性实验。在检索阶段,评估text-embedding-ada-002、bge-large系列、bge-m3和Multilingual-E5-large-instruct等多种主流嵌入模型,并引入bge-reranker-v2-m3重排序模型进行性能优化与对比;在生成阶段,全面测试Vicuna-13B、ChatGLM2-6B、Llama2-7B和Claude2等代表性大语言模型(LLM)。实验结果表明,所构建数据集LoRAG有效揭示了当前嵌入方法在长文档检索中的定位难题,以及LLM在生成过程中权衡相关性与精炼性之间的局限性,这些为后续方法的改进提供了清晰的研究方向。 展开更多
关键词 检索增强生成 大型语言模型 长文档处理 基准数据集 自动问答构建
在线阅读 下载PDF
Monocular 3D Human Pose Estimation for REBA Ergonomics: A Critical Review of Recent Advances
6
作者 Ahmad Mwfaq Bataineh Ahmad Sufril Azlan Mohamed 《Computers, Materials & Continua》 2025年第7期93-124,共32页
Advancements in deep learning have considerably enhanced techniques for Rapid Entire Body Assess-ment(REBA)pose estimation by leveraging progress in three-dimensional human modeling.This survey provides an extensive o... Advancements in deep learning have considerably enhanced techniques for Rapid Entire Body Assess-ment(REBA)pose estimation by leveraging progress in three-dimensional human modeling.This survey provides an extensive overview of recent advancements,particularly emphasizing monocular image-based methodologies and their incorporation into ergonomic risk assessment frameworks.By reviewing literature from 2016 to 2024,this study offers a current and comprehensive analysis of techniques,existing challenges,and emerging trends in three-dimensional human pose estimation.In contrast to traditional reviews organized by learning paradigms,this survey examines how three-dimensional pose estimation is effectively utilized within musculoskeletal disorder(MSD)assessments,focusing on essential advancements,comparative analyses,and ergonomic implications.We extend existing image-based clas-sification schemes by examining state-of-the-art two-dimensional models that enhance monocular three-dimensional prediction accuracy and analyze skeleton representations by evaluating joint connectivity and spatial configuration,offering insights into how structural variability influences model robustness.A core contribution of this work is the identification of a critical research gap:the limited exploration of estimating REBA scores directly from single RGB images using monocular three-dimensional pose estimation.Most existing studies depend on depth sensors or sequential inputs,limiting applicability in real-time and resource-constrained environments.Our review emphasizes this gap and proposes future research directions to develop accurate,lightweight,and generalizable models suitable for practical deployment.This survey is a valuable resource for researchers and practitioners in computer vision,ergonomics,and related disciplines,offering a structured understanding of current methodologies and guidance for future innovation in three-dimensional human pose estimation for REBA-based ergonomic risk assessment. 展开更多
关键词 Human posture estimation deep neural networks three-dimensional analysis benchmark datasets rapid entire body assessment(REBA)
在线阅读 下载PDF
WHU-RuR:高分遥感影像农村(高标准农田)道路提取基准数据集 被引量:2
7
作者 王宁静 王心宇 +4 位作者 潘洋 卢晓燕 姚顽强 钟燕飞 龚健雅 《遥感学报》 北大核心 2025年第4期857-866,共10页
高标准农田建设是提升中国粮食生产能力和保障粮食安全的关键举措。其中,农村道路(高标准农田)如田间道和生产路,是高标准农田基础设施建设的核心内容之一。如何利用高分辨率遥感卫星影像快速准确地提取农村道路,对于高标准农田建设的... 高标准农田建设是提升中国粮食生产能力和保障粮食安全的关键举措。其中,农村道路(高标准农田)如田间道和生产路,是高标准农田基础设施建设的核心内容之一。如何利用高分辨率遥感卫星影像快速准确地提取农村道路,对于高标准农田建设的监测与监管具有重要意义。近年来,针对城市道路提取的深度学习方法与基准数据集发展迅猛,但受限于城市道路与农村道路的巨大分布差异,面向城市道路提取的训练模型难以直接应用于农村道路提取。本文基于高分辨率遥感影像数据,系统构建了首套高分遥感影像农村(高标准农田)道路提取基准数据集(WHU-Ru R)。本数据集为目前农田覆盖率最高、农村道路类别最多、农村背景最复杂以及数据量最大的开源数据集,具体特征如下:覆盖中国华北、华中、华东、西北和西南的共7个省(湖北省、湖南省、陕西省、四川省、安徽省、河南省和河北省)的典型农村区域;包含训练集与测试集共25922对高分遥感影像与道路样本(空间分辨率0.3 m,空间尺寸1024×1024像素)。同时,为了验证WHU-Ru R数据集的可用性,本文测试并全面分析了前沿深度学习道路提取方法在农村道路提取任务上的效果。实验表明,WHU-Ru R数据集可基本满足农村道路提取需求,在高标准农田监测与监管领域具有重大应用潜力。数据集链接:https://doi.org/10.57760/sciencedb.09181。 展开更多
关键词 农村道路提取 高标准农田 高分辨率遥感 遥感基准数据集 深度学习
原文传递
基于中文对话的多模态谎言检测数据集
8
作者 徐啸林 郑文明 +6 位作者 连海伦 李溯南 刘佳腾 刘安邦 路成 宗源 梁宗保 《中国图象图形学报》 北大核心 2025年第8期2729-2742,共14页
目的谎言检测通过分析个体的生理行为特征来识别其是否说谎,在刑侦和安全审查等领域具有重要应用。然而,目前缺乏公开的中文测谎数据集,考虑到语言和文化方面的差异,基于英文数据集研发的算法可能难以适用于中文语境。此外,现有数据集... 目的谎言检测通过分析个体的生理行为特征来识别其是否说谎,在刑侦和安全审查等领域具有重要应用。然而,目前缺乏公开的中文测谎数据集,考虑到语言和文化方面的差异,基于英文数据集研发的算法可能难以适用于中文语境。此外,现有数据集样本规模有限,在激发被试说谎动机方面存在不足。针对这些问题,构建了首个公开的中文多模态测谎数据集(Southeast University multimodal lie detection dataset,SEUMLD)。方法实验基于犯罪知识测试范式,设计了模拟犯罪和模拟审讯等流程以激发被试的说谎动机。通过记录被试在模拟审讯过程中的多模态信号,SEUMLD包含了长期生活在中文语境下的76位被试的视频、音频以及心电3种模态数据,共计3224段对话。该数据集不仅提供了用于判断被试是否说谎的长会话标注(粗粒度标注),还提供了每段长会话细化分割的精准标注(细粒度标注)。基于SEUMLD,设计了跨语种实验以验证语言文化差异对说谎行为的影响;通过迁移学习实验评估其在提升模型泛化能力上的性能;最后基于经典谎言检测方法对SEUMLD进行了基准实验。结果跨语种测谎实验在中英文语境下表现出了显著差异。迁移学习实验验证了SEUMLD在提升模型泛化能力上的优异表现。基准实验结果显示,基于单模态的粗粒度和细粒度测谎的最佳未加权平均召回率(unweighted average recall,UAR)识别结果分别为0.7576和0.7096;融合了多模态信息后的测谎性能达到最佳,粗粒度检测和细粒度测谎的识别结果分别为0.8083和0.7379。结论SEUMLD为研究中文语境下的多模态测谎提供了重要的数据来源,对未来研究中文母语者的说谎模式具有重要意义。数据集开源地址:https://aip.seu.edu.cn/2024/1219/c54084a515309/page.htm或https://doi.org/10.57760/sciencedb.22548。 展开更多
关键词 谎言检测 中文谎言检测 多模态 数据集 基准
原文传递
CHEN-AND:中英文科学文献联合作者消歧数据集与评测基准
9
作者 张力 胡经璇 +1 位作者 刘细文 陆伟 《数据分析与知识发现》 北大核心 2025年第9期88-101,共14页
【目的】现有的文献作者消歧研究缺乏对中英文联合作者消歧的关注,其中一个重要原因是缺乏专业可靠的数据集。本文聚焦该问题的研究,提出一种利用互联网开放资源自动构建作者消歧数据集的方法。【方法】利用该方法为中英文联合作者消歧... 【目的】现有的文献作者消歧研究缺乏对中英文联合作者消歧的关注,其中一个重要原因是缺乏专业可靠的数据集。本文聚焦该问题的研究,提出一种利用互联网开放资源自动构建作者消歧数据集的方法。【方法】利用该方法为中英文联合作者消歧研究构建了一个大型有标签数据集CHEN-AND;基于该数据集,本文构建并评测了多个基础的中英文联合作者消歧方法。【结果】评测结果显示,表现较好的消歧方法的PF1和B3-F1分别为79.86%和84.25%,明显低于主流的英文作者消歧方法的准确率。【局限】CHEN-AND的一个局限性是较为关注理工科领域的研究人员,这与作者的真实学科分布存在一定差异,原因是构建数据集使用的中文数据库CSCD是一个面向理工科领域的引文数据库。【结论】本文公开了CHEN-AND数据集和消歧方法评估结果,以便后续研究探索更加高效的跨语言作者消歧方法和构建高质量的学术信息交流平台。 展开更多
关键词 作者消歧 数据集构建 评测基准
原文传递
面向AI生成图像持续检测基准数据集与框架研究
10
作者 王亚斌 洪晓鹏 黄智武 《中国图象图形学报》 北大核心 2025年第11期3438-3450,共13页
目的针对人工智能生成内容(artificial intelligence generated content,AIGC)技术快速发展带来的高度逼真图像滥用风险,以及现有检测方法难以适应持续涌现的新型生成模型且缺乏持续学习能力的挑战,构建了面向该挑战的AI生成图像持续检... 目的针对人工智能生成内容(artificial intelligence generated content,AIGC)技术快速发展带来的高度逼真图像滥用风险,以及现有检测方法难以适应持续涌现的新型生成模型且缺乏持续学习能力的挑战,构建了面向该挑战的AI生成图像持续检测基准数据集,并提出一套针对该问题的持续检测框架。方法首先,构建了面向持续学习的AI生成图像检测基准数据集,包含5种主流生成模型样本及真实图像,并按持续学习任务流组织其结构;其次,系统定义并研究了持续学习在AI生成图像检测任务下面临的问题,特别关注了现实场景约束下新颖的“混合二类与单类”的增量学习场景,并设计了3种基于不同程度样本回放约束的基准;最后,针对不同基准场景,改进现有持续学习方法进行任务适配,并为最严苛的无回放场景提出了一种通用转换框架,以修复在此场景下失效的方法。结果在所提数据集上的实验验证了所提基准和方法的有效性。在允许回放的场景下,适配后的方法能够实现增量检测。在最严格的无回放场景下,传统无回放方法性能严重下降甚至失效,而应用本文提出的通用转换框架后,这些方法的性能显著提升,有效提升了检测准确率和版权识别能力,并大幅抑制了灾难性遗忘。结论本文成功构建了面向持续学习的AI生成图像检测基准,深入分析了其中的关键挑战,并提出了有效的持续检测策略和解决方案,特别是为无回放场景下的持续学习提供了创新框架。研究成果为开发能够应对不断演进的AI生成技术的稳健、适应性强的检测系统提供了重要的方法论支撑和实证依据。本文相关数据和代码开源在https://huggingface.co/datasets/nebula/CAID和https://doi.org/10.57760/sciencodb.29781。 展开更多
关键词 人工智能生成内容(AIGC)检测 持续学习(CL) 深度伪造 基准数据集 数据集 灾难性遗忘 知识蒸馏(KD) 提示调整
原文传递
SWCC:新疆农作物遥感图像语义分割基准数据集
11
作者 张妍 卢毅果 +1 位作者 范迎迎 钱育蓉 《微电子学与计算机》 2025年第9期25-33,共9页
农作物语义分割能够识别图像中的不同农作物区域,提供像素级别的细粒度信息,有助于相关农业研究人员更好地了解农田资源的分布和状态,从而支持更精确的农业管理和决策过程。提出了一个新的农作物语义分割基准数据集(Shawan Crop Classif... 农作物语义分割能够识别图像中的不同农作物区域,提供像素级别的细粒度信息,有助于相关农业研究人员更好地了解农田资源的分布和状态,从而支持更精确的农业管理和决策过程。提出了一个新的农作物语义分割基准数据集(Shawan Crop Classification Dataset,SWCC)。该数据采集自中国新疆沙湾地区,由Gaofen-1卫星拍摄,包含分辨率为2 m全色和8 m多光谱的数据,经过融合之后得到2 m的多光谱数据。SWCC数据集中的所有对象都通过精准目视解译与实地考察,标注了5个类别。与现有的专用农作物语义分割数据集相比,SWCC数据集具有3个特点:覆盖新疆多样农作物类别,具有高度的代表性,为农业科学研究提供了宝贵的数据资源;实现2m高分辨率多光谱数据融合,显著提升图像细节与信息量;选取RGB和近红外4个波段,全面提取农作物特征信息。基于SWCC数据集,本文评估了几种先进的算法,为基于深度学习的农作物语义分割方法提供了基准,这对于评估算法的改进是有价值的。 展开更多
关键词 农作物语义分割 深度学习 基准数据集 高光谱 多光谱
在线阅读 下载PDF
面向高清人体图像生成的数据基准与模型框架
12
作者 徐正国 普碧才 +3 位作者 秦建明 项炎平 彭振江 宋纯锋 《中国图象图形学报》 北大核心 2025年第2期375-390,共16页
目的姿态引导下的人物图像生成具有广泛的应用潜力,受到了广泛关注。低分辨率场景的姿态引导人物图像生成任务取得了很大成功。然而在高分辨率场景下,现有的人体姿态迁移数据集存在分辨率低或多样性差等问题,同时也缺乏相关高分辨率图... 目的姿态引导下的人物图像生成具有广泛的应用潜力,受到了广泛关注。低分辨率场景的姿态引导人物图像生成任务取得了很大成功。然而在高分辨率场景下,现有的人体姿态迁移数据集存在分辨率低或多样性差等问题,同时也缺乏相关高分辨率图像生成方法。针对这一问题,构建了具有多模态辅助数据的大规模高清人物图像数据集PersonHD。方法PersonHD数据集收集了包含100个不同人物的299817幅图像。在提出的PersonHD基础上,基于现有数据集的公共设置,本文进一步构建了两个不同分辨率下的评测基准,并设计了一个实用的高分辨率人物图像生成框架,为评估最先进的姿态引导人物图像生成方法提供了一个新的平台。结果与现有数据集相比,PersonHD在更高的图像分辨率、更多样化的人物姿态和更大规模的样本方面具有显著的优势。基于PersonHD数据集,实验在两个不同分辨率的评测基准上系统地评估了当前具有代表性的姿态引导人物图像生成方法,并对本文提出框架各模块的有效性进行了系统验证。实验结果表明,该框架具有良好的效果。结论本文提出的高清人物图像生成基准数据集具有高分辨率数据规模大、多样性强等特点,有助于更为全面地评估姿态引导下的人物图像生成算法。本文的数据集和代码可在https://github.com/BraveGroup/PersonHD上获得。 展开更多
关键词 人物图像合成 姿态引导迁移 高清数据集 低分辨率基准 高分辨率基准
原文传递
深度视觉目标跟踪进展综述 被引量:8
13
作者 王宁 席茂 +2 位作者 周文罡 李礼 李厚强 《中国科学技术大学学报》 CAS CSCD 北大核心 2021年第4期335-344,共10页
视频目标跟踪是计算机视觉领域的一个重要研究课题.近年来,随着深度学习在视觉目标跟踪领域获得了巨大的成功,一系列优秀的深度跟踪算法涌现出来.本文回顾了近年来深度目标跟踪领域的进展.首先,我们详细讨论了近十年来跟踪领域数据集的... 视频目标跟踪是计算机视觉领域的一个重要研究课题.近年来,随着深度学习在视觉目标跟踪领域获得了巨大的成功,一系列优秀的深度跟踪算法涌现出来.本文回顾了近年来深度目标跟踪领域的进展.首先,我们详细讨论了近十年来跟踪领域数据集的发展趋势,这些数据集不仅全面地评估了算法性能同时为模型训练提供了极大的便利.其次,我们分类讨论了几大类经典的深度学习跟踪框架,包括深度相关滤波器跟踪、分类式网络跟踪、双路网络跟踪、基于梯度的深度跟踪算法以及基于Transformer的跟踪算法.最后,我们对全文内容进行总结,并指出未来的发展趋势. 展开更多
关键词 深度目标跟踪 跟踪数据集 相关滤波器 分类式跟踪网络 双路跟踪网络 梯度跟踪网络
在线阅读 下载PDF
视觉场景描述及其效果评价 被引量:6
14
作者 马苗 王伯龙 +2 位作者 吴琦 武杰 郭敏 《软件学报》 EI CSCD 北大核心 2019年第4期867-883,共17页
作为计算机视觉?多媒体?人工智能和自然语言处理等领域的交叉性研究课题,视觉场景描述的研究内容是自动生成一个或多个语句用于描述图像或视频中呈现的视觉场景信息.视觉场景中内容的丰富性和自然语言表达的多样性使得视觉场景描述成为... 作为计算机视觉?多媒体?人工智能和自然语言处理等领域的交叉性研究课题,视觉场景描述的研究内容是自动生成一个或多个语句用于描述图像或视频中呈现的视觉场景信息.视觉场景中内容的丰富性和自然语言表达的多样性使得视觉场景描述成为一项充满挑战的任务,综述了现有视觉场景描述方法及其效果评价.首先,论述了视觉场景描述的定义?研究任务及方法分类,简要分析了视觉场景描述与多模态检索、跨模态学习、场景分类、视觉关系检测等相关技术的关系;然后分类讨论视觉场景描述的主要方法?模型及研究进展,归纳日渐增多的基准数据集;接下来,梳理客观评价视觉场景描述效果的主要指标和视觉场景描述技术面临的问题与挑战,最后讨论未来的应用前景. 展开更多
关键词 深度学习 图像描述 视频描述 基准数据集 性能评价
在线阅读 下载PDF
高光谱高空间分辨率遥感观测、处理与应用 被引量:9
15
作者 钟燕飞 王心宇 +4 位作者 胡鑫 王少宇 万瑜廷 唐舸 张良培 《测绘学报》 EI CSCD 北大核心 2023年第7期1212-1226,共15页
高光谱遥感技术是遥感领域的研究热点之一。然而,由于成像口径与能量等限制因素,难以同时获得高光谱和高空间分辨率的图像,这极大限制了高光谱遥感在精细尺度任务中的应用。近年来,随着高光谱成像技术及无人机为代表的新型观测平台的发... 高光谱遥感技术是遥感领域的研究热点之一。然而,由于成像口径与能量等限制因素,难以同时获得高光谱和高空间分辨率的图像,这极大限制了高光谱遥感在精细尺度任务中的应用。近年来,随着高光谱成像技术及无人机为代表的新型观测平台的发展,高光谱高空间(双高,同时具备纳米级光谱分辨率与亚米级空间分辨率)遥感技术发展迅猛,推动了高光谱遥感技术的应用,但同时也带来了更多问题。极高的空间与光谱分辨率使得数据更加海量高维,加剧了高光谱数据的空间异质性和光谱变异性,为影像智能信息处理带来更大的挑战。为此,本文将从双高遥感影像基准数据集、双高遥感影像智能信息处理、双高遥感影像典型应用3个方面论述双高遥感应用与发展现状。 展开更多
关键词 高光谱高空间遥感 双高遥感基准数据集 双高遥感智能处理与应用
在线阅读 下载PDF
列存储数据库中压缩位图索引技术 被引量:2
16
作者 王梅 杨思箫 乐嘉锦 《计算机工程》 CAS CSCD 2012年第18期26-29,共4页
为提高压缩码的利用率,提出一种适用于列存储数据库的压缩位图索引技术。定义反转、合并等操作,将所有计算的输入值与输出值格式化为位向量形式。通过活跃度衡量索引中位向量的复杂度,并对压缩位向量进行直接计算,优化where子句和group... 为提高压缩码的利用率,提出一种适用于列存储数据库的压缩位图索引技术。定义反转、合并等操作,将所有计算的输入值与输出值格式化为位向量形式。通过活跃度衡量索引中位向量的复杂度,并对压缩位向量进行直接计算,优化where子句和group by子句在查询执行过程中的数据提取。在SSB数据集上的实验结果证明,该技术能提高29.7%~38.9%的压缩位图索引性能。 展开更多
关键词 列存储数据库 位图索引 活跃度 SSB数据集 聚集查询
在线阅读 下载PDF
面向人脸修复篡改检测的大规模数据集 被引量:2
17
作者 李伟 黄添强 +2 位作者 黄丽清 郑翱鲲 徐超 《中国图象图形学报》 CSCD 北大核心 2024年第7期1834-1848,共15页
目的 图像合成方法随着计算机视觉的不断发展和深度学习技术的逐渐成熟为人们的生活带来了丰富的体验。然而,用于传播虚假信息的恶意篡改图像可能对社会造成极大危害,使人们对数字内容在图像媒体中的真实性产生怀疑。面部编辑作为一种... 目的 图像合成方法随着计算机视觉的不断发展和深度学习技术的逐渐成熟为人们的生活带来了丰富的体验。然而,用于传播虚假信息的恶意篡改图像可能对社会造成极大危害,使人们对数字内容在图像媒体中的真实性产生怀疑。面部编辑作为一种常用的图像篡改手段,通过修改面部的五官信息来伪造人脸。图像修复技术是面部编辑常用的手段之一,使用其进行面部伪造篡改同样为人们的生活带来了很大干扰。为了对此类篡改检测方法的相关研究提供数据支持,本文制作了面向人脸修复篡改检测的大规模数据集。方法 具体来说,本文选用了不同质量的源数据集(高质量的人脸图像数据集CelebA-HQ及低质量的人脸视频数据集FF++),通过图像分割方法将面部五官区域分割,最后使用两种基于深度网络的修复方法CTSDG(image inpainting via conditional texture and structure dual generation)和RFR(recurrent feature reasoning for image inpainting)以及一种传统修复方法 SC(struct completion),生成总数量达到60万幅的大规模修复图像数据集。结果 实验结果表明,由FF++数据集生成的图像在基准检测网络ResNet-50下的检测精度下降了15%,在Xception-Net网络下检测精度下降了5%。且不同面部部位的检测精度相差较大,其中眼睛部位的检测精度最低,检测精度为0.91。通过泛化性实验表明,同一源数据集生成的数据在不同部位的修复图像间存在一定的泛化性,而不同的源数据制作的数据集间几乎没有泛化性。因此,该数据集也可为修复图像之间的泛化性研究提供研究数据,可以在不同数据集、不同修复方式和不同面部部位生成的图像间进行修复图像的泛化性研究。结论 基于图像修复技术的篡改方式在一定程度上可以骗过篡改检测器,对于此类篡改方式的检测方法研究具有现实意义。提供的大型基于修复技术的人脸篡改数据集为该领域的研究提供了新的数据来源,丰富了数据多样性,为深入研究该类型的人脸篡改和检测方法提供了有力的基准。数据集开源地址https://pan.baidu.com/s/1-9HIBya9X-geNDe5zcJldw?pwd=thli。 展开更多
关键词 图像篡改 深度学习 图像修复 数据集 基准
原文传递
Predicting the Mechanical Properties of Polyurethane Elastomers Using Machine Learning 被引量:2
18
作者 Fang Ding Lun-Yang Liu +3 位作者 Ting-Li Liu Yun-Qi Li Jun-Peng Li Zhao-Yan Sun 《Chinese Journal of Polymer Science》 SCIE EI CAS CSCD 2023年第3期422-431,I0009,共11页
Bridging the gap between the computation of mechanical properties and the chemical structure of elastomers is a long-standing challenge.To fill the gap,we create a raw dataset and build predictive models for Young’s ... Bridging the gap between the computation of mechanical properties and the chemical structure of elastomers is a long-standing challenge.To fill the gap,we create a raw dataset and build predictive models for Young’s modulus,tensile strength,and elongation at break of polyurethane elastomers(PUEs).We then construct a benchmark dataset with 50.4%samples remained from the raw dataset which suffers from the intrinsic diversity problem,through a newly proposed recursive data elimination protocol.The coefficients of determination(R^(2)s)from predictions are improved from 0.73-0.78 to 0.85-0.91 based on the raw and the benchmark datasets.The fitting of stress-strain curves using the machine learning model shows a slightly better performance than that for one of the well-performed constitutive models(e.g.,the Khiêm-Itskov model).It confirmed that the black-box machine learning models are feasible to bridge the gap between the mechanical properties of PUEs and multiple factors for their chemical structures,composition,processing,and measurement settings.While accurate prediction for these curves is still a challenge.We release the raw dataset and the most representative benchmark dataset so far to call for more attention to tackle the longstanding gap problem. 展开更多
关键词 Mechanical properties Stress-strain curves Polyurethane elastomers Machine learning benchmark dataset
原文传递
基于背景相似性匹配的人脸识别
19
作者 朱松豪 胡学伟 刘佳伟 《中南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2013年第S2期343-346,共4页
一般环境中在线视频的人脸识别问题成为当前的研究热点之一。尽管与特定环境中在线视频的人脸识别有着很大关联,但一般环境中在线视频的人脸识别问题有着自己的独特特点和算法要求。目前研究与实际应用间仍存在较大差距。在此,建立了一... 一般环境中在线视频的人脸识别问题成为当前的研究热点之一。尽管与特定环境中在线视频的人脸识别有着很大关联,但一般环境中在线视频的人脸识别问题有着自己的独特特点和算法要求。目前研究与实际应用间仍存在较大差距。在此,建立了一般环境中的人脸库;利用建立的人脸库,实现研究、比较各种人脸识别技术性能;提出了一种新的相似测量标准,即背景相似性匹配。 展开更多
关键词 人脸识别 无约束视频 公共数据集 背景相似性分析
在线阅读 下载PDF
Data Augmentation Using Contour Image for Convolutional Neural Network
20
作者 Seung-Yeon Hwang Jeong-Joon Kim 《Computers, Materials & Continua》 SCIE EI 2023年第6期4669-4680,共12页
With the development of artificial intelligence-related technologies such as deep learning,various organizations,including the government,are making various efforts to generate and manage big data for use in artificia... With the development of artificial intelligence-related technologies such as deep learning,various organizations,including the government,are making various efforts to generate and manage big data for use in artificial intelligence.However,it is difficult to acquire big data due to various social problems and restrictions such as personal information leakage.There are many problems in introducing technology in fields that do not have enough training data necessary to apply deep learning technology.Therefore,this study proposes a mixed contour data augmentation technique,which is a data augmentation technique using contour images,to solve a problem caused by a lack of data.ResNet,a famous convolutional neural network(CNN)architecture,and CIFAR-10,a benchmark data set,are used for experimental performance evaluation to prove the superiority of the proposed method.And to prove that high performance improvement can be achieved even with a small training dataset,the ratio of the training dataset was divided into 70%,50%,and 30%for comparative analysis.As a result of applying the mixed contour data augmentation technique,it was possible to achieve a classification accuracy improvement of up to 4.64%and high accuracy even with a small amount of data set.In addition,it is expected that the mixed contour data augmentation technique can be applied in various fields by proving the excellence of the proposed data augmentation technique using benchmark datasets. 展开更多
关键词 Data augmentation image classification deep learning convolutional neural network mixed contour image benchmark dataset
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部