期刊文献+
共找到96篇文章
< 1 2 5 >
每页显示 20 50 100
面向PyTorch的RVV优化
1
作者 王凡 张飞 +1 位作者 宋甫元 于佳耕 《计算机系统应用》 2025年第4期266-275,共10页
RISC-V软件生态正在加速发展,国际开源社区积极投入RISC-V软件生态,针对RISC-V主动适配和优化,积极推动RISC-V软件生态系统向前发展.PyTorch是一个开源的Python机器学习库,其在性能、开源生态、研究领域都有非常大的优势,其对x86、ARM、... RISC-V软件生态正在加速发展,国际开源社区积极投入RISC-V软件生态,针对RISC-V主动适配和优化,积极推动RISC-V软件生态系统向前发展.PyTorch是一个开源的Python机器学习库,其在性能、开源生态、研究领域都有非常大的优势,其对x86、ARM、PowerPC以及CUDA等指令集架构都提供了较好的支持.但是,在目前的RISC-V架构上,软件生态移植集中在对RISC-V标准指令集的适配,尚不能充分利用RISC-V扩展指令集优化软件生态,距离ARM、x86等成熟软件生态存在较大差距.PyTorch因缺少RISC-V V扩展(RVV)的支持,使得RISC-V平台的推理性能与同规格ARM平台差距较大.针对上述问题,本文提出了一种面向PyTorch RVV 1.0的高效开发方案,并使用RVV扩展指令集对PyTorch深度卷积算子进行针对性优化,并在K230开发板上进行了对比分析,实验结果表明,相比标量实现,利用RVV优化的深度卷积算子性能提升约1.35–3.8倍. 展开更多
关键词 RISC-V pytorch RVV扩展指令集 深度卷积
在线阅读 下载PDF
MTTorch:面向MT-3000芯片和Transformer模型的PyTorch算子库实现与优化 被引量:1
2
作者 王昊天 孙羽菲 +4 位作者 隋轶丞 王嘉豪 石昌青 方建滨 张玉志 《软件学报》 北大核心 2025年第8期3896-3916,共21页
随着Transformer类大模型的飞速发展,算力逐渐成为制约领域发展的瓶颈,如何根据加速器硬件的结构特性加速和优化大语言模型的训练性能已成为研究热点.面向天河新一代超算系统的加速芯片MT-3000,提出并实现了适用于CPU+DSP异构架构的PyTo... 随着Transformer类大模型的飞速发展,算力逐渐成为制约领域发展的瓶颈,如何根据加速器硬件的结构特性加速和优化大语言模型的训练性能已成为研究热点.面向天河新一代超算系统的加速芯片MT-3000,提出并实现了适用于CPU+DSP异构架构的PyTorch扩展库——MTTorch,其核心是一个多核并行的算子库,对Transformer类模型训练过程中的核心算子进行向量化实现和优化.同时,针对MT-3000架构特性,提出了面向多核DSP的高性能规约算法及乒乓算法,显著提升了算子的运算性能.MTTorch还具有很好的通用性,对于不同版本的PyTorch都可以动态链接库的形式进行加载,不改变PyTorch的原生实现.大量实验证明,实现的核心算子在MT-3000芯片上有着很好的性能,在单DSP簇上可以达到8倍的加速效果.利用MTTorch在多节点执行训练任务时有着接近线性的加速比,极大地提升了Transformer类模型在MT-3000芯片上的训练效率. 展开更多
关键词 pytorch 高性能计算 Transformer模型 天河超级计算机 CPU+DSP异构计算 软件生态
在线阅读 下载PDF
基于PyTorch深度学习框架的武汉市森林资源变化监测模型研究 被引量:3
3
作者 邓春成 孙巧峰 +3 位作者 唐星 李艳丽 卢秉俊 陶章思 《中南林业调查规划》 2025年第1期45-49,共5页
基于武汉市2期遥感影像数据,采集变化识别样本,采用深度学习框架PyTorch对样本模型进行训练、效果预测,构建变化监测模型,利用变化监测模型进行遥感影像变化信息的提取,形成变化提取成果。结果显示:武汉市森林资源变化识别准确率达88.1%... 基于武汉市2期遥感影像数据,采集变化识别样本,采用深度学习框架PyTorch对样本模型进行训练、效果预测,构建变化监测模型,利用变化监测模型进行遥感影像变化信息的提取,形成变化提取成果。结果显示:武汉市森林资源变化识别准确率达88.1%,召回率达88.5%,且随着样本数量的增加和影像质量的提升,基于深度学习框架的变化识别提取准确率和召回率也得到了提升。构建的武汉市森林资源变化监测模型可应用于森林资源变化识别,能够为森林资源监测监管提供疑似变化图斑,及时准确地发现森林违法活动、林业灾害等信息,具有较大的实际应用价值和潜力。 展开更多
关键词 深度学习 遥感影像 森林资源 变化监测模型 pytorch
在线阅读 下载PDF
基于Pytorch残差网络的轻量化多目标图像识别系统设计与实现
4
作者 吴高登 徐亮 +2 位作者 杨政 熊雪晖 白立旺 《工业控制计算机》 2025年第6期66-67,70,共3页
伴随着人工智能的深化应用,视觉技术越来越多地应用在工业视觉检测领域。图像数据作为重要的数据源,其处理的效果对后续的使用起到至关重要的作用。尤其在复杂工业检测领域,受检测硬件的经济成本和检测视野影响,针对多目标特征识别需求... 伴随着人工智能的深化应用,视觉技术越来越多地应用在工业视觉检测领域。图像数据作为重要的数据源,其处理的效果对后续的使用起到至关重要的作用。尤其在复杂工业检测领域,受检测硬件的经济成本和检测视野影响,针对多目标特征识别需求,传统的识别算法往往通过全连接神经网络实现目标识别。多目标识别受限而且识别过程既耗时较长,识别准确率也很难满足多目标情形下的图像数据处理要求。因此以复杂检测场景为检测对象,以Pytorch为载体,结合多目标识别业务流程,开展残差网络的轻量化多目标图像识别系统搭建工作,并同步开展残差网络的算法模型设计与参数整定工作。 展开更多
关键词 pytorch 图像数据 多目标 残差网络 轻量化
在线阅读 下载PDF
基于PyTorch框架的不定长验证码抗干扰识别系统设计
5
作者 常荣 《微型电脑应用》 2025年第1期299-303,共5页
为了降低干扰信息对验证码识别效果的影响,提高不定长验证码的识别准确率,设计基于PyTorch框架的不定长验证码抗干扰识别系统。系统由采集模块、处理模块、识别模块三部分组成。采集模块利用网络爬虫获取验证码图像,并在图像处理模块中... 为了降低干扰信息对验证码识别效果的影响,提高不定长验证码的识别准确率,设计基于PyTorch框架的不定长验证码抗干扰识别系统。系统由采集模块、处理模块、识别模块三部分组成。采集模块利用网络爬虫获取验证码图像,并在图像处理模块中完成灰度化处理。调用全局阈值法对处理后的图像实施二值化操作,区分图像背景与字符。将采用滑动窗口法在去除噪声后的验证码图像中输入基于PyTorch框架的验证码识别模块,利用改进的ResNet-18网络提取图像特征后,通过长短期记忆网络模型获取字符序列特征,利用时序分类算法完成标签的对齐,实现对不定长验证码的抗干扰识别。实验结果表明,所设计系统可以有效实现对验证码图像的灰度化及去噪处理,并完成含不同程度干扰信息的不定长验证码的准确识别。 展开更多
关键词 pytorch框架 验证码 抗干扰识别 网络爬虫 LSTM网络
在线阅读 下载PDF
PyTorch下基于CNN的手写数字识别及应用研究 被引量:13
6
作者 宗春梅 张月琴 石丁 《计算机与数字工程》 2021年第6期1107-1112,共6页
文章对卷积神经网络模型LeNet-5中的激活函数、下采样方式等进行改进,对训练参数进行调整,使改进后的模型手写数字识别准确率达到99.2%。使用PyTorch搭建模型,用MNIST数据集对模型进行训练,其后在自制数据集上进行测试,从识别准确率和... 文章对卷积神经网络模型LeNet-5中的激活函数、下采样方式等进行改进,对训练参数进行调整,使改进后的模型手写数字识别准确率达到99.2%。使用PyTorch搭建模型,用MNIST数据集对模型进行训练,其后在自制数据集上进行测试,从识别准确率和训练速度等方面验证了模型的可靠性。借助TensorBoard监督整个网络模型的训练过程,指导对模型参数的优化调整。最后,将改进的网络模型服务于该校人工智能课程答卷分数的识别中,使手写分数得到准确识别。 展开更多
关键词 CNN pytorch 手写数字识别 可视化 自动登分系统
在线阅读 下载PDF
基于Pytorch和Opencv的人脸关键点检测 被引量:2
7
作者 孟令军 王静波 《电视技术》 2019年第14期71-76,共6页
在人脸识别技术中最重要的一步就是关键点检测,为实现简单的人脸面部关键点检测,设计一种卷积神经网络,在深度学习Pytorch框架下使用Youtube face数据集经过训练得到模型分类器,且测试集上错误率达到0.139%,结合Opencv的级联人脸检测器... 在人脸识别技术中最重要的一步就是关键点检测,为实现简单的人脸面部关键点检测,设计一种卷积神经网络,在深度学习Pytorch框架下使用Youtube face数据集经过训练得到模型分类器,且测试集上错误率达到0.139%,结合Opencv的级联人脸检测器和训练好的Pytorch模型可定位任意图片的人脸框以及68个关键点的位置。测试结果表明,人脸及人脸关键点检测识别准确度较高,且该方法简单高效,可用于现实应用场景的模块构建。 展开更多
关键词 人脸关键点检测 卷积神经网络 深度学习 pytorch
在线阅读 下载PDF
基于Pytorch框架搭建U-Net网络模型的遥感影像建筑物提取研究 被引量:5
8
作者 焦利伟 张敏 +1 位作者 麻连伟 秦建辉 《河南城建学院学报》 CAS 2020年第4期52-57,共6页
基于深度学习方法,采用Pytorch框架搭建U-Net网络模型,进行了遥感影像建筑物提取研究。首先以建筑物为目标,构建基于光学遥感影像的建筑物样本库,然后进行网络训练建立深度学习模型,并对样本库更新进行模型优化,最后用优化后的模型进行... 基于深度学习方法,采用Pytorch框架搭建U-Net网络模型,进行了遥感影像建筑物提取研究。首先以建筑物为目标,构建基于光学遥感影像的建筑物样本库,然后进行网络训练建立深度学习模型,并对样本库更新进行模型优化,最后用优化后的模型进行建筑物提取,并与最大似然法、支持向量机法(SVM)进行对比。结果表明:在训练数据集充足的情况下,使用深度学习对台前县建筑物提取总体精度为94.3%、Kappa系数为0.83,罗山县总体精度为97.5%、Kappa系数为0.75,均高于传统方法,说明利用深度学习的方法进行建筑物提取具有一定的有效性和适用性。 展开更多
关键词 遥感影像 建筑物提取 pytorch U-Net
在线阅读 下载PDF
基于TensorFlow和PyTorch的深度学习框架对比分析 被引量:33
9
作者 黄玉萍 梁炜萱 肖祖环 《现代信息科技》 2020年第4期80-82,87,共4页
深度学习框架是实现机器学习的关键工具,合适的深度学习框架可以达到事半功倍的效果。为助力研究者选择合适的框架,在回顾近十种常见框架的基础上,聚焦当前受众最广、热度最高的两种深度学习框架TensorFlow和PyTorch,从历程、现状、机... 深度学习框架是实现机器学习的关键工具,合适的深度学习框架可以达到事半功倍的效果。为助力研究者选择合适的框架,在回顾近十种常见框架的基础上,聚焦当前受众最广、热度最高的两种深度学习框架TensorFlow和PyTorch,从历程、现状、机制、训练模式、可视化、工业部署等角度对两者进行比对分析,并归类对应适用场景的建议,为框架选择提供思路参考。 展开更多
关键词 深度学习 TensorFlow pytorch 适用场景
在线阅读 下载PDF
基于深度学习PyTorch框架下YOLOv3的交通信号灯检测 被引量:6
10
作者 李蒋 《汽车电器》 2022年第6期4-7,共4页
随着《智能汽车创新发展战略》的发布,国家大力发展智能网联汽车势在必行。在自动驾驶技术中,复杂环境中目标物体的识别和判别是一项高难度的挑战,也是需要解决的重点任务之一。本文主要针对汽车智能化设计领域占有重要基础地位的图像... 随着《智能汽车创新发展战略》的发布,国家大力发展智能网联汽车势在必行。在自动驾驶技术中,复杂环境中目标物体的识别和判别是一项高难度的挑战,也是需要解决的重点任务之一。本文主要针对汽车智能化设计领域占有重要基础地位的图像识别功能,利用深度学习框架PyTorch和YOLOv3算法对于交通信号灯的判定进行学习训练,最终对获取的交通路况实景图进行识别,取得一定的实际检测效果,以期推动汽车智能化设计领域的技术创新和突破。 展开更多
关键词 pytorch YOLOv3 交通信号灯
在线阅读 下载PDF
基于深度学习PyTorch在“飞行安全”教学中的应用与展望 被引量:1
11
作者 芦建辉 王林 侯明鑫 《教育教学论坛》 2022年第46期137-140,共4页
快速发展的深度学习正在改变人类的衣食住行,教育领域也在深度学习的推动下发生着翻天覆地的变化。与此同时,因材施教和开阔眼界成为教育领域中亟须解决的难题之一,为了解决此难题,引入深度学习技术。以基于深度学习PyTorch在“飞行安... 快速发展的深度学习正在改变人类的衣食住行,教育领域也在深度学习的推动下发生着翻天覆地的变化。与此同时,因材施教和开阔眼界成为教育领域中亟须解决的难题之一,为了解决此难题,引入深度学习技术。以基于深度学习PyTorch在“飞行安全”教学中的应用为例,设计了RNN在“飞行安全”理论教学、CNN在“飞行安全”工程技术教学和案例教学中的应用场景,突出深度学习在教育领域的应用,有利于培养学生的创新思维和数据分析实践能力,并增强与时俱进的精神。 展开更多
关键词 深度学习 pytorch 飞行安全 教学
在线阅读 下载PDF
基于Pytorch的LSTM模型对股价的分析与预测 被引量:9
12
作者 张康林 叶春明 +1 位作者 李钊慧 王锦文 《计算机技术与发展》 2021年第1期161-167,共7页
股价预测一直都是股票投资者重点关注和重点研究的方向,针对股价具有高度非线性、高噪声、动态性等问题,提出一种基于自组织特征映射(SOM)神经网络和长短期记忆网络(LSTM)共同应用的股价预测方法。第一步聚类,使用python语言实现改进的... 股价预测一直都是股票投资者重点关注和重点研究的方向,针对股价具有高度非线性、高噪声、动态性等问题,提出一种基于自组织特征映射(SOM)神经网络和长短期记忆网络(LSTM)共同应用的股价预测方法。第一步聚类,使用python语言实现改进的自组织特征映射神经网络算法,将187支股票分成三类,三类股票以盈利能力大小进行聚类,并且求出每一类所包含的股票代码;第二步预测,基于Pytorch深度学习框架构造长短期记忆网络模型,分别对每一类中随机的3支股票进行股价预测,再通过均方误差和决定系数对预测结果进行评价。结果表明,在使用相同的预测模型对不同盈利能力的股票做股价预测时,盈利能力越大的股票,预测精度越高。此研究可以为投资者筛选出盈利能力更大的股票,并且在提高股价预测精度上也具有一定的贡献。 展开更多
关键词 pytorch 自组织特征映射 长短期记忆网络 股票价格 聚类 预测
在线阅读 下载PDF
面向TensorFlow和PyTorch的线性代数基准测试 被引量:4
13
作者 胥凌 《航空计算技术》 2022年第3期5-9,共5页
传统的高性能线性代数计算库如BLAS需要开发者具备丰富的性能优化经验,使用困难。TensorFlow、Pytorch等AI框架提供了简单的开发接口,促进了机器学习应用的发展。这些AI框架大量进行线性代数计算,但是不清楚其是否针对线性代数计算进行... 传统的高性能线性代数计算库如BLAS需要开发者具备丰富的性能优化经验,使用困难。TensorFlow、Pytorch等AI框架提供了简单的开发接口,促进了机器学习应用的发展。这些AI框架大量进行线性代数计算,但是不清楚其是否针对线性代数计算进行了性能优化。设计了一组线性代数计算测试程序,评估了AI框架对的线性代数计算的优化程度。分析显示AI框架在计算图模型下可以有效去除冗余子表达式,但仍然缺少自动识别矩阵链最佳括号的相关优化。未来AI框架可以通过吸收现有高性能线性代数加速库的优化技术进一步提升性能。 展开更多
关键词 线性代数 TensorFlow pytorch 高性能计算 矩阵乘法
在线阅读 下载PDF
面向MT-3000异构处理器的PyTorch虚拟算子设计与实现 被引量:1
14
作者 王嘉豪 王昊天 +3 位作者 隋轶丞 陈锐 孙羽菲 张玉志 《南开大学学报(自然科学版)》 CAS CSCD 北大核心 2023年第6期24-28,共5页
国防科技大学团队自主研发设计了MT-3000高性能多区异构处理器,并将其作为重要算力部署于我国新一代天河超级计算机系统中.为拓展MT-3000在人工智能领域的应用前景,亟需攻克PyTorch等主流深度学习框架仅与国外少数厂商的硬件深度绑定这... 国防科技大学团队自主研发设计了MT-3000高性能多区异构处理器,并将其作为重要算力部署于我国新一代天河超级计算机系统中.为拓展MT-3000在人工智能领域的应用前景,亟需攻克PyTorch等主流深度学习框架仅与国外少数厂商的硬件深度绑定这一技术壁垒.聚焦于PyTorch中常用算子与MT-3000异构处理器适配方法的研究.针对MT-3000处理器中,部分PyTorch算子难以利用DSP加速核实现加速的问题.设计并实现了PyTorch虚拟算子.通过常用算子的对比实验表明,提出的方法准确可靠,且基本没有性能损失. 展开更多
关键词 MT-3000 pytorch 异构计算设备
原文传递
基于PyTorch框架LSTM深度学习股票预测系统 被引量:1
15
作者 李泽艳 陈银钧 《运筹与模糊学》 2021年第2期137-146,共10页
随着机器学习与深度学习的发展,传统的时间序列模型已经不能满足人们对于股票预测准确性的要求。因此,本文引入深度学习中基于PyTorch框架的LSTM循环神经网络模型对创业300指数的收盘价进行预测,通过设置迭代次数、遗忘门偏置值以及LST... 随着机器学习与深度学习的发展,传统的时间序列模型已经不能满足人们对于股票预测准确性的要求。因此,本文引入深度学习中基于PyTorch框架的LSTM循环神经网络模型对创业300指数的收盘价进行预测,通过设置迭代次数、遗忘门偏置值以及LSTM单元数,对比模型的预测误差。研究结果表明,迭代次数为200、LSTM单元数为2、遗忘门偏置值为0.4的LSTM模型对创业300指数收盘价走势的拟合误差最小,平均绝对百分比误差达到0.0109,为进一步使用PyTorch框架构建循环神经网络准确预测股价提供了依据。 展开更多
关键词 股票预测 pytorch LSTM 创业300指数
在线阅读 下载PDF
Pytorch框架下基于卷积神经网络实现手写数字识别 被引量:12
16
作者 黄一天 陈芝彤 《电子技术与软件工程》 2018年第19期147-147,共1页
在大数据时代,使用深度学习算法训练的卷积神经网络模型在计算机视觉领域取得了显著的成果。Pytorch作为一个最新的深度学习框架,具有GPU加速和支持动态神经网络等优点,使得训练模型更加简单。本文在Pytorch下利用卷积神经网络实现手写... 在大数据时代,使用深度学习算法训练的卷积神经网络模型在计算机视觉领域取得了显著的成果。Pytorch作为一个最新的深度学习框架,具有GPU加速和支持动态神经网络等优点,使得训练模型更加简单。本文在Pytorch下利用卷积神经网络实现手写数字识别,在测试集上取得高于98%的准确率。 展开更多
关键词 卷积神经网络 手写数字识别 pytorch
在线阅读 下载PDF
基于PyTorch+ARIMA/RNN的时序数据预测方法比较研究 被引量:6
17
作者 邓抒江 《电脑编程技巧与维护》 2024年第4期71-73,共3页
随着深度学习的发展,PyTorch作为一个灵活的深度学习框架,被广泛应用于时序预测任务中。研究阐明了PyTorch框架及其在时序预测任务中的应用优势,介绍了基于PyTorch实现ARIMA和循环神经网络(RNN)两种典型时序预测模型的技术路线,从精度... 随着深度学习的发展,PyTorch作为一个灵活的深度学习框架,被广泛应用于时序预测任务中。研究阐明了PyTorch框架及其在时序预测任务中的应用优势,介绍了基于PyTorch实现ARIMA和循环神经网络(RNN)两种典型时序预测模型的技术路线,从精度、效率方面对两种模型进行比较,给出了各自的应用场景及优化方向,为时序预测任务提供了算法选型和实现参考与建议。 展开更多
关键词 时序预测 pytorch框架 ARIMA模型 RNN模型
在线阅读 下载PDF
PyTorch框架下的复杂场景目标识别方法研究 被引量:3
18
作者 张进军 《现代计算机》 2024年第8期66-71,共6页
人工智能框架(PyTorch+OneDNN)在复杂场景目标识别上,易陷入网络参数梯度超规模的问题。为此,提出一种基于PyTorch框架的复杂场景目标识别方法。引入MPI中的RingAllreduce算法,优化PyTorch框架,以此实现复杂场景特征迭代提取过程中的超... 人工智能框架(PyTorch+OneDNN)在复杂场景目标识别上,易陷入网络参数梯度超规模的问题。为此,提出一种基于PyTorch框架的复杂场景目标识别方法。引入MPI中的RingAllreduce算法,优化PyTorch框架,以此实现复杂场景特征迭代提取过程中的超规模数据同步和规约处理。以优化后的PyTorch框架为基础,考虑到复杂场景目标特征与背景特征之间的交叉性,构建增强多尺度特征层输出的目标特征之间的关联。借助反卷积特征融合操作和残差融合操作的优势,依据上述关联性,实现目标自动识别。测试结果表明:所提方法的整体错误识别数量为113个,整体未识别数量为107个,证明了所提方法具有较优的自动化识别效果。 展开更多
关键词 pytorch框架 复杂场景 目标自动化识别 RingAllreduce算法 ScatterReduce操作 AllGather操作
在线阅读 下载PDF
基于PyTorch的图像修复技术研究 被引量:2
19
作者 贺丹 《电脑知识与技术》 2022年第9期75-77,共3页
图像修复技术是利用计算机技术将图像中的多余部分去除或者填补图像中的缺失部分,该技术广泛应用于医学图像处理、文物修复、人脸识别等领域。早期的图像修复技术在小区域缺失图像处理中取得了良好的效果,但面对大区域缺失图像,修复效... 图像修复技术是利用计算机技术将图像中的多余部分去除或者填补图像中的缺失部分,该技术广泛应用于医学图像处理、文物修复、人脸识别等领域。早期的图像修复技术在小区域缺失图像处理中取得了良好的效果,但面对大区域缺失图像,修复效果往往不够理想。随着深度学习、人工智能技术的发展,深度学习技术为图像修复提供了新的解决方案。文中重点介绍了基于深度学习的图像修复模型,以PyTorch深度学习框架为基础,以PASCAL VOC2012数据集为实验对象。实验表明,基于深度学习的图像修复模型在图像修复问题上取得了良好效果。 展开更多
关键词 pytorch 图像修复 深度学习 人工智能 神经网络
在线阅读 下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部