期刊文献+
共找到310篇文章
< 1 2 16 >
每页显示 20 50 100
Tensor Completion for Recovering Multichannel Audio Signal with Missing Data
1
作者 Lidong Yang Min Liu +2 位作者 Jing Wang Xiang Xie Jingming Kuang 《China Communications》 SCIE CSCD 2019年第4期186-195,共10页
The quality of a multichannel audio signal may be reduced by missing data, which must be recovered before use. The data sets of multichannel audio can be quite large and have more than two axes of variation, such as c... The quality of a multichannel audio signal may be reduced by missing data, which must be recovered before use. The data sets of multichannel audio can be quite large and have more than two axes of variation, such as channel, frame, and feature. To recover missing audio data, we propose a low-rank tensor completion method that is a high-order generalization of matrix completion. First, a multichannel audio signal with missing data is modeled by a three-order tensor. Next, tensor completion is formulated as a convex optimization problem by defining the trace norm of the tensor, and then an augmented Lagrange multiplier method is used for solving the constrained optimization problem. Finally, the missing data is replaced by alternating iteration with a tensor computation. Experiments were conducted to evaluate the effectiveness on data of a 5.1-channel audio signal. The results show that the proposed method outperforms state-of-the-art methods. Moreover, subjective listening tests with MUSHRA(Multiple Stimuli with Hidden Reference and Anchor) indicate that better audio effects were obtained by tensor completion. 展开更多
关键词 TENSOR COMPLETION MISSING data MULTICHANNEL audio CONVEX optimization
在线阅读 下载PDF
深度伪造证据的真实性审查困境及纾解
2
作者 李麒 孙娇 《中南民族大学学报(人文社会科学版)》 北大核心 2026年第3期98-107,185,共11页
深度伪造证据是用户依托深度伪造技术生成的,以虚假图像、文本、音频、视频为表现形式的证据。深度伪造技术以深度学习方法与生成对抗网络为支撑,其生成的深度伪造证据凭借高度仿真特性,突破了传统证据真实性审查的边界,显著加剧了证据... 深度伪造证据是用户依托深度伪造技术生成的,以虚假图像、文本、音频、视频为表现形式的证据。深度伪造技术以深度学习方法与生成对抗网络为支撑,其生成的深度伪造证据凭借高度仿真特性,突破了传统证据真实性审查的边界,显著加剧了证据审查难度。当前深度伪造证据的真实性审查正面临技术、制度和实践三重困境。在技术层面,技术黑箱形成真实性审查鸿沟,过度技术依赖削弱真实性审查自主性;在制度层面,传统真实性审查规则难破深度伪造内容检测困局,传统证明责任分配制度难破深度伪造证据适配困局;在实践层面,司法人员专业壁垒掣肘真实性审查开展,“深度伪造抗辩”加剧真实性审查难度。为纾解深度伪造证据的真实性审查困境,应在技术破壁上穿透深度伪造证据审查的技术黑箱,克服深度伪造证据审查的过度技术依赖;在制度革新上优化深度伪造证据真实性审查规则,健全深度伪造证据证明责任分配机制;在实践中构建深度伪造证据审查技术辅助模式,设定“深度伪造抗辩”滥用的罚则,最终重构深度伪造证据的真实性认定根基,提升司法对深度伪造证据的审查效能。 展开更多
关键词 深度伪造证据 真实性 证据审查 视听资料 电子数据
在线阅读 下载PDF
基于时频融合双分支网络的托辊故障诊断方法
3
作者 王路明 寇子明 +1 位作者 韩聪 李鑫 《煤炭工程》 北大核心 2026年第3期28-35,共8页
带式输送机托辊在长期运行中易受生锈、磨损等故障影响,其早期故障声学信号微弱且易被工业环境强噪声淹没,传统诊断方法存在特征提取不足与鲁棒性差的问题。文章提出一种基于CNN-Swin Transformer双分支特征融合网络(CSF)的故障诊断方... 带式输送机托辊在长期运行中易受生锈、磨损等故障影响,其早期故障声学信号微弱且易被工业环境强噪声淹没,传统诊断方法存在特征提取不足与鲁棒性差的问题。文章提出一种基于CNN-Swin Transformer双分支特征融合网络(CSF)的故障诊断方法。通过融合变分模态分解与快速傅里叶变换构建时频域特征矩阵,结合CNN的局部特征提取优势与Swin Transformer的全局注意力机制,设计SE-CGA注意力机制实现深度特征提取。实验表明,该方法在真实工业数据集上达到98.11%的测试准确率,较单一CNN模型性能提升超过9%。在叠加-15 dB极端噪声时仍保持65.59%的识别精度验证了其在强噪声场景下的诊断鲁棒性与工程应用价值。 展开更多
关键词 深度学习 故障诊断 带式输送机 注意力机制 音频数据
在线阅读 下载PDF
VB环境下Audio/Video压缩数据流播放技术的应用
4
作者 顾善发 张中元 《青岛建筑工程学院学报》 2001年第3期56-59,共4页
介绍了在 Windwos操作系统中 ,利用 VB自身条件和原有控件 ,灵活调用 Windows下的动态链接库开发
关键词 MPEG audio/Video数据流 动态链接库
在线阅读 下载PDF
基于GStreamer框架的移动视音频采集与传输系统
5
作者 李文博 《移动信息》 2026年第3期69-71,共3页
随着移动互联网与多媒体应用的发展,实时视音频传输在远程教育、视频会议和应急指挥等场景中需求不断增加,但复杂的网络环境对传输延时与同步性提出了挑战。针对传统系统跨平台适配差、延迟波动大等问题,文中设计并实现了一套基于GStrea... 随着移动互联网与多媒体应用的发展,实时视音频传输在远程教育、视频会议和应急指挥等场景中需求不断增加,但复杂的网络环境对传输延时与同步性提出了挑战。针对传统系统跨平台适配差、延迟波动大等问题,文中设计并实现了一套基于GStreamer框架的移动视音频采集与传输系统。研究表明,该系统在不同网络环境下均能实现高效、稳定的视音频传输,为实时多媒体通信提供了可行技术路径,具有重要的应用价值。 展开更多
关键词 视音频采集 采集系统 数据传输 处理技术
在线阅读 下载PDF
基于图像处理技术在声像资料鉴定中的应用
6
作者 徐金成 邹同浩 《科技风》 2025年第33期4-6,共3页
随着科学技术飞速发展,声像资料已成为现代司法诉讼中不可或缺的重要证据形式。它们以声音、图像等直观方式记录并再现案件现场,对于揭示事实真相、辅助法官做出公正裁决具有不可替代的作用。然而,与此同时,声像资料的易篡改性和伪造可... 随着科学技术飞速发展,声像资料已成为现代司法诉讼中不可或缺的重要证据形式。它们以声音、图像等直观方式记录并再现案件现场,对于揭示事实真相、辅助法官做出公正裁决具有不可替代的作用。然而,与此同时,声像资料的易篡改性和伪造可能性也给司法鉴定带来了新的挑战。图像处理技术在此背景下应运而生,其凭借强大的数据分析与处理能力,有效提高了声像资料鉴定的准确性和科学性。本文将深入探讨图像处理技术在声像资料鉴定中的应用及其重要意义。 展开更多
关键词 图像处理技术 司法鉴定 声像资料鉴定
在线阅读 下载PDF
基于Transformer模型的音乐可视化方法研究
7
作者 樊硕 邵一川 孙海静 《计算机仿真》 2025年第6期539-544,共6页
针对当前音乐可视化模型信息传达不准确,缺乏个性化和差异化问题,提出一种基于Transformer模型的音乐可视化方法。上述模型通过卷积层提取局部特征,并通过Self-Attention层捕捉全局信息。Self-Attention通过优化损失函数来最小化嵌入数... 针对当前音乐可视化模型信息传达不准确,缺乏个性化和差异化问题,提出一种基于Transformer模型的音乐可视化方法。上述模型通过卷积层提取局部特征,并通过Self-Attention层捕捉全局信息。Self-Attention通过优化损失函数来最小化嵌入数据与原始数据之间的差异。通过Transformer来预测音乐在空间中的下一个轨迹点位。以上方法能实时显示不同音乐在三维空间中的轨迹和流动情况,预测的点位与实际点位精准重合,预测可以使音乐轨迹在三维空间中更加平滑的流动。为验证该模型的准确性,在上述模型上做了音乐分类实验,实验结果表明以上方法在避免特征信息丢失、提高分类精度方面表现出优异性能,和其它网络结构相比有明显的综合性能提升。 展开更多
关键词 音乐嵌入 深度学习 音乐数据可视化
在线阅读 下载PDF
5G时代背景下的音频数据传输优化方法研究 被引量:1
8
作者 马恒瑜 韦林 《电声技术》 2025年第6期100-102,共3页
随着5G技术的商用化,音频数据传输的需求日益增长。探讨5G时代背景下的音频数据传输优化方法,提出一种结合动态网络资源调度、自适应音频压缩、错误控制与抗干扰技术的优化方案。实验结果表明,该方法在传输延迟、带宽占用、误码率以及... 随着5G技术的商用化,音频数据传输的需求日益增长。探讨5G时代背景下的音频数据传输优化方法,提出一种结合动态网络资源调度、自适应音频压缩、错误控制与抗干扰技术的优化方案。实验结果表明,该方法在传输延迟、带宽占用、误码率以及音频质量方面均展现出显著的优化效果,验证其在5G网络环境中的应用潜力。 展开更多
关键词 5G时代 音频数据 传输优化
在线阅读 下载PDF
使用自注意力机制及数据增强策略的乐曲风格识别方法
9
作者 林怡 徐超兰 龙桂铃 《应用声学》 北大核心 2025年第3期615-626,共12页
乐曲风格识别是音乐信息检索领域的一个关键分支,现有技术,包括卷积神经网络和Transformer模型,常面临特征提取不精细、信息融合不足等问题。针对这些问题,该研究设计了一种时域patch划分和局部-全局注意力机制。时域patch划分方法按照... 乐曲风格识别是音乐信息检索领域的一个关键分支,现有技术,包括卷积神经网络和Transformer模型,常面临特征提取不精细、信息融合不足等问题。针对这些问题,该研究设计了一种时域patch划分和局部-全局注意力机制。时域patch划分方法按照时域方向将整个时间点的频域信息划分为一个patch再输入编码器中,局部-全局注意力机制结合了自注意力的全局建模能力和卷积神经网络的局部特征提取能力,能够同时建模全局和局部信息。这些方法更能适应声频特征并显著提升了乐曲风格的分类性能。模型在GTZAN数据集上的准确率达到了94.80%,同时在UrbanSound8K数据集上的准确率为95.14%,具有较好的鲁棒性,能够适用于多种声频分类任务。 展开更多
关键词 自注意力机制 乐曲风格识别 数据增强 声频特征提取
在线阅读 下载PDF
声景识音:数字化时代声学场景分类的探索与前沿 被引量:1
10
作者 庞鑫 葛凤培 李艳玲 《计算机工程》 北大核心 2025年第6期1-19,共19页
声学场景分类(ASC)旨在让计算机模拟人类听觉识别不同的声学环境,是计算机听觉领域中具有挑战性的任务之一。随着智能音频处理技术以及神经网络学习算法的快速进步,近年来ASC任务也涌现出一系列新算法和新技术。为了全面展示该领域的技... 声学场景分类(ASC)旨在让计算机模拟人类听觉识别不同的声学环境,是计算机听觉领域中具有挑战性的任务之一。随着智能音频处理技术以及神经网络学习算法的快速进步,近年来ASC任务也涌现出一系列新算法和新技术。为了全面展示该领域的技术发展脉络和演进过程,梳理了该领域的早期工作和近期发展,全面介绍了ASC任务。首先描述了ASC的应用场景和面临的挑战;其次详细介绍了ASC的主流框架,重点阐述了应用于此领域的深度学习算法;然后系统性地总结了ASC的前沿探索与延伸任务以及公开数据集;最后对ASC的发展趋势进行探讨与展望。 展开更多
关键词 声学场景分类 深度学习 音频分类 语音识别 数据增强
在线阅读 下载PDF
可控源音频大地电磁测深金属矿的数据处理与应用
11
作者 王在伟 苑高选 +2 位作者 李源 孙杰 谢立洋 《世界有色金属》 2025年第12期180-182,共3页
本文综述可控源音频大地电磁测深(CSAMT)技术的数据处理与解释方法,重点阐述CSAMT的工作原理和在地质勘探中的应用优势,介绍了数据处理中关键技术,分析了线性、非线性和迭代反演算法的优劣及其适用条件,总结不同成图技术特点并探讨了解... 本文综述可控源音频大地电磁测深(CSAMT)技术的数据处理与解释方法,重点阐述CSAMT的工作原理和在地质勘探中的应用优势,介绍了数据处理中关键技术,分析了线性、非线性和迭代反演算法的优劣及其适用条件,总结不同成图技术特点并探讨了解释结果的综合性和多信息解释的重要性。文章还展望了人工智能和多尺度融合技术在未来CSAMT数据处理与解释中的应用潜力,旨为地球物理勘探领域的研究与实践提供参考。此外,以内蒙古哈珠东山地区为例,重点研究可控源音频大地电磁测深在多金属矿普查中的具体应用,在工区布设CSAMT剖面1条,识别出2条北西向隐伏断裂,认为CSAMT在西部覆盖区有着很好的应用前景。 展开更多
关键词 可控源音频大地电磁测深 数据处理 反演方法 成图技术 数据解释
在线阅读 下载PDF
智能化广电视听数据共享平台的微服务架构设计与实现
12
作者 蒋惠敏 《电声技术》 2025年第12期21-23,33,共4页
针对当前广播电视与网络视听行业基层优质内容供给不足、资源分散、协同效率低下等突出问题,提出一种智能化广电视听数据共享平台设计方案。该方案通过融合云计算、微服务与人工智能(Artificial Intelligence,AI)等技术,为打破资源壁垒... 针对当前广播电视与网络视听行业基层优质内容供给不足、资源分散、协同效率低下等突出问题,提出一种智能化广电视听数据共享平台设计方案。该方案通过融合云计算、微服务与人工智能(Artificial Intelligence,AI)等技术,为打破资源壁垒、提升基层内容供给效能提供了系统化解决路径。 展开更多
关键词 人工智能(AI) 微服务 广电视听数据 共享平台 系统架构
在线阅读 下载PDF
基于声音增强的异构数据信息检索仿真技术
13
作者 陈玉 《电声技术》 2025年第9期54-56,共3页
针对异构数据环境中信息检索精度低、融合效率不足等问题,提出一种基于声音增强的异构数据信息检索仿真技术。该技术通过构建声音信号增强模型,将音频特征与多模态异构数据进行深度融合,建立集声音特征优化、异构数据融合映射和智能检... 针对异构数据环境中信息检索精度低、融合效率不足等问题,提出一种基于声音增强的异构数据信息检索仿真技术。该技术通过构建声音信号增强模型,将音频特征与多模态异构数据进行深度融合,建立集声音特征优化、异构数据融合映射和智能检索于一体的仿真检索框架。仿真实验表明,该技术在检索准确率、数据融合效率和响应速度等方面均显著优于传统基于文本的信息检索技术,为异构数据信息检索提供了新的技术方案。 展开更多
关键词 异构数据 声音增强 信息检索 仿真技术
在线阅读 下载PDF
人工智能视角下的声像档案管理研究
14
作者 靳晶 《数字通信世界》 2025年第7期189-191,共3页
近年来,人工智能技术的快速发展为档案管理领域,特别是声像档案管理带来了前所未有的机遇。本文系统梳理了人工智能技术在声像档案采集、整理、检索与安全管理中的应用成果,创新性地提出了基于多模态数据融合的智能化管理方法,并在实施... 近年来,人工智能技术的快速发展为档案管理领域,特别是声像档案管理带来了前所未有的机遇。本文系统梳理了人工智能技术在声像档案采集、整理、检索与安全管理中的应用成果,创新性地提出了基于多模态数据融合的智能化管理方法,并在实施路径上提出试点推广、产学研协作及动态评估的框架体系。研究表明,人工智能技术能够显著提升声像档案的管理效率和利用价值,但在技术标准化、多模态数据处理和隐私保护等方面仍需进一步突破。本文旨在推动声像档案管理智能化发展提供理论支撑与实践指导。 展开更多
关键词 人工智能 声像档案 多模态数据融合 智能化管理
在线阅读 下载PDF
数字音频技术在职工教育培训系统中的应用 被引量:1
15
作者 李志超 梁晓东 《电声技术》 2025年第5期1-3,共3页
研究数字音频技术在职工教育培训系统中的应用,提出一种融合音频增强、自适应语音交互、多模态学习数据分析的创新培训系统。该系统解决复杂培训场景下音频传递不清、内容固定化及缺乏个性化的问题,显著提高职工学习效率、知识掌握程度... 研究数字音频技术在职工教育培训系统中的应用,提出一种融合音频增强、自适应语音交互、多模态学习数据分析的创新培训系统。该系统解决复杂培训场景下音频传递不清、内容固定化及缺乏个性化的问题,显著提高职工学习效率、知识掌握程度、满意度。实验结果证实该系统在多场景培训中具有卓越性能,为职工教育的智能化发展提供技术支持。 展开更多
关键词 数字音频技术 职工教育培训系统 音频增强 自适应语音交互 多模态学习数据分析
在线阅读 下载PDF
网络视听平台中的数据中台设计与应用
16
作者 张荣波 《电视技术》 2025年第11期66-69,共4页
针对网络视听平台数据的归集、治理及应用需求,采用大数据平台开发、大数据分析与报表工具等关键技术,设计包含计算与存储平台层、数据中台层、大数据应用层的数据中台方案,介绍数据中台在用户画像、运营分析等方面的应用,阐明数据中台... 针对网络视听平台数据的归集、治理及应用需求,采用大数据平台开发、大数据分析与报表工具等关键技术,设计包含计算与存储平台层、数据中台层、大数据应用层的数据中台方案,介绍数据中台在用户画像、运营分析等方面的应用,阐明数据中台对网络视听平台发展的重要赋能作用。 展开更多
关键词 数据中台 网络视听平台 用户画像 运营分析
在线阅读 下载PDF
北京广播电视台超高清媒体处理平台架构设计与实现
17
作者 付骁 《电视技术》 2025年第5期50-52,59,共4页
媒体处理平台项目作为北京广播电视台超高清媒体工程的关键组成部分,在严格遵循视音频转码、数据迁移等常规系统设计规范的基础上,强化了集群处理、智能调度及业务协同等核心服务能力。重点解析该平台在跨系统媒体数据交互机制、全链路... 媒体处理平台项目作为北京广播电视台超高清媒体工程的关键组成部分,在严格遵循视音频转码、数据迁移等常规系统设计规范的基础上,强化了集群处理、智能调度及业务协同等核心服务能力。重点解析该平台在跨系统媒体数据交互机制、全链路数据调度体系、分布式集群管控架构等关键技术领域的创新设计。 展开更多
关键词 媒体处理集群 系统交互 数据管理调度 视音频处理
在线阅读 下载PDF
音频大地电磁测深法数据质量监控——基于EH4测量电极对数据质量影响因素分析
18
作者 林家勇 徐志敏 周聪 《物探与化探》 2025年第5期1126-1132,共7页
音频大地电磁测深是一种广泛应用于中浅层地质探测的电法勘探技术,影响其数据质量的因素包括人文电磁干扰、电极极化和接地电阻等,本文主要研究电极极化和接地电阻对数据质量的影响规律。首先从理论上分析电极极化作用机理和接地电阻对... 音频大地电磁测深是一种广泛应用于中浅层地质探测的电法勘探技术,影响其数据质量的因素包括人文电磁干扰、电极极化和接地电阻等,本文主要研究电极极化和接地电阻对数据质量的影响规律。首先从理论上分析电极极化作用机理和接地电阻对视电阻率和相位的影响机理。然后结合实测数据分析了电极极化和接地电阻对视电阻率和相位曲线的影响规律,最后通过实测数据二维反演结果对比分析,揭示接地电阻对地质解释结果的影响。研究结果表明:电极极化会显著降低低频段数据质量,但可通过相应数据处理手段予以改善,对高频段影响较小;接地电阻不稳定主要影响高频段数据,造成视电阻率和相位显著降低,至低频段逐渐恢复稳定。此外,接地电阻不稳定将导致反演结果偏离真实地电结构,进而引发错误地质解释。本文研究结果为野外数据采集和资料处理提供了重要参考。 展开更多
关键词 音频大地电磁测深 数据质量 测量电极 电极极化 接地电阻 地质解释
在线阅读 下载PDF
基于大数据分析的教师教育云平台语音互动功能设计
19
作者 任玲 《电声技术》 2025年第4期82-85,共4页
教师教育云平台是实现教育资源共享和提升教师专业发展水平的工具。平台集成大数据、人工智能和语音互动技术,为教师提供远程学习和教学支持,在提高教学质量的同时满足不同学习者的需求。基于大数据分析进行教师教育云平台语音互动功能... 教师教育云平台是实现教育资源共享和提升教师专业发展水平的工具。平台集成大数据、人工智能和语音互动技术,为教师提供远程学习和教学支持,在提高教学质量的同时满足不同学习者的需求。基于大数据分析进行教师教育云平台语音互动功能设计,优化语音和行为数据基础,精益语音转文本的识别技术,改进音频质量优化技术,设计个性化语言反馈系统。实验结果表明,平台在语音识别精度、音频清晰度及反馈满意度等方面表现优秀,可为未来教育技术的发展提供创新思路。 展开更多
关键词 教师教育云平台 大数据分析 语音互动 个性化反馈 音频优化
在线阅读 下载PDF
一种高效过滤提纯音频大数据检索方法 被引量:8
20
作者 张兴忠 王运生 +1 位作者 曾智 牛保宁 《计算机研究与发展》 EI CSCD 北大核心 2015年第9期2025-2032,共8页
针对互联网音频大数据的高速检索问题,结合音频指纹技术与过滤-提纯思想,提出一种面向音频大数据的鲁棒高效检索方法.在经典的Philips音频指纹基础上,提出了一种基于bag-of-features(BoF)的音频中间过滤指纹用于快速缩小检索范围,与Fibo... 针对互联网音频大数据的高速检索问题,结合音频指纹技术与过滤-提纯思想,提出一种面向音频大数据的鲁棒高效检索方法.在经典的Philips音频指纹基础上,提出了一种基于bag-of-features(BoF)的音频中间过滤指纹用于快速缩小检索范围,与Fibonacci Hashing检索相比提高检索速度约130倍;并设计了一种基于阈值的固定间隔抽样匹配方法,大幅减少匹配计算量,进一步提高检索速度可达140倍.实验结果显示:使用该方法在约10万首音频中对不同时长的音频片段进行批量检索,平均检索时间均小于1s;对音频进行MP3转换、重采样、随机剪切后再检索,召回率均在99.47%以上,理论准确率接近100%. 展开更多
关键词 音频大数据 高速检索 Philips音频指纹 过滤-提纯 音频中间指纹
在线阅读 下载PDF
上一页 1 2 16 下一页 到第
使用帮助 返回顶部