期刊文献+
共找到305篇文章
< 1 2 16 >
每页显示 20 50 100
Tensor Completion for Recovering Multichannel Audio Signal with Missing Data
1
作者 Lidong Yang Min Liu +2 位作者 Jing Wang Xiang Xie Jingming Kuang 《China Communications》 SCIE CSCD 2019年第4期186-195,共10页
The quality of a multichannel audio signal may be reduced by missing data, which must be recovered before use. The data sets of multichannel audio can be quite large and have more than two axes of variation, such as c... The quality of a multichannel audio signal may be reduced by missing data, which must be recovered before use. The data sets of multichannel audio can be quite large and have more than two axes of variation, such as channel, frame, and feature. To recover missing audio data, we propose a low-rank tensor completion method that is a high-order generalization of matrix completion. First, a multichannel audio signal with missing data is modeled by a three-order tensor. Next, tensor completion is formulated as a convex optimization problem by defining the trace norm of the tensor, and then an augmented Lagrange multiplier method is used for solving the constrained optimization problem. Finally, the missing data is replaced by alternating iteration with a tensor computation. Experiments were conducted to evaluate the effectiveness on data of a 5.1-channel audio signal. The results show that the proposed method outperforms state-of-the-art methods. Moreover, subjective listening tests with MUSHRA(Multiple Stimuli with Hidden Reference and Anchor) indicate that better audio effects were obtained by tensor completion. 展开更多
关键词 TENSOR COMPLETION MISSING data MULTICHANNEL audio CONVEX optimization
在线阅读 下载PDF
VB环境下Audio/Video压缩数据流播放技术的应用
2
作者 顾善发 张中元 《青岛建筑工程学院学报》 2001年第3期56-59,共4页
介绍了在 Windwos操作系统中 ,利用 VB自身条件和原有控件 ,灵活调用 Windows下的动态链接库开发
关键词 MPEG audio/Video数据流 动态链接库
在线阅读 下载PDF
基于图像处理技术在声像资料鉴定中的应用
3
作者 徐金成 邹同浩 《科技风》 2025年第33期4-6,共3页
随着科学技术飞速发展,声像资料已成为现代司法诉讼中不可或缺的重要证据形式。它们以声音、图像等直观方式记录并再现案件现场,对于揭示事实真相、辅助法官做出公正裁决具有不可替代的作用。然而,与此同时,声像资料的易篡改性和伪造可... 随着科学技术飞速发展,声像资料已成为现代司法诉讼中不可或缺的重要证据形式。它们以声音、图像等直观方式记录并再现案件现场,对于揭示事实真相、辅助法官做出公正裁决具有不可替代的作用。然而,与此同时,声像资料的易篡改性和伪造可能性也给司法鉴定带来了新的挑战。图像处理技术在此背景下应运而生,其凭借强大的数据分析与处理能力,有效提高了声像资料鉴定的准确性和科学性。本文将深入探讨图像处理技术在声像资料鉴定中的应用及其重要意义。 展开更多
关键词 图像处理技术 司法鉴定 声像资料鉴定
在线阅读 下载PDF
基于Transformer模型的音乐可视化方法研究
4
作者 樊硕 邵一川 孙海静 《计算机仿真》 2025年第6期539-544,共6页
针对当前音乐可视化模型信息传达不准确,缺乏个性化和差异化问题,提出一种基于Transformer模型的音乐可视化方法。上述模型通过卷积层提取局部特征,并通过Self-Attention层捕捉全局信息。Self-Attention通过优化损失函数来最小化嵌入数... 针对当前音乐可视化模型信息传达不准确,缺乏个性化和差异化问题,提出一种基于Transformer模型的音乐可视化方法。上述模型通过卷积层提取局部特征,并通过Self-Attention层捕捉全局信息。Self-Attention通过优化损失函数来最小化嵌入数据与原始数据之间的差异。通过Transformer来预测音乐在空间中的下一个轨迹点位。以上方法能实时显示不同音乐在三维空间中的轨迹和流动情况,预测的点位与实际点位精准重合,预测可以使音乐轨迹在三维空间中更加平滑的流动。为验证该模型的准确性,在上述模型上做了音乐分类实验,实验结果表明以上方法在避免特征信息丢失、提高分类精度方面表现出优异性能,和其它网络结构相比有明显的综合性能提升。 展开更多
关键词 音乐嵌入 深度学习 音乐数据可视化
在线阅读 下载PDF
使用自注意力机制及数据增强策略的乐曲风格识别方法
5
作者 林怡 徐超兰 龙桂铃 《应用声学》 北大核心 2025年第3期615-626,共12页
乐曲风格识别是音乐信息检索领域的一个关键分支,现有技术,包括卷积神经网络和Transformer模型,常面临特征提取不精细、信息融合不足等问题。针对这些问题,该研究设计了一种时域patch划分和局部-全局注意力机制。时域patch划分方法按照... 乐曲风格识别是音乐信息检索领域的一个关键分支,现有技术,包括卷积神经网络和Transformer模型,常面临特征提取不精细、信息融合不足等问题。针对这些问题,该研究设计了一种时域patch划分和局部-全局注意力机制。时域patch划分方法按照时域方向将整个时间点的频域信息划分为一个patch再输入编码器中,局部-全局注意力机制结合了自注意力的全局建模能力和卷积神经网络的局部特征提取能力,能够同时建模全局和局部信息。这些方法更能适应声频特征并显著提升了乐曲风格的分类性能。模型在GTZAN数据集上的准确率达到了94.80%,同时在UrbanSound8K数据集上的准确率为95.14%,具有较好的鲁棒性,能够适用于多种声频分类任务。 展开更多
关键词 自注意力机制 乐曲风格识别 数据增强 声频特征提取
在线阅读 下载PDF
声景识音:数字化时代声学场景分类的探索与前沿 被引量:1
6
作者 庞鑫 葛凤培 李艳玲 《计算机工程》 北大核心 2025年第6期1-19,共19页
声学场景分类(ASC)旨在让计算机模拟人类听觉识别不同的声学环境,是计算机听觉领域中具有挑战性的任务之一。随着智能音频处理技术以及神经网络学习算法的快速进步,近年来ASC任务也涌现出一系列新算法和新技术。为了全面展示该领域的技... 声学场景分类(ASC)旨在让计算机模拟人类听觉识别不同的声学环境,是计算机听觉领域中具有挑战性的任务之一。随着智能音频处理技术以及神经网络学习算法的快速进步,近年来ASC任务也涌现出一系列新算法和新技术。为了全面展示该领域的技术发展脉络和演进过程,梳理了该领域的早期工作和近期发展,全面介绍了ASC任务。首先描述了ASC的应用场景和面临的挑战;其次详细介绍了ASC的主流框架,重点阐述了应用于此领域的深度学习算法;然后系统性地总结了ASC的前沿探索与延伸任务以及公开数据集;最后对ASC的发展趋势进行探讨与展望。 展开更多
关键词 声学场景分类 深度学习 音频分类 语音识别 数据增强
在线阅读 下载PDF
可控源音频大地电磁测深金属矿的数据处理与应用
7
作者 王在伟 苑高选 +2 位作者 李源 孙杰 谢立洋 《世界有色金属》 2025年第12期180-182,共3页
本文综述可控源音频大地电磁测深(CSAMT)技术的数据处理与解释方法,重点阐述CSAMT的工作原理和在地质勘探中的应用优势,介绍了数据处理中关键技术,分析了线性、非线性和迭代反演算法的优劣及其适用条件,总结不同成图技术特点并探讨了解... 本文综述可控源音频大地电磁测深(CSAMT)技术的数据处理与解释方法,重点阐述CSAMT的工作原理和在地质勘探中的应用优势,介绍了数据处理中关键技术,分析了线性、非线性和迭代反演算法的优劣及其适用条件,总结不同成图技术特点并探讨了解释结果的综合性和多信息解释的重要性。文章还展望了人工智能和多尺度融合技术在未来CSAMT数据处理与解释中的应用潜力,旨为地球物理勘探领域的研究与实践提供参考。此外,以内蒙古哈珠东山地区为例,重点研究可控源音频大地电磁测深在多金属矿普查中的具体应用,在工区布设CSAMT剖面1条,识别出2条北西向隐伏断裂,认为CSAMT在西部覆盖区有着很好的应用前景。 展开更多
关键词 可控源音频大地电磁测深 数据处理 反演方法 成图技术 数据解释
在线阅读 下载PDF
5G时代背景下的音频数据传输优化方法研究
8
作者 马恒瑜 韦林 《电声技术》 2025年第6期100-102,共3页
随着5G技术的商用化,音频数据传输的需求日益增长。探讨5G时代背景下的音频数据传输优化方法,提出一种结合动态网络资源调度、自适应音频压缩、错误控制与抗干扰技术的优化方案。实验结果表明,该方法在传输延迟、带宽占用、误码率以及... 随着5G技术的商用化,音频数据传输的需求日益增长。探讨5G时代背景下的音频数据传输优化方法,提出一种结合动态网络资源调度、自适应音频压缩、错误控制与抗干扰技术的优化方案。实验结果表明,该方法在传输延迟、带宽占用、误码率以及音频质量方面均展现出显著的优化效果,验证其在5G网络环境中的应用潜力。 展开更多
关键词 5G时代 音频数据 传输优化
在线阅读 下载PDF
基于声音增强的异构数据信息检索仿真技术
9
作者 陈玉 《电声技术》 2025年第9期54-56,共3页
针对异构数据环境中信息检索精度低、融合效率不足等问题,提出一种基于声音增强的异构数据信息检索仿真技术。该技术通过构建声音信号增强模型,将音频特征与多模态异构数据进行深度融合,建立集声音特征优化、异构数据融合映射和智能检... 针对异构数据环境中信息检索精度低、融合效率不足等问题,提出一种基于声音增强的异构数据信息检索仿真技术。该技术通过构建声音信号增强模型,将音频特征与多模态异构数据进行深度融合,建立集声音特征优化、异构数据融合映射和智能检索于一体的仿真检索框架。仿真实验表明,该技术在检索准确率、数据融合效率和响应速度等方面均显著优于传统基于文本的信息检索技术,为异构数据信息检索提供了新的技术方案。 展开更多
关键词 异构数据 声音增强 信息检索 仿真技术
在线阅读 下载PDF
人工智能视角下的声像档案管理研究
10
作者 靳晶 《数字通信世界》 2025年第7期189-191,共3页
近年来,人工智能技术的快速发展为档案管理领域,特别是声像档案管理带来了前所未有的机遇。本文系统梳理了人工智能技术在声像档案采集、整理、检索与安全管理中的应用成果,创新性地提出了基于多模态数据融合的智能化管理方法,并在实施... 近年来,人工智能技术的快速发展为档案管理领域,特别是声像档案管理带来了前所未有的机遇。本文系统梳理了人工智能技术在声像档案采集、整理、检索与安全管理中的应用成果,创新性地提出了基于多模态数据融合的智能化管理方法,并在实施路径上提出试点推广、产学研协作及动态评估的框架体系。研究表明,人工智能技术能够显著提升声像档案的管理效率和利用价值,但在技术标准化、多模态数据处理和隐私保护等方面仍需进一步突破。本文旨在推动声像档案管理智能化发展提供理论支撑与实践指导。 展开更多
关键词 人工智能 声像档案 多模态数据融合 智能化管理
在线阅读 下载PDF
北京广播电视台超高清媒体处理平台架构设计与实现
11
作者 付骁 《电视技术》 2025年第5期50-52,59,共4页
媒体处理平台项目作为北京广播电视台超高清媒体工程的关键组成部分,在严格遵循视音频转码、数据迁移等常规系统设计规范的基础上,强化了集群处理、智能调度及业务协同等核心服务能力。重点解析该平台在跨系统媒体数据交互机制、全链路... 媒体处理平台项目作为北京广播电视台超高清媒体工程的关键组成部分,在严格遵循视音频转码、数据迁移等常规系统设计规范的基础上,强化了集群处理、智能调度及业务协同等核心服务能力。重点解析该平台在跨系统媒体数据交互机制、全链路数据调度体系、分布式集群管控架构等关键技术领域的创新设计。 展开更多
关键词 媒体处理集群 系统交互 数据管理调度 视音频处理
在线阅读 下载PDF
音频大地电磁测深法数据质量监控——基于EH4测量电极对数据质量影响因素分析
12
作者 林家勇 徐志敏 周聪 《物探与化探》 2025年第5期1126-1132,共7页
音频大地电磁测深是一种广泛应用于中浅层地质探测的电法勘探技术,影响其数据质量的因素包括人文电磁干扰、电极极化和接地电阻等,本文主要研究电极极化和接地电阻对数据质量的影响规律。首先从理论上分析电极极化作用机理和接地电阻对... 音频大地电磁测深是一种广泛应用于中浅层地质探测的电法勘探技术,影响其数据质量的因素包括人文电磁干扰、电极极化和接地电阻等,本文主要研究电极极化和接地电阻对数据质量的影响规律。首先从理论上分析电极极化作用机理和接地电阻对视电阻率和相位的影响机理。然后结合实测数据分析了电极极化和接地电阻对视电阻率和相位曲线的影响规律,最后通过实测数据二维反演结果对比分析,揭示接地电阻对地质解释结果的影响。研究结果表明:电极极化会显著降低低频段数据质量,但可通过相应数据处理手段予以改善,对高频段影响较小;接地电阻不稳定主要影响高频段数据,造成视电阻率和相位显著降低,至低频段逐渐恢复稳定。此外,接地电阻不稳定将导致反演结果偏离真实地电结构,进而引发错误地质解释。本文研究结果为野外数据采集和资料处理提供了重要参考。 展开更多
关键词 音频大地电磁测深 数据质量 测量电极 电极极化 接地电阻 地质解释
在线阅读 下载PDF
基于大数据分析的教师教育云平台语音互动功能设计
13
作者 任玲 《电声技术》 2025年第4期82-85,共4页
教师教育云平台是实现教育资源共享和提升教师专业发展水平的工具。平台集成大数据、人工智能和语音互动技术,为教师提供远程学习和教学支持,在提高教学质量的同时满足不同学习者的需求。基于大数据分析进行教师教育云平台语音互动功能... 教师教育云平台是实现教育资源共享和提升教师专业发展水平的工具。平台集成大数据、人工智能和语音互动技术,为教师提供远程学习和教学支持,在提高教学质量的同时满足不同学习者的需求。基于大数据分析进行教师教育云平台语音互动功能设计,优化语音和行为数据基础,精益语音转文本的识别技术,改进音频质量优化技术,设计个性化语言反馈系统。实验结果表明,平台在语音识别精度、音频清晰度及反馈满意度等方面表现优秀,可为未来教育技术的发展提供创新思路。 展开更多
关键词 教师教育云平台 大数据分析 语音互动 个性化反馈 音频优化
在线阅读 下载PDF
数字音频技术在职工教育培训系统中的应用
14
作者 李志超 梁晓东 《电声技术》 2025年第5期1-3,共3页
研究数字音频技术在职工教育培训系统中的应用,提出一种融合音频增强、自适应语音交互、多模态学习数据分析的创新培训系统。该系统解决复杂培训场景下音频传递不清、内容固定化及缺乏个性化的问题,显著提高职工学习效率、知识掌握程度... 研究数字音频技术在职工教育培训系统中的应用,提出一种融合音频增强、自适应语音交互、多模态学习数据分析的创新培训系统。该系统解决复杂培训场景下音频传递不清、内容固定化及缺乏个性化的问题,显著提高职工学习效率、知识掌握程度、满意度。实验结果证实该系统在多场景培训中具有卓越性能,为职工教育的智能化发展提供技术支持。 展开更多
关键词 数字音频技术 职工教育培训系统 音频增强 自适应语音交互 多模态学习数据分析
在线阅读 下载PDF
一种高效过滤提纯音频大数据检索方法 被引量:8
15
作者 张兴忠 王运生 +1 位作者 曾智 牛保宁 《计算机研究与发展》 EI CSCD 北大核心 2015年第9期2025-2032,共8页
针对互联网音频大数据的高速检索问题,结合音频指纹技术与过滤-提纯思想,提出一种面向音频大数据的鲁棒高效检索方法.在经典的Philips音频指纹基础上,提出了一种基于bag-of-features(BoF)的音频中间过滤指纹用于快速缩小检索范围,与Fibo... 针对互联网音频大数据的高速检索问题,结合音频指纹技术与过滤-提纯思想,提出一种面向音频大数据的鲁棒高效检索方法.在经典的Philips音频指纹基础上,提出了一种基于bag-of-features(BoF)的音频中间过滤指纹用于快速缩小检索范围,与Fibonacci Hashing检索相比提高检索速度约130倍;并设计了一种基于阈值的固定间隔抽样匹配方法,大幅减少匹配计算量,进一步提高检索速度可达140倍.实验结果显示:使用该方法在约10万首音频中对不同时长的音频片段进行批量检索,平均检索时间均小于1s;对音频进行MP3转换、重采样、随机剪切后再检索,召回率均在99.47%以上,理论准确率接近100%. 展开更多
关键词 音频大数据 高速检索 Philips音频指纹 过滤-提纯 音频中间指纹
在线阅读 下载PDF
基于通用桌面视频会议系统方案的研究和设计 被引量:8
16
作者 张兵 陈云志 《计算机工程与设计》 CSCD 北大核心 2007年第9期2089-2091,共3页
桌面视频会议是利用多媒体技术和数据通信技术通过计算机网络实现的两地或多地信息交互或视频会议的一种高效率、低成本的多媒体通信手段。通过对目前流行的视频会议系统的介绍和分析,提出了一种较为通用的视频会议模型,并对其方案进行... 桌面视频会议是利用多媒体技术和数据通信技术通过计算机网络实现的两地或多地信息交互或视频会议的一种高效率、低成本的多媒体通信手段。通过对目前流行的视频会议系统的介绍和分析,提出了一种较为通用的视频会议模型,并对其方案进行了研究和设计。最后对视频会议未来的发展做出了展望。 展开更多
关键词 桌面视频会议 通信协议 视频 音频 数据压缩
在线阅读 下载PDF
一种数话同传的激光通信系统的实现 被引量:2
17
作者 毕博瑞 陈胜石 +3 位作者 侯风乾 薛常佳 张晓辉 李军芳 《应用光学》 CAS CSCD 北大核心 2011年第6期1291-1294,共4页
针对传统通信模式易被干扰和保密性差的缺点,设计了一种可以同时传送语音和数据的无线激光通信系统。在保证语音不失真的前提下,采用AMBE语音压缩算法,将语音压缩到4 800bit/s的数据率,和数据混合编码后驱动激光器发光;接收端接收激光... 针对传统通信模式易被干扰和保密性差的缺点,设计了一种可以同时传送语音和数据的无线激光通信系统。在保证语音不失真的前提下,采用AMBE语音压缩算法,将语音压缩到4 800bit/s的数据率,和数据混合编码后驱动激光器发光;接收端接收激光后经光电转换、解码处理将语音和数据还原,通过2.5km的通信试验,表明该系统具有传输距离远、语音清晰、数据稳定的特点,在未来的空对空、空对地、地对空、地对地通信中将得到广泛的应用。 展开更多
关键词 无线激光通信 AMBE 语音 数据
在线阅读 下载PDF
基于虚拟仪器技术的音频信号采集与处理 被引量:10
18
作者 全晓莉 周南权 佘丽 《仪表技术与传感器》 CSCD 北大核心 2012年第7期32-34,共3页
以LabVIEW为软件开发平台,使用计算机声卡作为硬件平台,设计开发了一种低成本高性能的音频信号采集分析系统。该系统具有对音频信号的采集、实时动态显示、分析处理、存储和播放等功能。实际应用表明,该系统不仅精度高、稳定、性能可靠... 以LabVIEW为软件开发平台,使用计算机声卡作为硬件平台,设计开发了一种低成本高性能的音频信号采集分析系统。该系统具有对音频信号的采集、实时动态显示、分析处理、存储和播放等功能。实际应用表明,该系统不仅精度高、稳定、性能可靠、易操作,而且也能够实现声卡设计频率范围内的一般数据采集。基于声卡的,尤其是声卡与虚拟仪器相结合的信号采集技术在工程测试测量以及教学实践领域中具有广阔的应用前景。 展开更多
关键词 声卡 音频信号 数据采集 虚拟仪器
在线阅读 下载PDF
基于LabVIEW的声卡数据采集及滤波处理设计 被引量:20
19
作者 孙爱晶 刘毓 马贺洲 《自动化与仪表》 北大核心 2009年第5期45-47,共3页
在LabVIEW的开发环境中,设计了基于PC机声卡的数据采集系统和滤波器,将计算机声卡作为数据采集部分的信号记录仪器,借助声卡中的A/D转换器,实现对声音信号的模数处理。同时,通过滤波器实现对采集的声音信号的滤波处理。实际应用表明,这... 在LabVIEW的开发环境中,设计了基于PC机声卡的数据采集系统和滤波器,将计算机声卡作为数据采集部分的信号记录仪器,借助声卡中的A/D转换器,实现对声音信号的模数处理。同时,通过滤波器实现对采集的声音信号的滤波处理。实际应用表明,这种设计成本低、性价比高、使用简单、易操作,完全能够满足数据采集和滤波的要求。 展开更多
关键词 声卡 LABVIEW 数据采集 滤波器
在线阅读 下载PDF
Ogg Vorbis数字音频编码技术 被引量:6
20
作者 阎建新 董在望 窦维蓓 《电声技术》 北大核心 2003年第9期7-11,共5页
简述了一种无专利要求的OggVorbis数字音频编码的算法,深入分析了其关键技术,并给出了主观测试结果。结果表明这种编码算法的主观声音质量超过MP3和MPEG-4AAC。
关键词 OGG Vorbis 数字音频编码 数据压缩 矢量量化 LPC MDCT
在线阅读 下载PDF
上一页 1 2 16 下一页 到第
使用帮助 返回顶部