期刊文献+
共找到44篇文章
< 1 2 3 >
每页显示 20 50 100
基于贝叶斯算法优化IIR滤波器的HRTF建模 被引量:2
1
作者 昝天祥 周静雷 《自动化应用》 2025年第2期53-56,68,共5页
头相关传递函数(HRTF)可用于定位声源的空间和频谱特征。利用HRTF进行空间声重放,让用户能够在较低的计算成本和有限的计算资源条件下体验虚拟声学环境。提出了一种使用贝叶斯算法优化IIR滤波器进行HRTF建模的方法。首先,设计使用低通... 头相关传递函数(HRTF)可用于定位声源的空间和频谱特征。利用HRTF进行空间声重放,让用户能够在较低的计算成本和有限的计算资源条件下体验虚拟声学环境。提出了一种使用贝叶斯算法优化IIR滤波器进行HRTF建模的方法。首先,设计使用低通、高通、峰值3种滤波器级联组成IIR滤波器;然后,使用贝叶斯算法对峰值滤波器的相关参数进行寻优,得到最优结果;最后,在CIPIC数据集中进行训练,并在其他两种HRTF数据集中进行验证,测试所提方法的泛化性能。实验结果表明,所提方法能够有效对HRTF进行拟合建模,所得到的拟合HRTF的平均谱失真(SD)为5.23dB,并且在3个数据集中都达到了良好的效果,误差不大于0.5dB,满足进行双耳虚拟重放的要求。 展开更多
关键词 空间音频 头相关传输函数 IIR滤波器 贝叶斯算法
在线阅读 下载PDF
基于球形传声器阵列的双耳早期反射重构
2
作者 周运佳 易婧如 +1 位作者 李天佑 林志斌 《声学学报》 北大核心 2025年第6期1601-1613,共13页
为了有效降低双耳房间脉冲响应的测量和存储成本,且提高其在动态双耳合成中的实时调用效率,提出一种基于球形传声器阵列在房间内多个离散位置测量的空间房间脉冲响应来重构房间一定范围内6个自由度(包含3个平动自由度和3个转动自由度)... 为了有效降低双耳房间脉冲响应的测量和存储成本,且提高其在动态双耳合成中的实时调用效率,提出一种基于球形传声器阵列在房间内多个离散位置测量的空间房间脉冲响应来重构房间一定范围内6个自由度(包含3个平动自由度和3个转动自由度)双耳早期反射的方法。在将房间内早期声场抽象为等效声源簇和滤波器系数以重构房间早期脉冲响应的模型基础上,此方法引入等效声源簇的头相关传递函数,以重建来自不同方向的反射声到达双耳的声压。仿真房间实验结果表明,48通道球形传声器阵列能够在两测量位置之间区域有效重构双耳早期反射。真实房间的实验结果验证了本文方法的有效性,并且主观评价实验结果显示其在听感上优于现有的重构方法。 展开更多
关键词 双耳房间脉冲响应 空间声 双耳合成 六自由度
原文传递
广电系统环绕声信号处理技术与应用分析 被引量:1
3
作者 李志远 《电声技术》 2025年第1期96-99,共4页
广电系统中环绕声技术的应用日益广泛,有助于改善听众体验。通过分析环绕声信号在采集、编码、传输以及还原等环节的处理技术,探讨了不同环绕声格式的特点及其在广电系统中的应用。实验对比了各种环绕声处理方案对音质、空间感、兼容性... 广电系统中环绕声技术的应用日益广泛,有助于改善听众体验。通过分析环绕声信号在采集、编码、传输以及还原等环节的处理技术,探讨了不同环绕声格式的特点及其在广电系统中的应用。实验对比了各种环绕声处理方案对音质、空间感、兼容性的影响,结果表明基于对象的音频技术在空间定位精度和跨平台兼容性方面表现优异。同时,自适应比特率传输和高效编解码算法显著增强了系统性能。最后,指出当前技术面临的挑战,并提出相应的优化建议,为广电系统环绕声应用的进一步发展提供参考。 展开更多
关键词 广电系统 环绕声 信号处理 空间音频 音频编解码
在线阅读 下载PDF
低混响条件下双耳Ambisonics重放空间感知质量的客观评价方法
4
作者 易婧如 周运佳 林志斌 《南京大学学报(自然科学版)》 北大核心 2025年第5期781-793,共13页
提出一种基于听觉滤波器模型与声学特征融合的空间感知质量客观评价方法,适用于低混响条件下的双耳Ambisonics重放.首先,使用听觉滤波器模型处理双耳输入信号,提取空间感知相关客观参量,并结合已有的空间感知和音质相关的参量来构建声... 提出一种基于听觉滤波器模型与声学特征融合的空间感知质量客观评价方法,适用于低混响条件下的双耳Ambisonics重放.首先,使用听觉滤波器模型处理双耳输入信号,提取空间感知相关客观参量,并结合已有的空间感知和音质相关的参量来构建声学特征集.然后,采用高斯回归过程(Gaussian Process Regression,GPR)模型建立特征集与主观评分的映射关系,以构建客观评价模型.为了验证该方法的有效性,开展主观评价实验,采用无混响/低混响仿真声学场景中的不同双耳Ambisonics重放算法生成的语音信号作为测试激励信号,获得主观评分数据,使用交叉验证的方式训练客观模型并评估模型性能.实验结果显示,与现有的评价模型相比,提出的模型在预测精确度方面取得了显著提升.此外,使用公开的Ambisonics格式(Ambix)音频及其主观评分数据进行外部验证,进一步证明了提出的模型的泛化能力和稳定性. 展开更多
关键词 空间音频 音质评价 双耳Ambisonics重放 高斯回归过程
在线阅读 下载PDF
基于深度学习的杜比Atmos全景声自动混音技术
5
作者 黄河 《电声技术》 2025年第8期36-38,共3页
提出一种基于深度学习的杜比Atmos全景声自动混音技术解决方案。针对传统自动混音系统在处理空间音频时存在的定位精度不足和场景适应性差等问题,设计层次化的神经网络结构,实现对多通道音频信号的智能化处理。系统包含声学特征提取、... 提出一种基于深度学习的杜比Atmos全景声自动混音技术解决方案。针对传统自动混音系统在处理空间音频时存在的定位精度不足和场景适应性差等问题,设计层次化的神经网络结构,实现对多通道音频信号的智能化处理。系统包含声学特征提取、空间场景分析以及自适应混音控制3个核心模块,通过深度卷积神经网络实现声学参数提取,利用循环神经网络构建时序模型,采用强化学习方法动态优化混音策略。实验结果表明,所提方法在空间声像定位准确度及声场平滑度上有显著提升,同时展现出了良好的健壮性与适应性。 展开更多
关键词 深度学习 自动混音 空间音频 声像定位
在线阅读 下载PDF
Audio Vivid标准关键技术研究及系统试验 被引量:6
6
作者 周芸 庞超 +1 位作者 王喆 郭晓强 《广播与电视技术》 2023年第7期35-42,共8页
本文在对三维声行业标准《三维声编解码及渲染》(Audio Vivid)深入研究的基础上,分析三维声编解码和渲染端到端技术框架,介绍基于神经网络的通用码率音频编码、元数据编码、扬声器渲染和双耳渲染等关键技术,给出卡塔尔世界杯期间Audio V... 本文在对三维声行业标准《三维声编解码及渲染》(Audio Vivid)深入研究的基础上,分析三维声编解码和渲染端到端技术框架,介绍基于神经网络的通用码率音频编码、元数据编码、扬声器渲染和双耳渲染等关键技术,给出卡塔尔世界杯期间Audio Vivid标准端到端技术试验情况,为Audio Vivid标准应用部署提供技术参考。 展开更多
关键词 audio Vivid 三维声 编解码 渲染 HOA空间编码 基于神经网络的音频编码
在线阅读 下载PDF
基于多重信号分类算法的目标测向性能及误差分析
7
作者 田才艳 许浩 +1 位作者 向卓文 郑青青 《通信与信息技术》 2025年第2期45-48,共4页
信号处理中阵列信号作为重要的研究方向,在通信、雷达、声纳、地质勘探和电子对抗等领域有广泛的应用,其中空间谱估计是阵列信号的重要分支。为研究多重信号分类算法的目标测向性能,以音频源为例,在均匀圆阵上,对音频源测向的问题进行研... 信号处理中阵列信号作为重要的研究方向,在通信、雷达、声纳、地质勘探和电子对抗等领域有广泛的应用,其中空间谱估计是阵列信号的重要分支。为研究多重信号分类算法的目标测向性能,以音频源为例,在均匀圆阵上,对音频源测向的问题进行研究,对算法进行验证后从阵元数、信噪比、波长半径比方面分析了算法性能及其误差,得到这三种参数和算法性能都呈正相关,为后续算法改进研究、应用范围提供方向。 展开更多
关键词 空间谱估计 MUSIC算法 圆形阵列 音频源定向
在线阅读 下载PDF
基于音频混音技术的影视声音制作方法
8
作者 柯渊 《电声技术》 2025年第4期96-98,共3页
针对影视声音制作中音轨冲突与动态表现不足的问题,提出一种基于音频混音技术的制作方法。利用频谱分离、动态范围控制及空间化处理技术,优化整合对白、背景音乐、环境音。实证结果表明,该方法在频率均衡性、动态范围稳定性及声场一致... 针对影视声音制作中音轨冲突与动态表现不足的问题,提出一种基于音频混音技术的制作方法。利用频谱分离、动态范围控制及空间化处理技术,优化整合对白、背景音乐、环境音。实证结果表明,该方法在频率均衡性、动态范围稳定性及声场一致性上显著优于传统音频处理方法,显著提升听众的主观评分,为影视声音制作提供有效的技术路径。 展开更多
关键词 影视声音制作 音频混音技术 频谱分离 动态范围控制 空间化处理
在线阅读 下载PDF
空间光通信视音频同步无线传输关键技术研究
9
作者 吴源源 《电声技术》 2024年第10期151-153,共3页
针对空间光通信系统在复杂环境下易出现视音频信号不同步问题,研究一种空间光通信视音频同步无线传输(Spatial Optical Communication Audio-Visual Synchronous Wireless Transmission,SOC-AVSWT)方法。该方法通过高精度时钟同步、高... 针对空间光通信系统在复杂环境下易出现视音频信号不同步问题,研究一种空间光通信视音频同步无线传输(Spatial Optical Communication Audio-Visual Synchronous Wireless Transmission,SOC-AVSWT)方法。该方法通过高精度时钟同步、高速光调制解调、自适应光学波前矫正等关键技术,实现视音频信号的无线同步传输。实验结果表明,在不同大气湍流强度下,SOC-AVSWT方法均表现出良好的性能,误码率最低可达1×10^(-9),时间同步误差控制在纳秒级别。 展开更多
关键词 空间光通信 视音频同步 自适应光学
在线阅读 下载PDF
VR音频技术在体育赛事节目制作中的应用研究
10
作者 黄子轩 胡泽 《中国传媒大学学报(自然科学版)》 2024年第2期52-59,共8页
随着广播电视相关技术的不断成熟,对电视画面质量的探索经历了从标清技术到高清技术的转变,4K、8K等高清视频技术发展的同时,声音技术也在不断发展。全景声、三维声、空间音频的出现,让受众逐渐不满足于立体声甚至环绕声这类平面的声音... 随着广播电视相关技术的不断成熟,对电视画面质量的探索经历了从标清技术到高清技术的转变,4K、8K等高清视频技术发展的同时,声音技术也在不断发展。全景声、三维声、空间音频的出现,让受众逐渐不满足于立体声甚至环绕声这类平面的声音呈现方式,对定位的精确度、空间的还原度提出了更高的要求与期望。在媒介环境学视域下,人们的注意力从单一的视觉中心转向听觉,进一步追求感官上的和谐平衡。本文围绕体育赛事节目中VR音频(又被称为空间音频)的制作,对体育赛事节目中音频带来的多维沉浸进行了分析,并进一步探讨技术变革带来的审美变迁。最后设想了在体育转播声音制作中建立以人的感知为中心的声场,充分利用听觉元素调动多个感官,使观众整体沉浸于比赛之中。打破体育赛事节目中观众传统的听觉习惯是值得尝试的,声音创作在未来将朝着更加自由且人性化的方向发展。 展开更多
关键词 VR音频 空间音频 体育赛事 沉浸感
在线阅读 下载PDF
音频混音技术在多声道录音中的应用 被引量:4
11
作者 耿伊杨 《电视技术》 2024年第9期79-82,共4页
探讨音频混音技术在多声道录音中的应用,以提高音频制作的质量与效果。概述音频混音技术的基本概念和原理,具体分析声道同步、空间定位、频谱均衡、动态处理以及环境效果融合等关键技术在多声道混音中的应用,以期提升混音质量与效果。
关键词 音频混音技术 多声道录音 声道同步 空间定位 动态处理
在线阅读 下载PDF
基于模糊聚类表征的音频例子检索及相关反馈 被引量:15
12
作者 赵雪雁 吴飞 +1 位作者 庄越挺 刘骏伟 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2003年第3期264-268,共5页
避免先前基于例子的音频检索要按照监督机制训练不同类别的复杂的音频模板,直接从原始音频流中提取压缩域特征,使用时空约束机制进行压缩域特征的模糊聚类,用聚类结果的质心来表征整个音频例子,基于聚类质心完成相似度匹配,实现基于非... 避免先前基于例子的音频检索要按照监督机制训练不同类别的复杂的音频模板,直接从原始音频流中提取压缩域特征,使用时空约束机制进行压缩域特征的模糊聚类,用聚类结果的质心来表征整个音频例子,基于聚类质心完成相似度匹配,实现基于非监督机制的音频例子快速检索.并在检索过程中引入相关反馈,根据用户对检索结果的相关反馈调整检索结果,使其与用户的感官相似一致.实验结果表明,此种方法可以达到快速检索的效果,检索准确率可达85%以上. 展开更多
关键词 音频检索 音频模板 例子 模糊聚类 相关反馈机制 语音信号处理
在线阅读 下载PDF
基于具身交互的听觉数字孪生及无人机作战应用 被引量:1
13
作者 靳聪 吴凤鹃 +2 位作者 李波 郭子淳 王晶 《兵器装备工程学报》 CAS CSCD 北大核心 2023年第12期256-262,共7页
听觉数字孪生技术应用在扩展现实、军事虚拟仿真、游戏交互中是必不可少的,以实现身临其境的视听体验。音频的空间化渲染必须与视觉反馈一致,并以最小的延迟响应时间和用户动作进行具身交互。声音的波动性对逼真的具身交互和沉浸式渲染... 听觉数字孪生技术应用在扩展现实、军事虚拟仿真、游戏交互中是必不可少的,以实现身临其境的视听体验。音频的空间化渲染必须与视觉反馈一致,并以最小的延迟响应时间和用户动作进行具身交互。声音的波动性对逼真的具身交互和沉浸式渲染提出了严峻的挑战,并导致巨大的计算成本。从封闭到开放、静态到动态、室内和室外混合区域的虚拟场景到虚实融合的扩展现实体验,带来了运算复杂度的剧增。以一种音频视角来实现“以人为本”的模拟听众和数字孪生体之间的映射关系,通过听觉数字孪生体描述听者和虚拟环境之间的交互行动,建立基于具身交互的面向无人机作战场景的听觉数字孪生系统,实现了扩展现实体验下的空间音频孪生及多感官具身交互,讨论了无人机作战场景下的应用。 展开更多
关键词 数字孪生 军事虚拟仿真 扩展现实 具身交互 空间音频
在线阅读 下载PDF
国际音频技术研究进展 被引量:3
14
作者 沈勇 章艳 +1 位作者 张昕婷 戎潘颖 《电声技术》 2007年第1期78-83,共6页
通过对第117届、118届、119届、120届AES大会的统计分析,介绍了国际上关于扬声器、传声器、信号处理、音频编码、空间感及处理、仪器与测量、扩声、高清音频、多通道声、心理声学感知与听音试验、汽车音响等方面音频技术研究的最新进展。
关键词 音频技术 AES 扬声器 传声器 信号处理 音频编码 空间感及处理 仪器与测量 扩声
在线阅读 下载PDF
基于空间线索时域梯度的音频关注度计算模型 被引量:1
15
作者 杭波 王毅 +1 位作者 康长青 黄健 《系统仿真学报》 CAS CSCD 北大核心 2016年第10期2369-2377,共9页
虚拟现实中方位快速变化的音频信号应当具有较高的关注度,但现有自底向上音频关注度计算模型提取底层音频特征如能量、基音、过零率等,无法有效表达该类信号引起的音频关注度,有可能造成漏检。针对此问题,基于空间信息对关注产生影响的... 虚拟现实中方位快速变化的音频信号应当具有较高的关注度,但现有自底向上音频关注度计算模型提取底层音频特征如能量、基音、过零率等,无法有效表达该类信号引起的音频关注度,有可能造成漏检。针对此问题,基于空间信息对关注产生影响的心理学原理,引入空间线索短时变化梯度,用以度量单声源空间方位快速变化引起的关注。计算由各子带空间线索纽成的空间线索矢量的短对变化均值作为空间线索变化梯度,建立基于空间线索变化梯度的音频关注度模型。与当前音频关注度计算模型相比,关注音频的检出率提高了4.5个百分点。 展开更多
关键词 音频 关注度计算模型 空间线索 梯度
原文传递
一种基于WebVR实现3D音效可视化的方法 被引量:2
16
作者 金益 张量 《软件工程》 2019年第8期14-16,共3页
由于VR场景中用户可以自主选择观看的方向和角度,为了获得最佳的体验效果,VR音频技术要求通过声音辨别方向、距离等反馈更多的空间环境状态。本文主要论述了一种基于WebVR实现音频空间可视化的方法,核心是运用了WebAudioAPI的PannerNode... 由于VR场景中用户可以自主选择观看的方向和角度,为了获得最佳的体验效果,VR音频技术要求通过声音辨别方向、距离等反馈更多的空间环境状态。本文主要论述了一种基于WebVR实现音频空间可视化的方法,核心是运用了WebAudioAPI的PannerNode和AudioListener两个对象处理音频源,其中Three.js提供了完善的音频空间化支持。最后通过VRAudio的案例进行测试,实验表明根据用户的位置和旋转矩阵,可更新音频空间信息。 展开更多
关键词 WebVR 音频空间化 WebaudioAPI 音频源
在线阅读 下载PDF
3D沉浸式音乐录音传声器阵列技术发展综述 被引量:2
17
作者 高杰 《电声技术》 2022年第7期17-22,27,共7页
随着视听技术的发展进步,音频技术从最初的单声道技术发展到现在的3D沉浸式音频技术。3D沉浸式音频是一种划时代的音响创作新趋势,它可以拓宽音乐创作思路,丰富音乐的表现力,让听众实现身临其境的沉浸式体验。3D沉浸式音频初期主要应用... 随着视听技术的发展进步,音频技术从最初的单声道技术发展到现在的3D沉浸式音频技术。3D沉浸式音频是一种划时代的音响创作新趋势,它可以拓宽音乐创作思路,丰富音乐的表现力,让听众实现身临其境的沉浸式体验。3D沉浸式音频初期主要应用于影视领域,后来逐步拓展到音乐、游戏及互联网视频等新领域。近年来,国内外提出了许多用于3D沉浸式音乐录音的传声器阵列技术,为了根据录制内容选择最合适的录制方式,必须了解不同传声器阵列的设计原则以及优缺点等。本文根据传声器的配置、设计理念及用途,对现有几种常见的3D沉浸式传声器阵列进行分类,并对不同传声器阵列的国内外研究成果进行综述,为创建身临其境的听觉体验提供理论和实践上的见解,总结以往研究的局限性和未来3D沉浸式录音方面的研究课题。 展开更多
关键词 3D音频 沉浸式音频 全景声录音 3D录音 空间音频
在线阅读 下载PDF
空间音频编码技术的专利状况分析
18
作者 王馨宁 张飞弦 +3 位作者 康丹丹 辛杰 刘子菡 王雪婷 《电声技术》 2012年第S1期27-28,31,共3页
从申请量增减趋势、区域分布、申请人分布、申请领域分布对空间音频编码技术的专利申请的状况进行了分析,为中国空间音频编码技术的发展方向和专利布局提供参考。
关键词 空间音频编码 专利 环线MPEG
在线阅读 下载PDF
欧洲城市景观的视听设计研究——基于视听案例分析的设计探索 被引量:8
19
作者 刘芳芳 《新建筑》 2014年第5期48-51,共4页
重点对声景体验模式和视景关注点进行分类研究,并结合案例分析城市景观中的视听环境综合分析模拟给设计实践带来的新思维。首先阐明人们对景观的理解除了具有空间和时间的性质,还具有多种感官感知和相互作用的基本属陛。其次,运用扎根... 重点对声景体验模式和视景关注点进行分类研究,并结合案例分析城市景观中的视听环境综合分析模拟给设计实践带来的新思维。首先阐明人们对景观的理解除了具有空间和时间的性质,还具有多种感官感知和相互作用的基本属陛。其次,运用扎根理论分析谢菲尔德城市声景调查结论,并得出声景体验模式;利用布拉格视觉景观的眼动仪实验得出视觉关注点的部分限动规律。然后,对谢菲尔德和平公园进行视听景观综合分析。并在此基础上,提出了进行城市景观视听综合设计的必要性。 展开更多
关键词 声景体验 视觉感知 视听设计 景观品质 空间体验
在线阅读 下载PDF
基于音频数字水印的空间定位技术研究
20
作者 庞玲 《计算机与数字工程》 2012年第6期82-84,120,共4页
深入研究了利于音频数字水印实现空间定位的技术思想,提出了一种在数字音频中嵌入水印信息后,实现对声源的空间定位算法,详细阐述了该算法的设计思想,并分别给出了音频数字水印的嵌入过程和数字水印的提取过程。
关键词 空间定位 音频水印 原理 嵌入算法 提取算法
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部