期刊文献+
共找到443篇文章
< 1 2 23 >
每页显示 20 50 100
MPEG/AUDIO LayerⅢ编解码算法研究与解码的DSP软件实现 被引量:2
1
作者 黄晓利 陈健 《电讯技术》 北大核心 1998年第2期25-30,共6页
本文介绍了ISO/MPEG音频压缩编解layerⅢ规定的64kbps编解码标准,及其DSP实现。作者据此标准完成了计算机C语言模拟仿真,获得满意的重建音乐信号质量。且对解码器的DSP实现进行了研究,通过TMS320C... 本文介绍了ISO/MPEG音频压缩编解layerⅢ规定的64kbps编解码标准,及其DSP实现。作者据此标准完成了计算机C语言模拟仿真,获得满意的重建音乐信号质量。且对解码器的DSP实现进行了研究,通过TMS320C548模拟器对解码器的仿真,取得了与C语言一致的结果。 展开更多
关键词 数字音频技术 声音压缩 MPEG 信号处理
在线阅读 下载PDF
Filter algorithm based on cochlear mechanics and neuron filter mechanism and application on enhancement of audio signals 被引量:2
2
作者 GAO Wa KAN Yue ZHA Fu-sheng 《Journal of Central South University》 SCIE EI CAS CSCD 2021年第6期1813-1828,共16页
A filter algorithm based on cochlear mechanics and neuron filter mechanism is proposed from the view point of vibration.It helps to solve the problem that the non-linear amplification is rarely considered in studying ... A filter algorithm based on cochlear mechanics and neuron filter mechanism is proposed from the view point of vibration.It helps to solve the problem that the non-linear amplification is rarely considered in studying the auditory filters.A cochlear mechanical transduction model is built to illustrate the audio signals processing procedure in cochlea,and then the neuron filter mechanism is modeled to indirectly obtain the outputs with the cochlear properties of frequency tuning and non-linear amplification.The mathematic description of the proposed algorithm is derived by the two models.The parameter space,the parameter selection rules and the error correction of the proposed algorithm are discussed.The unit impulse responses in the time domain and the frequency domain are simulated and compared to probe into the characteristics of the proposed algorithm.Then a 24-channel filter bank is built based on the proposed algorithm and applied to the enhancements of the audio signals.The experiments and comparisons verify that,the proposed algorithm can effectively divide the audio signals into different frequencies,significantly enhance the high frequency parts,and provide positive impacts on the performance of speech enhancement in different noise environments,especially for the babble noise and the volvo noise. 展开更多
关键词 COCHLEA neuron filter audio signal processing speech enhancement
在线阅读 下载PDF
HI-FI AUDIO CODING TECHNOLOGY FOR ISDN
3
作者 黄晓利 陈健 《Journal of Shanghai Jiaotong university(Science)》 EI 1998年第2期63-67,共5页
A Hi Fi audio coding technology for ISDN and Internet is introduced. It is the ISO/MPEG Audio Layer III digital audio compression scheme coding at 64 kbit/s. First, the paper implements C language simulation accordin... A Hi Fi audio coding technology for ISDN and Internet is introduced. It is the ISO/MPEG Audio Layer III digital audio compression scheme coding at 64 kbit/s. First, the paper implements C language simulation according to the algorithm and gets satisfactory quality of the reconstructed music signal. The estimation of operation steps and simulation of decoder finished by a TMS 320C548 simulator are presented. The result is the same as that of the C language simulation. 展开更多
关键词 source CODING audio compression MPEG SIGNAL processing
在线阅读 下载PDF
AudioDirector软件在声音处理中的应用研究 被引量:2
4
作者 吴冬晨 《电脑知识与技术》 2014年第3期1559-1562,共4页
通过AudioDirector软件在声音处理中的应用,包括音频管理、音频编缉、音频修复及音频混合功能,是一套功能强大、操作直觉化的专业声音处理软件。
关键词 audioDirector软件 声音处理 音频管理 音频编缉 音频修复 音频混合
在线阅读 下载PDF
On‐device audio‐visual multi‐person wake word spotting
5
作者 Yidi Li Guoquan Wang +2 位作者 Zhan Chen Hao Tang Hong Liu 《CAAI Transactions on Intelligence Technology》 SCIE EI 2023年第4期1578-1589,共12页
Audio‐visual wake word spotting is a challenging multi‐modal task that exploits visual information of lip motion patterns to supplement acoustic speech to improve overall detection performance.However,most audio‐vi... Audio‐visual wake word spotting is a challenging multi‐modal task that exploits visual information of lip motion patterns to supplement acoustic speech to improve overall detection performance.However,most audio‐visual wake word spotting models are only suitable for simple single‐speaker scenarios and require high computational complexity.Further development is hindered by complex multi‐person scenarios and computational limitations in mobile environments.In this paper,a novel audio‐visual model is proposed for on‐device multi‐person wake word spotting.Firstly,an attention‐based audio‐visual voice activity detection module is presented,which generates an attention score matrix of audio and visual representations to derive active speaker representation.Secondly,the knowledge distillation method is introduced to transfer knowledge from the large model to the on‐device model to control the size of our model.Moreover,a new audio‐visual dataset,PKU‐KWS,is collected for sentence‐level multi‐person wake word spotting.Experimental results on the PKU‐KWS dataset show that this approach outperforms the previous state‐of‐the‐art methods. 展开更多
关键词 audio‐visual fusion human‐computer interfacing speech processing
在线阅读 下载PDF
Automatic recognition of depression based on audio and video:A review
6
作者 Meng-Meng Han Xing-Yun Li +4 位作者 Xin-Yu Yi Yun-Shao Zheng Wei-Li Xia Ya-Fei Liu Qing-Xiang Wang 《World Journal of Psychiatry》 SCIE 2024年第2期225-233,共9页
Depression is a common mental health disorder.With current depression detection methods,specialized physicians often engage in conversations and physiological examinations based on standardized scales as auxiliary mea... Depression is a common mental health disorder.With current depression detection methods,specialized physicians often engage in conversations and physiological examinations based on standardized scales as auxiliary measures for depression assessment.Non-biological markers-typically classified as verbal or non-verbal and deemed crucial evaluation criteria for depression-have not been effectively utilized.Specialized physicians usually require extensive training and experience to capture changes in these features.Advancements in deep learning technology have provided technical support for capturing non-biological markers.Several researchers have proposed automatic depression estimation(ADE)systems based on sounds and videos to assist physicians in capturing these features and conducting depression screening.This article summarizes commonly used public datasets and recent research on audio-and video-based ADE based on three perspectives:Datasets,deficiencies in existing research,and future development directions. 展开更多
关键词 Depression recognition Deep learning Automatic depression estimation System audio processing Image processing Feature fusion Future development
暂未订购
基于图像处理技术在声像资料鉴定中的应用
7
作者 徐金成 邹同浩 《科技风》 2025年第33期4-6,共3页
随着科学技术飞速发展,声像资料已成为现代司法诉讼中不可或缺的重要证据形式。它们以声音、图像等直观方式记录并再现案件现场,对于揭示事实真相、辅助法官做出公正裁决具有不可替代的作用。然而,与此同时,声像资料的易篡改性和伪造可... 随着科学技术飞速发展,声像资料已成为现代司法诉讼中不可或缺的重要证据形式。它们以声音、图像等直观方式记录并再现案件现场,对于揭示事实真相、辅助法官做出公正裁决具有不可替代的作用。然而,与此同时,声像资料的易篡改性和伪造可能性也给司法鉴定带来了新的挑战。图像处理技术在此背景下应运而生,其凭借强大的数据分析与处理能力,有效提高了声像资料鉴定的准确性和科学性。本文将深入探讨图像处理技术在声像资料鉴定中的应用及其重要意义。 展开更多
关键词 图像处理技术 司法鉴定 声像资料鉴定
在线阅读 下载PDF
基于AI的噪声特征处理方法的研究
8
作者 崔建忠 《计算机应用文摘》 2025年第12期98-100,共3页
通过应用深度学习和机器学习算法,AI技术已广泛应用于音频信号处理领域,特别是在噪声识别与去除方面取得了显著成效。深度神经网络能够自动提取音频中的时频特征,精准区分噪声与语音成分,实现高效降噪处理。同时,传统机器学习方法(如SVM... 通过应用深度学习和机器学习算法,AI技术已广泛应用于音频信号处理领域,特别是在噪声识别与去除方面取得了显著成效。深度神经网络能够自动提取音频中的时频特征,精准区分噪声与语音成分,实现高效降噪处理。同时,传统机器学习方法(如SVM、K近邻算法)可在特定场景下结合特征工程进行辅助识别。通过训练模型识别不同类型的噪声并重建纯净音频,AI系统显著提升了语音清晰度和用户体验,被广泛应用于语音助手、在线会议、智能设备等领域。 展开更多
关键词 AI降噪 噪声特征处理 深度学习 音频质量
在线阅读 下载PDF
基于人工智能的广播电视音频自动化处理技术研究 被引量:4
9
作者 张军武 《信息与电脑》 2025年第3期48-50,共3页
随着人工智能(Artificial Intelligence,AI)技术在广播电视音频处理领域的应用日益深入,研究通过对三种主流音频编解码算法在不同比特率下的性能评估,分析了人工智能辅助音频降噪、音质增强等技术的应用效果。实验结果表明,基于深度学... 随着人工智能(Artificial Intelligence,AI)技术在广播电视音频处理领域的应用日益深入,研究通过对三种主流音频编解码算法在不同比特率下的性能评估,分析了人工智能辅助音频降噪、音质增强等技术的应用效果。实验结果表明,基于深度学习的音频处理模型在256 kb/s比特率下,可使信噪比提升42 dB,音质评分达到8.7分。研究证实,人工智能技术能显著提高广播电视音频处理的自动化水平和质量标准,为行业发展提供技术支持。 展开更多
关键词 人工智能 广播电视 音频处理 自动化处理技术
在线阅读 下载PDF
广播电视工程中数字音频技术的应用 被引量:1
10
作者 尚爱鑫 《电声技术》 2025年第1期65-67,共3页
随着信息技术的迅猛发展,数字音频技术凭借其突出优势正逐步取代传统的模拟音频技术,已成为广播电视工程中不可或缺的一部分。从数字音频技术的基本原理出发,探讨广播电视工程中数字音频技术的应用要点。重点分析数字音频技术在广播电... 随着信息技术的迅猛发展,数字音频技术凭借其突出优势正逐步取代传统的模拟音频技术,已成为广播电视工程中不可或缺的一部分。从数字音频技术的基本原理出发,探讨广播电视工程中数字音频技术的应用要点。重点分析数字音频技术在广播电视节目制作、传输、接收等环节的应用效果,以促进广播电视工程数字化发展。 展开更多
关键词 广播电视工程 数字音频 技术要点 音频处理
在线阅读 下载PDF
广电系统环绕声信号处理技术与应用分析 被引量:1
11
作者 李志远 《电声技术》 2025年第1期96-99,共4页
广电系统中环绕声技术的应用日益广泛,有助于改善听众体验。通过分析环绕声信号在采集、编码、传输以及还原等环节的处理技术,探讨了不同环绕声格式的特点及其在广电系统中的应用。实验对比了各种环绕声处理方案对音质、空间感、兼容性... 广电系统中环绕声技术的应用日益广泛,有助于改善听众体验。通过分析环绕声信号在采集、编码、传输以及还原等环节的处理技术,探讨了不同环绕声格式的特点及其在广电系统中的应用。实验对比了各种环绕声处理方案对音质、空间感、兼容性的影响,结果表明基于对象的音频技术在空间定位精度和跨平台兼容性方面表现优异。同时,自适应比特率传输和高效编解码算法显著增强了系统性能。最后,指出当前技术面临的挑战,并提出相应的优化建议,为广电系统环绕声应用的进一步发展提供参考。 展开更多
关键词 广电系统 环绕声 信号处理 空间音频 音频编解码
在线阅读 下载PDF
基于音频处理技术的移动应用语音识别系统设计
12
作者 李震 陶亮 何凯霖 《电声技术》 2025年第3期92-96,共5页
设计一种基于音频处理技术的移动应用语音识别系统,结合麦克风阵列、高性能处理器、深度学习模型,实现噪声环境下的高准确率和稳定识别。运行测试结果表明,系统功能稳定、性能优越。
关键词 音频处理 移动应用 语音识别系统
在线阅读 下载PDF
DSP技术在广播电视音频信号处理优化中的应用 被引量:1
13
作者 刘念 《电声技术》 2025年第3期147-150,共4页
随着广播电视行业的快速发展,音频信号的质量成为提升视听体验的关键因素。传统音频处理方法已无法满足现代广播电视系统对音频清晰度、动态范围及噪声控制的高要求,数字信号处理(Digital Signal Processing,DSP)技术以其强大的计算能... 随着广播电视行业的快速发展,音频信号的质量成为提升视听体验的关键因素。传统音频处理方法已无法满足现代广播电视系统对音频清晰度、动态范围及噪声控制的高要求,数字信号处理(Digital Signal Processing,DSP)技术以其强大的计算能力和灵活的处理方式成为解决此问题的有效手段。重点研究DSP技术在广播电视音频信号处理中的优化措施,探讨优化噪声抑制算法、动态范围压缩、增强音频均衡处理以及集成回声消除算法等技术的融合应用。这些技术的有效结合能够显著减少噪声对音频质量的干扰,精确检测音频信号的动态变化,确保音频信号的均衡,并有效消除音频信号中的回声。 展开更多
关键词 数字信号处理(DSP)技术 广播电视 音频信号处理
在线阅读 下载PDF
基于Gammachirp的自适应听力损失模拟系统
14
作者 刘文鹏 刘凯 《工业控制计算机》 2025年第1期55-57,共3页
听力损失模拟系统通常用于为听力正常的听众演示听力损失的后果。一个准确、合理的听力损失模拟系统对于助听器开发和听力损失研究而言至关重要。基于Gammachirp滤波器,从系统输入输出的角度出发,根据正常听者和听力损失对象的听阈,对... 听力损失模拟系统通常用于为听力正常的听众演示听力损失的后果。一个准确、合理的听力损失模拟系统对于助听器开发和听力损失研究而言至关重要。基于Gammachirp滤波器,从系统输入输出的角度出发,根据正常听者和听力损失对象的听阈,对听觉滤波器进行线性补偿,实现了一种新的感音神经性听力损失模拟系统。该系统能够针对不同听众的听力特性单独处理音频,并准确模拟出不同条件下的听力损失。对不同听力条件的听众进行的实验表明,所构建的自适应听力损失模拟系统符合听觉滤波器的压缩特性,能够准确模拟出不同听力损失患者的目标听阈。 展开更多
关键词 听力损失模拟 Gammachirp filter 音频处理 听觉滤波器
在线阅读 下载PDF
智能化视频直播系统在传统广播直播间的设计与实现 被引量:1
15
作者 曹桔香 王志杰 《广播与电视技术》 2025年第3期31-36,共6页
为实现新媒体时代的转型发展,需要对传统广播直播间进行融合制播平台改造,以实现多信源采集、音视频共做和多渠道分发。本文简要阐述项目的需求背景,并兼顾传统广播及广播新媒体需求,重点分析整个系统架构及实现难点,最终设计实现了智... 为实现新媒体时代的转型发展,需要对传统广播直播间进行融合制播平台改造,以实现多信源采集、音视频共做和多渠道分发。本文简要阐述项目的需求背景,并兼顾传统广播及广播新媒体需求,重点分析整个系统架构及实现难点,最终设计实现了智能化视频直播系统,满足了节目创新创优,并有效缩减了人力和系统成本。 展开更多
关键词 视频直播系统 自动切换 逻辑控制 音频处理
在线阅读 下载PDF
基于视音频技术的广播电视节目质量提升研究 被引量:1
16
作者 茹国钰 《电视技术》 2025年第3期222-225,共4页
随着科学技术的迅猛进步,视音频技术已广泛渗透于广播电视领域,成为提升节目质量的关键因素。深入剖析视音频技术的核心特性及其在节目制作中的实际应用,如高清视频捕捉、音频精细处理、多媒体融合呈现及互动体验增强等,并结合具体实践... 随着科学技术的迅猛进步,视音频技术已广泛渗透于广播电视领域,成为提升节目质量的关键因素。深入剖析视音频技术的核心特性及其在节目制作中的实际应用,如高清视频捕捉、音频精细处理、多媒体融合呈现及互动体验增强等,并结合具体实践案例,提出一系列切实可行的策略。这些策略涵盖从设备选型到后期制作,从音频优化到互动环节设计的全方位指导,旨在为广播电视节目制作提供有力支持,助力节目在激烈的市场竞争中脱颖而出,赢得观众的青睐与好评。 展开更多
关键词 视音频技术 广播电视节目 制作流程 观众需求
在线阅读 下载PDF
深度学习在解码大脑语音信息中的应用
17
作者 杨淑淇 谭颖 《西南民族大学学报(自然科学版)》 2025年第3期315-322,共8页
医疗保健和神经科学界长期致力于从大脑活动中解码语言信息.脑机接口在支持获得性脑损伤患者通过大脑信号重新与周围环境建立交流方面获得了突破性进展.然而,获取脑信号的方式无法长期地维持且提取到的脑信号中存在大量噪声,因此提高数... 医疗保健和神经科学界长期致力于从大脑活动中解码语言信息.脑机接口在支持获得性脑损伤患者通过大脑信号重新与周围环境建立交流方面获得了突破性进展.然而,获取脑信号的方式无法长期地维持且提取到的脑信号中存在大量噪声,因此提高数据的信噪比具有重要意义.近年来,人工智能在提取和汇聚大量原始数据特征方面展现出了卓越的性能.总结了一系列基于深度学习从人类大脑信号中解码语音的特征提取技术.首先对这些技术涉及的深度学习方法进行了介绍,接下来对这些技术的具体应用进行了列举,最后对如何更好将人工智能技术应用于解码大脑语音信息做出了展望. 展开更多
关键词 神经元解码 音频和语音处理 深度学习 计算认知科学
在线阅读 下载PDF
可控源音频大地电磁测深金属矿的数据处理与应用
18
作者 王在伟 苑高选 +2 位作者 李源 孙杰 谢立洋 《世界有色金属》 2025年第12期180-182,共3页
本文综述可控源音频大地电磁测深(CSAMT)技术的数据处理与解释方法,重点阐述CSAMT的工作原理和在地质勘探中的应用优势,介绍了数据处理中关键技术,分析了线性、非线性和迭代反演算法的优劣及其适用条件,总结不同成图技术特点并探讨了解... 本文综述可控源音频大地电磁测深(CSAMT)技术的数据处理与解释方法,重点阐述CSAMT的工作原理和在地质勘探中的应用优势,介绍了数据处理中关键技术,分析了线性、非线性和迭代反演算法的优劣及其适用条件,总结不同成图技术特点并探讨了解释结果的综合性和多信息解释的重要性。文章还展望了人工智能和多尺度融合技术在未来CSAMT数据处理与解释中的应用潜力,旨为地球物理勘探领域的研究与实践提供参考。此外,以内蒙古哈珠东山地区为例,重点研究可控源音频大地电磁测深在多金属矿普查中的具体应用,在工区布设CSAMT剖面1条,识别出2条北西向隐伏断裂,认为CSAMT在西部覆盖区有着很好的应用前景。 展开更多
关键词 可控源音频大地电磁测深 数据处理 反演方法 成图技术 数据解释
在线阅读 下载PDF
音频信号处理芯片在广播设备中的关键技术与应用 被引量:1
19
作者 高翔 《电视技术》 2025年第3期12-15,共4页
广播在信息传播领域占据重要地位。高质量的音频是满足听众需求、提升广播竞争力的关键,而音频信号处理芯片是实现高质量广播音频的核心要素。深入剖析音频信号处理芯片在广播设备中的应用,从芯片的构成与功能入手,详细阐述芯片关键技... 广播在信息传播领域占据重要地位。高质量的音频是满足听众需求、提升广播竞争力的关键,而音频信号处理芯片是实现高质量广播音频的核心要素。深入剖析音频信号处理芯片在广播设备中的应用,从芯片的构成与功能入手,详细阐述芯片关键技术指标对音频质量的影响,进一步探讨芯片在调幅、调频、数字广播设备中的应用,揭示其保障广播音频高质量传输的原理和方法,旨在为广播音频技术的改进和发展提供理论依据。 展开更多
关键词 音频信号处理芯片 广播设备 幅度调制(AM) 频率调制(FM) 数字广播
在线阅读 下载PDF
数字化背景下中波广播与电视音频处理集成研究 被引量:1
20
作者 吕弦 张虎 《电视技术》 2025年第3期92-94,共3页
数字化浪潮推动了音频处理技术革新,中波广播与电视音频的集成处理迎来了新机遇。针对两种系统在数字化环境下的处理差异,研究并设计基于现场可编程逻辑门阵列(Field Programmable Gate Array,FPGA)的音频处理集成平台。该平台采用自适... 数字化浪潮推动了音频处理技术革新,中波广播与电视音频的集成处理迎来了新机遇。针对两种系统在数字化环境下的处理差异,研究并设计基于现场可编程逻辑门阵列(Field Programmable Gate Array,FPGA)的音频处理集成平台。该平台采用自适应采样和并行处理架构,能够同时处理48 kHz和192 kHz的音频信号。测试结果表明,系统延迟低于10 ms,动态范围达96 dB,失真度低于0.1%。目前,该平台已在多家广播电视台成功应用,为数字化音频的集成化处理提供了可行解决方案。 展开更多
关键词 数字化转型 中波广播 电视音频 处理集成 场可编程逻辑门阵列(FPGA)
在线阅读 下载PDF
上一页 1 2 23 下一页 到第
使用帮助 返回顶部