期刊文献+
共找到455篇文章
< 1 2 23 >
每页显示 20 50 100
MPEG/AUDIO LayerⅢ编解码算法研究与解码的DSP软件实现 被引量:2
1
作者 黄晓利 陈健 《电讯技术》 北大核心 1998年第2期25-30,共6页
本文介绍了ISO/MPEG音频压缩编解layerⅢ规定的64kbps编解码标准,及其DSP实现。作者据此标准完成了计算机C语言模拟仿真,获得满意的重建音乐信号质量。且对解码器的DSP实现进行了研究,通过TMS320C... 本文介绍了ISO/MPEG音频压缩编解layerⅢ规定的64kbps编解码标准,及其DSP实现。作者据此标准完成了计算机C语言模拟仿真,获得满意的重建音乐信号质量。且对解码器的DSP实现进行了研究,通过TMS320C548模拟器对解码器的仿真,取得了与C语言一致的结果。 展开更多
关键词 数字音频技术 声音压缩 MPEG 信号处理
在线阅读 下载PDF
基于语音合成技术的个性化教学音频智能处理系统设计
2
作者 徐若依 卢佳欣 《计算机应用文摘》 2026年第3期149-151,共3页
语音合成技术是人工智能领域的重要分支,已在各类智能系统中得到广泛应用。文章设计了一种基于语音合成的个性化教学音频智能处理系统,旨在通过智能化音频生成技术为学习者提供个性化教学体验,以提升学习兴趣与效果。该系统通过分析学... 语音合成技术是人工智能领域的重要分支,已在各类智能系统中得到广泛应用。文章设计了一种基于语音合成的个性化教学音频智能处理系统,旨在通过智能化音频生成技术为学习者提供个性化教学体验,以提升学习兴趣与效果。该系统通过分析学生的学习特征、进度及个人需求,动态生成定制化教学音频,从而支持学生在课外自主学习过程中提升学习成效。 展开更多
关键词 语音合成技术 音频智能处理系统 学习特征 学习进度 自主学习
在线阅读 下载PDF
音视频流处理技术在会议室管理平台中的应用
3
作者 梁兆伟 《移动信息》 2026年第1期250-252,共3页
随着混合办公模式的普及,传统会议室系统在效率、用户体验及能耗管理方面面临严峻挑战。文中提出了一种基于多模态AI框架的智能会议室管理系统,通过融合视觉、音频及环境传感数据,构建动态决策引擎,实现了设备的自动化调度。实验表明,... 随着混合办公模式的普及,传统会议室系统在效率、用户体验及能耗管理方面面临严峻挑战。文中提出了一种基于多模态AI框架的智能会议室管理系统,通过融合视觉、音频及环境传感数据,构建动态决策引擎,实现了设备的自动化调度。实验表明,该框架在10间真实会议室场景中显著提升了用户体验,语音可懂度评分达3.4(PESQ标准),用户满意度较传统系统提升超40%。研究成果为智慧办公场景提供了高效、低耗、高鲁棒性的解决方案,推动了会议室管理向自动化、智能化的方向演进。 展开更多
关键词 多模态AI 会议室自动化管理 音视频流处理 轻量化模型 动态决策引擎 能耗优化
在线阅读 下载PDF
Filter algorithm based on cochlear mechanics and neuron filter mechanism and application on enhancement of audio signals 被引量:2
4
作者 GAO Wa KAN Yue ZHA Fu-sheng 《Journal of Central South University》 SCIE EI CAS CSCD 2021年第6期1813-1828,共16页
A filter algorithm based on cochlear mechanics and neuron filter mechanism is proposed from the view point of vibration.It helps to solve the problem that the non-linear amplification is rarely considered in studying ... A filter algorithm based on cochlear mechanics and neuron filter mechanism is proposed from the view point of vibration.It helps to solve the problem that the non-linear amplification is rarely considered in studying the auditory filters.A cochlear mechanical transduction model is built to illustrate the audio signals processing procedure in cochlea,and then the neuron filter mechanism is modeled to indirectly obtain the outputs with the cochlear properties of frequency tuning and non-linear amplification.The mathematic description of the proposed algorithm is derived by the two models.The parameter space,the parameter selection rules and the error correction of the proposed algorithm are discussed.The unit impulse responses in the time domain and the frequency domain are simulated and compared to probe into the characteristics of the proposed algorithm.Then a 24-channel filter bank is built based on the proposed algorithm and applied to the enhancements of the audio signals.The experiments and comparisons verify that,the proposed algorithm can effectively divide the audio signals into different frequencies,significantly enhance the high frequency parts,and provide positive impacts on the performance of speech enhancement in different noise environments,especially for the babble noise and the volvo noise. 展开更多
关键词 COCHLEA neuron filter audio signal processing speech enhancement
在线阅读 下载PDF
HI-FI AUDIO CODING TECHNOLOGY FOR ISDN
5
作者 黄晓利 陈健 《Journal of Shanghai Jiaotong university(Science)》 EI 1998年第2期63-67,共5页
A Hi Fi audio coding technology for ISDN and Internet is introduced. It is the ISO/MPEG Audio Layer III digital audio compression scheme coding at 64 kbit/s. First, the paper implements C language simulation accordin... A Hi Fi audio coding technology for ISDN and Internet is introduced. It is the ISO/MPEG Audio Layer III digital audio compression scheme coding at 64 kbit/s. First, the paper implements C language simulation according to the algorithm and gets satisfactory quality of the reconstructed music signal. The estimation of operation steps and simulation of decoder finished by a TMS 320C548 simulator are presented. The result is the same as that of the C language simulation. 展开更多
关键词 source CODING audio compression MPEG SIGNAL processing
在线阅读 下载PDF
AudioDirector软件在声音处理中的应用研究 被引量:2
6
作者 吴冬晨 《电脑知识与技术》 2014年第3期1559-1562,共4页
通过AudioDirector软件在声音处理中的应用,包括音频管理、音频编缉、音频修复及音频混合功能,是一套功能强大、操作直觉化的专业声音处理软件。
关键词 audioDirector软件 声音处理 音频管理 音频编缉 音频修复 音频混合
在线阅读 下载PDF
On‐device audio‐visual multi‐person wake word spotting
7
作者 Yidi Li Guoquan Wang +2 位作者 Zhan Chen Hao Tang Hong Liu 《CAAI Transactions on Intelligence Technology》 SCIE EI 2023年第4期1578-1589,共12页
Audio‐visual wake word spotting is a challenging multi‐modal task that exploits visual information of lip motion patterns to supplement acoustic speech to improve overall detection performance.However,most audio‐vi... Audio‐visual wake word spotting is a challenging multi‐modal task that exploits visual information of lip motion patterns to supplement acoustic speech to improve overall detection performance.However,most audio‐visual wake word spotting models are only suitable for simple single‐speaker scenarios and require high computational complexity.Further development is hindered by complex multi‐person scenarios and computational limitations in mobile environments.In this paper,a novel audio‐visual model is proposed for on‐device multi‐person wake word spotting.Firstly,an attention‐based audio‐visual voice activity detection module is presented,which generates an attention score matrix of audio and visual representations to derive active speaker representation.Secondly,the knowledge distillation method is introduced to transfer knowledge from the large model to the on‐device model to control the size of our model.Moreover,a new audio‐visual dataset,PKU‐KWS,is collected for sentence‐level multi‐person wake word spotting.Experimental results on the PKU‐KWS dataset show that this approach outperforms the previous state‐of‐the‐art methods. 展开更多
关键词 audio‐visual fusion human‐computer interfacing speech processing
在线阅读 下载PDF
Automatic recognition of depression based on audio and video:A review
8
作者 Meng-Meng Han Xing-Yun Li +4 位作者 Xin-Yu Yi Yun-Shao Zheng Wei-Li Xia Ya-Fei Liu Qing-Xiang Wang 《World Journal of Psychiatry》 SCIE 2024年第2期225-233,共9页
Depression is a common mental health disorder.With current depression detection methods,specialized physicians often engage in conversations and physiological examinations based on standardized scales as auxiliary mea... Depression is a common mental health disorder.With current depression detection methods,specialized physicians often engage in conversations and physiological examinations based on standardized scales as auxiliary measures for depression assessment.Non-biological markers-typically classified as verbal or non-verbal and deemed crucial evaluation criteria for depression-have not been effectively utilized.Specialized physicians usually require extensive training and experience to capture changes in these features.Advancements in deep learning technology have provided technical support for capturing non-biological markers.Several researchers have proposed automatic depression estimation(ADE)systems based on sounds and videos to assist physicians in capturing these features and conducting depression screening.This article summarizes commonly used public datasets and recent research on audio-and video-based ADE based on three perspectives:Datasets,deficiencies in existing research,and future development directions. 展开更多
关键词 Depression recognition Deep learning Automatic depression estimation System audio processing Image processing Feature fusion Future development
暂未订购
基于AI的噪声特征处理方法的研究 被引量:1
9
作者 崔建忠 《计算机应用文摘》 2025年第12期98-100,共3页
通过应用深度学习和机器学习算法,AI技术已广泛应用于音频信号处理领域,特别是在噪声识别与去除方面取得了显著成效。深度神经网络能够自动提取音频中的时频特征,精准区分噪声与语音成分,实现高效降噪处理。同时,传统机器学习方法(如SVM... 通过应用深度学习和机器学习算法,AI技术已广泛应用于音频信号处理领域,特别是在噪声识别与去除方面取得了显著成效。深度神经网络能够自动提取音频中的时频特征,精准区分噪声与语音成分,实现高效降噪处理。同时,传统机器学习方法(如SVM、K近邻算法)可在特定场景下结合特征工程进行辅助识别。通过训练模型识别不同类型的噪声并重建纯净音频,AI系统显著提升了语音清晰度和用户体验,被广泛应用于语音助手、在线会议、智能设备等领域。 展开更多
关键词 AI降噪 噪声特征处理 深度学习 音频质量
在线阅读 下载PDF
基于图像处理技术在声像资料鉴定中的应用
10
作者 徐金成 邹同浩 《科技风》 2025年第33期4-6,共3页
随着科学技术飞速发展,声像资料已成为现代司法诉讼中不可或缺的重要证据形式。它们以声音、图像等直观方式记录并再现案件现场,对于揭示事实真相、辅助法官做出公正裁决具有不可替代的作用。然而,与此同时,声像资料的易篡改性和伪造可... 随着科学技术飞速发展,声像资料已成为现代司法诉讼中不可或缺的重要证据形式。它们以声音、图像等直观方式记录并再现案件现场,对于揭示事实真相、辅助法官做出公正裁决具有不可替代的作用。然而,与此同时,声像资料的易篡改性和伪造可能性也给司法鉴定带来了新的挑战。图像处理技术在此背景下应运而生,其凭借强大的数据分析与处理能力,有效提高了声像资料鉴定的准确性和科学性。本文将深入探讨图像处理技术在声像资料鉴定中的应用及其重要意义。 展开更多
关键词 图像处理技术 司法鉴定 声像资料鉴定
在线阅读 下载PDF
基于工作过程系统化的活页式教材开发与实践——以《数字影音编辑与合成》教材为例
11
作者 叶蕾 欧阳俊梅 《武汉工程职业技术学院学报》 2025年第4期91-96,共6页
以《数字影音编辑与合成》教材为例,探讨了基于工作过程系统化的职业院校活页式教材开发策略。首先介绍了工作过程系统化课程开发的理论基础,包括其特点、开发步骤及其在职业教育中的应用价值。随后以《数字影音编辑与合成》教材为例,... 以《数字影音编辑与合成》教材为例,探讨了基于工作过程系统化的职业院校活页式教材开发策略。首先介绍了工作过程系统化课程开发的理论基础,包括其特点、开发步骤及其在职业教育中的应用价值。随后以《数字影音编辑与合成》教材为例,详细阐述了结合职业教育特色和行业发展需求进行活页式教材开发的实践过程。研究为中高职活页式教材的开发提供了新的策略和思路,也为职业教育教学内容与方法的创新提供了有益的参考和启示。 展开更多
关键词 工作过程系统化 活页式教材 职业教育 数字影音编辑与合成 教材开发策略
在线阅读 下载PDF
基于FPGA的有源二分频音频放大电路设计与实现
12
作者 吴海红 《安徽电子信息职业技术学院学报》 2025年第4期67-72,77,共7页
本文设计了一款基于FPGA的有源二分频音频放大电路,系统主要由预处理电路、模数转换电路、自动增益控制(AGC)电路、滤波器电路、功放电路、数模转换电路组成。音频信号经预处理电路放大后,通过AD转换器输送至FPGA芯片,在FPGA内部实现自... 本文设计了一款基于FPGA的有源二分频音频放大电路,系统主要由预处理电路、模数转换电路、自动增益控制(AGC)电路、滤波器电路、功放电路、数模转换电路组成。音频信号经预处理电路放大后,通过AD转换器输送至FPGA芯片,在FPGA内部实现自动增益控制、高通滤波和低通滤波,最后由DA转换及专用音频功率放大芯片对其进行放大输出。经测试,该系统具有效率高、失真小、稳定性高等优点。 展开更多
关键词 FPGA 预处理电路 AGC 有源二分频电路 音频放大电路 高通滤波 低通滤波
在线阅读 下载PDF
基于人工智能的广播电视音频自动化处理技术研究 被引量:6
13
作者 张军武 《信息与电脑》 2025年第3期48-50,共3页
随着人工智能(Artificial Intelligence,AI)技术在广播电视音频处理领域的应用日益深入,研究通过对三种主流音频编解码算法在不同比特率下的性能评估,分析了人工智能辅助音频降噪、音质增强等技术的应用效果。实验结果表明,基于深度学... 随着人工智能(Artificial Intelligence,AI)技术在广播电视音频处理领域的应用日益深入,研究通过对三种主流音频编解码算法在不同比特率下的性能评估,分析了人工智能辅助音频降噪、音质增强等技术的应用效果。实验结果表明,基于深度学习的音频处理模型在256 kb/s比特率下,可使信噪比提升42 dB,音质评分达到8.7分。研究证实,人工智能技术能显著提高广播电视音频处理的自动化水平和质量标准,为行业发展提供技术支持。 展开更多
关键词 人工智能 广播电视 音频处理 自动化处理技术
在线阅读 下载PDF
广播电视工程中数字音频技术的应用 被引量:2
14
作者 尚爱鑫 《电声技术》 2025年第1期65-67,共3页
随着信息技术的迅猛发展,数字音频技术凭借其突出优势正逐步取代传统的模拟音频技术,已成为广播电视工程中不可或缺的一部分。从数字音频技术的基本原理出发,探讨广播电视工程中数字音频技术的应用要点。重点分析数字音频技术在广播电... 随着信息技术的迅猛发展,数字音频技术凭借其突出优势正逐步取代传统的模拟音频技术,已成为广播电视工程中不可或缺的一部分。从数字音频技术的基本原理出发,探讨广播电视工程中数字音频技术的应用要点。重点分析数字音频技术在广播电视节目制作、传输、接收等环节的应用效果,以促进广播电视工程数字化发展。 展开更多
关键词 广播电视工程 数字音频 技术要点 音频处理
在线阅读 下载PDF
广电系统环绕声信号处理技术与应用分析 被引量:1
15
作者 李志远 《电声技术》 2025年第1期96-99,共4页
广电系统中环绕声技术的应用日益广泛,有助于改善听众体验。通过分析环绕声信号在采集、编码、传输以及还原等环节的处理技术,探讨了不同环绕声格式的特点及其在广电系统中的应用。实验对比了各种环绕声处理方案对音质、空间感、兼容性... 广电系统中环绕声技术的应用日益广泛,有助于改善听众体验。通过分析环绕声信号在采集、编码、传输以及还原等环节的处理技术,探讨了不同环绕声格式的特点及其在广电系统中的应用。实验对比了各种环绕声处理方案对音质、空间感、兼容性的影响,结果表明基于对象的音频技术在空间定位精度和跨平台兼容性方面表现优异。同时,自适应比特率传输和高效编解码算法显著增强了系统性能。最后,指出当前技术面临的挑战,并提出相应的优化建议,为广电系统环绕声应用的进一步发展提供参考。 展开更多
关键词 广电系统 环绕声 信号处理 空间音频 音频编解码
在线阅读 下载PDF
基于音频处理技术的移动应用语音识别系统设计
16
作者 李震 陶亮 何凯霖 《电声技术》 2025年第3期92-96,共5页
设计一种基于音频处理技术的移动应用语音识别系统,结合麦克风阵列、高性能处理器、深度学习模型,实现噪声环境下的高准确率和稳定识别。运行测试结果表明,系统功能稳定、性能优越。
关键词 音频处理 移动应用 语音识别系统
在线阅读 下载PDF
数字化背景下中波广播与电视音频处理集成研究 被引量:3
17
作者 吕弦 张虎 《电视技术》 2025年第3期92-94,共3页
数字化浪潮推动了音频处理技术革新,中波广播与电视音频的集成处理迎来了新机遇。针对两种系统在数字化环境下的处理差异,研究并设计基于现场可编程逻辑门阵列(Field Programmable Gate Array,FPGA)的音频处理集成平台。该平台采用自适... 数字化浪潮推动了音频处理技术革新,中波广播与电视音频的集成处理迎来了新机遇。针对两种系统在数字化环境下的处理差异,研究并设计基于现场可编程逻辑门阵列(Field Programmable Gate Array,FPGA)的音频处理集成平台。该平台采用自适应采样和并行处理架构,能够同时处理48 kHz和192 kHz的音频信号。测试结果表明,系统延迟低于10 ms,动态范围达96 dB,失真度低于0.1%。目前,该平台已在多家广播电视台成功应用,为数字化音频的集成化处理提供了可行解决方案。 展开更多
关键词 数字化转型 中波广播 电视音频 处理集成 场可编程逻辑门阵列(FPGA)
在线阅读 下载PDF
基于双向流式引擎的数字人交互体验优化研究
18
作者 陈嘉 林宏炜 胡俊 《广播与电视技术》 2025年第11期15-18,共4页
本文基于广电行业广泛应用的数字人播报系统,围绕实时音视频处理、多模态融合与低延迟传输等广电关键技术,探讨了数字人在实时交互体验中的优化路径。通过引入双向流式引擎架构,结合广电级音视频处理标准,重点优化语音动作融合输出与交... 本文基于广电行业广泛应用的数字人播报系统,围绕实时音视频处理、多模态融合与低延迟传输等广电关键技术,探讨了数字人在实时交互体验中的优化路径。通过引入双向流式引擎架构,结合广电级音视频处理标准,重点优化语音动作融合输出与交互时延控制,显著提升了数字人的应答自然度与流畅性,拓展了广电数字人在政务服务、智慧广电等融合业务场景中的应用。 展开更多
关键词 数字人实时交互 多模态融合引擎 双向流式引擎 音视频处理
在线阅读 下载PDF
DSP技术在广播电视音频信号处理优化中的应用 被引量:1
19
作者 刘念 《电声技术》 2025年第3期147-150,共4页
随着广播电视行业的快速发展,音频信号的质量成为提升视听体验的关键因素。传统音频处理方法已无法满足现代广播电视系统对音频清晰度、动态范围及噪声控制的高要求,数字信号处理(Digital Signal Processing,DSP)技术以其强大的计算能... 随着广播电视行业的快速发展,音频信号的质量成为提升视听体验的关键因素。传统音频处理方法已无法满足现代广播电视系统对音频清晰度、动态范围及噪声控制的高要求,数字信号处理(Digital Signal Processing,DSP)技术以其强大的计算能力和灵活的处理方式成为解决此问题的有效手段。重点研究DSP技术在广播电视音频信号处理中的优化措施,探讨优化噪声抑制算法、动态范围压缩、增强音频均衡处理以及集成回声消除算法等技术的融合应用。这些技术的有效结合能够显著减少噪声对音频质量的干扰,精确检测音频信号的动态变化,确保音频信号的均衡,并有效消除音频信号中的回声。 展开更多
关键词 数字信号处理(DSP)技术 广播电视 音频信号处理
在线阅读 下载PDF
基于Gammachirp的自适应听力损失模拟系统
20
作者 刘文鹏 刘凯 《工业控制计算机》 2025年第1期55-57,共3页
听力损失模拟系统通常用于为听力正常的听众演示听力损失的后果。一个准确、合理的听力损失模拟系统对于助听器开发和听力损失研究而言至关重要。基于Gammachirp滤波器,从系统输入输出的角度出发,根据正常听者和听力损失对象的听阈,对... 听力损失模拟系统通常用于为听力正常的听众演示听力损失的后果。一个准确、合理的听力损失模拟系统对于助听器开发和听力损失研究而言至关重要。基于Gammachirp滤波器,从系统输入输出的角度出发,根据正常听者和听力损失对象的听阈,对听觉滤波器进行线性补偿,实现了一种新的感音神经性听力损失模拟系统。该系统能够针对不同听众的听力特性单独处理音频,并准确模拟出不同条件下的听力损失。对不同听力条件的听众进行的实验表明,所构建的自适应听力损失模拟系统符合听觉滤波器的压缩特性,能够准确模拟出不同听力损失患者的目标听阈。 展开更多
关键词 听力损失模拟 Gammachirp filter 音频处理 听觉滤波器
在线阅读 下载PDF
上一页 1 2 23 下一页 到第
使用帮助 返回顶部