期刊文献+
共找到139篇文章
< 1 2 7 >
每页显示 20 50 100
Android原生Audio Effect框架分析与改进
1
作者 庄伟达 何兴理 林金阳 《福建工程学院学报》 CAS 2019年第4期371-376,共6页
基于Android系统底层源码,深入分析Android系统原生Audio Effect框架,针对该框架仅可支持16 bit音频数据进行处理的问题,采用先将系统输入的32 bit音频数据移位,然后再进行强制位数转换的方法,在增加原生Audio Effect框架对于32 bit音... 基于Android系统底层源码,深入分析Android系统原生Audio Effect框架,针对该框架仅可支持16 bit音频数据进行处理的问题,采用先将系统输入的32 bit音频数据移位,然后再进行强制位数转换的方法,在增加原生Audio Effect框架对于32 bit音频数据处理支持的同时将由于量化位深转换带来的失真控制在0.000 76%左右。实验结果表明,系统可根据用户要求对32 bit的音频数据进行相应的处理,丰富了原生框架对于不同品质音频数据处理的支持。 展开更多
关键词 ANDROID平台 多媒体功能 audio Effect框架 移位 位数转换
在线阅读 下载PDF
Autonomous Surveillance of Infants’ Needs Using CNN Model for Audio Cry Classification
2
作者 Geofrey Owino Anthony Waititu +1 位作者 Anthony Wanjoya John Okwiri 《Journal of Data Analysis and Information Processing》 2022年第4期198-219,共22页
Infants portray suggestive unique cries while sick, having belly pain, discomfort, tiredness, attention and desire for a change of diapers among other needs. There exists limited knowledge in accessing the infants’ n... Infants portray suggestive unique cries while sick, having belly pain, discomfort, tiredness, attention and desire for a change of diapers among other needs. There exists limited knowledge in accessing the infants’ needs as they only relay information through suggestive cries. Many teenagers tend to give birth at an early age, thereby exposing them to be the key monitors of their own babies. They tend not to have sufficient skills in monitoring the infant’s dire needs, more so during the early stages of infant development. Artificial intelligence has shown promising efficient predictive analytics from supervised, and unsupervised to reinforcement learning models. This study, therefore, seeks to develop an android app that could be used to discriminate the infant audio cries by leveraging the strength of convolution neural networks as a classifier model. Audio analytics from many kinds of literature is an untapped area by researchers as it’s attributed to messy and huge data generation. This study, therefore, strongly leverages convolution neural networks, a deep learning model that is capable of handling more than one-dimensional datasets. To achieve this, the audio data in form of a wave was converted to images through Mel spectrum frequencies which were classified using the computer vision CNN model. The Librosa library was used to convert the audio to Mel spectrum which was then presented as pixels serving as the input for classifying the audio classes such as sick, burping, tired, and hungry. The study goal was to incorporate the model as an android tool that can be utilized at the domestic level and hospital facilities for surveillance of the infant’s health and social needs status all time round. 展开更多
关键词 Convolutional Neural Network (CNN) Mel Frequency Cepstral Coefficients (MFCCs) Rectified Linear Unit (ReLU) Activation function audio Analytics Deep Neural Network (DNN)
在线阅读 下载PDF
音频大地电磁法二阶叠层有限元正演研究
3
作者 张阳阳 杜威 +2 位作者 王芝水 缪旭煌 郭辰 《石油物探》 北大核心 2025年第3期587-594,共8页
在有限元数值正演模拟中,提高基函数阶数是提升有限元正演模拟精度的有效途径。然而,常规有限元只能全局使用同一阶数的基函数。针对常规有限元正演模拟的精度与效率之间难以兼顾的问题,提出一种基于叠层基函数的有限元方法。该方法利... 在有限元数值正演模拟中,提高基函数阶数是提升有限元正演模拟精度的有效途径。然而,常规有限元只能全局使用同一阶数的基函数。针对常规有限元正演模拟的精度与效率之间难以兼顾的问题,提出一种基于叠层基函数的有限元方法。该方法利用叠层基函数的特性,实现仅对地表单元基函数阶数的提升,从而在保证计算效率的前提下提高数值正演模拟的精度。为验证方法的有效性和效率,选取3个典型的地电模型进行了音频大地电磁正演模拟。模拟结果表明,所提出的方法在计算时间小幅增加的情况下,能够有效提升正演模拟的精度,为电磁法高效数值正演模拟提供了一种新思路。 展开更多
关键词 叠层基函数 音频大地电磁法 电磁法正演 数值模拟 有限元正演模拟
在线阅读 下载PDF
基于LC3的长时后置滤波器研究及其FPGA实现 被引量:1
4
作者 李镔 王法翔 《集成电路与嵌入式系统》 2025年第1期74-80,共7页
基于LC3编码协议,详细探讨了长时后置滤波器(LTPF)的硬件设计与实现。研究内容包括LTPF的基本原理、硬件设计架构及其在FPGA上的实现和测试。通过使用Altera(已被英特尔收购)MAX 10开发板进行了验证,结果显示,硬件实现显著提高了处理效... 基于LC3编码协议,详细探讨了长时后置滤波器(LTPF)的硬件设计与实现。研究内容包括LTPF的基本原理、硬件设计架构及其在FPGA上的实现和测试。通过使用Altera(已被英特尔收购)MAX 10开发板进行了验证,结果显示,硬件实现显著提高了处理效率,并在较低资源消耗下实现了LTPF的硬件加速功能。此外,本文还将硬件实现与STM32平台上的C语言定点程序进行了对比,展示了硬件设计在处理速度和资源利用上的优势。研究结果表明,尽管当前设计已优于软件架构,但未来通过逻辑重组或流水线技术对设计进行优化,系统性能还有提升空间。 展开更多
关键词 音频编解码器 LC3 基音检测 自相关函数 LTPF 基音周期 FPGA
在线阅读 下载PDF
基于卷积神经网络的数字音频降噪技术研究 被引量:1
5
作者 赵琳 《电声技术》 2025年第5期82-84,共3页
传统的音频降噪技术,如频域滤波、时域滤波等,虽然在一定程度上能够抑制噪声,但往往存在降噪效果有限、处理速度慢等局限性。为此,研究基于卷积神经网络的数字音频降噪技术。首先采集并预处理数字音频,其次构建卷积神经网络音频降噪模型... 传统的音频降噪技术,如频域滤波、时域滤波等,虽然在一定程度上能够抑制噪声,但往往存在降噪效果有限、处理速度慢等局限性。为此,研究基于卷积神经网络的数字音频降噪技术。首先采集并预处理数字音频,其次构建卷积神经网络音频降噪模型,并对音频降噪模型进行训练与优化,最后通过仿真实验证明,基于卷积神经网络的数字音频降噪技术在实践中的可行性和优越性。 展开更多
关键词 卷积神经网络 数字音频降噪 损失函数
在线阅读 下载PDF
融入非平稳随机场正则化的可控源音频大地电磁法约束反演方法
6
作者 戴前伟 郭泸遥 +5 位作者 武赟 熊哲贤 段旦 包中林 吴鸿飞 郝风云 《煤田地质与勘探》 北大核心 2025年第6期246-258,共13页
【目的】可控源音频大地电磁法反演的计算效率和分辨率问题始终是该领域的关键议题。为解决可控源音频大地电磁法反演中计算效率和分辨率不足的问题,特别是传统正则化方法对复杂地质结构估计的过度平滑现象,提出了一种改进的正则化反演... 【目的】可控源音频大地电磁法反演的计算效率和分辨率问题始终是该领域的关键议题。为解决可控源音频大地电磁法反演中计算效率和分辨率不足的问题,特别是传统正则化方法对复杂地质结构估计的过度平滑现象,提出了一种改进的正则化反演方法,旨在更真实地反映地下物性参数的空间分布特性。【方法】采用基于Matérn函数随机偏微分方程的构建法,通过引入矢量场及变程“椭圆”的形状参数,充分考虑地层的倾斜变化和物性分布的非平稳性,构建出满足非平稳假设的模型协方差矩阵,并以此作为正则化约束条件进行反演。通过从反演结果、残差值、视电阻率相对残差及不确定度这4个维度,对比分析了传统最平滑约束方法、基于平稳假设的协方差约束方法以及非平稳协方差约束方法的效果。此外,为验证方法的实际应用效果,将其应用于新疆哈巴河县也尔克曼−金坝金矿勘探的实测数据处理中。【结果】理论模型结果表明,非平稳假设约束下4组试验的残差值介于20.47%~21.29%,优于平稳假设约束(残差值分别为21.25%及22.83%),优于传统最平滑约束方法(残差值为32.46%),且能更真实地反映地质构造特征,以及更清晰地识别地质边界。实测数据结果表明,非平稳假设约束方法在成像效果方面明显优于传统Occam平滑约束方法,数据拟合残差提升达51.47%,显著增强对复杂地质结构的分辨能力,并在一定程度上降低深部区域反演的不确定性,从而有效提升了整体反演结果的可靠性。【结论】基于非平稳假设的Matérn函数正则化反演方法为解决可控源音频大地电磁法反演中的计算效率和分辨率问题提供了一种新的技术手段,对推动地球物理反演技术的发展具有重要意义。 展开更多
关键词 可控源音频大地电磁法 非平稳假设 Matérn协方差函数 随机偏微分方程 矢量场
在线阅读 下载PDF
便携式多参数环境监测仪的设计 被引量:7
7
作者 郝丽丽 马小军 张娟 《计算机测量与控制》 CSCD 2006年第6期835-837,共3页
便携式仪表是单片机研究的一个重要分支,介绍了一种基于凌阳单片机实现便携式要求的多参数环境监测仪,描述了系统组成各个模块的硬件实现,并给出了相应的软件设计方案,该装置能够测量温度、湿度等环境参数值,精度分别为1℃和2%,同时具... 便携式仪表是单片机研究的一个重要分支,介绍了一种基于凌阳单片机实现便携式要求的多参数环境监测仪,描述了系统组成各个模块的硬件实现,并给出了相应的软件设计方案,该装置能够测量温度、湿度等环境参数值,精度分别为1℃和2%,同时具有显示和语音功能。 展开更多
关键词 便携式 监测 凌阳单片机 语音功能
在线阅读 下载PDF
三维音频技术在航空领域的应用与展望 被引量:5
8
作者 吕燚 潘皓 +1 位作者 李锋 王娟 《电讯技术》 北大核心 2015年第11期1304-1310,共7页
从三维音频技术对于提升态势感知能力的好处和三维音频在国外航空领域的应用出发,分析了三维音频技术在3D音频告警、话音通信、飞行模拟、无人机操控这四类航空领域的主要应用场景,讨论了三维音频技术在机载环境应用中需考虑的高精度个... 从三维音频技术对于提升态势感知能力的好处和三维音频在国外航空领域的应用出发,分析了三维音频技术在3D音频告警、话音通信、飞行模拟、无人机操控这四类航空领域的主要应用场景,讨论了三维音频技术在机载环境应用中需考虑的高精度个性化头相关传递函数获取、头部跟踪及环境适应性等关键技术,最后总结出了技术发展趋势。相关内容可供机载音频技术研究人员参考。 展开更多
关键词 航空设备 态势感知 三维音频 头相关传递函数 机载音频系统 3D音频告警
在线阅读 下载PDF
Microsoft Agent语音技术在Visual Basic中的处理 被引量:1
9
作者 朱永海 李梅 陈广宏 《计算机工程与设计》 CSCD 北大核心 2008年第24期6427-6431,共5页
充分调用Microsoft Agent技术,增添了多媒体应用软件的智能性、趣味性和人性化特征。通过对微软公司Agent角色开发文档及国内外相关文献的研究,分析了Agent的LanguageID、TTSModeID和SRModeID等的语音关键特征。借助于Add()方法和Comman... 充分调用Microsoft Agent技术,增添了多媒体应用软件的智能性、趣味性和人性化特征。通过对微软公司Agent角色开发文档及国内外相关文献的研究,分析了Agent的LanguageID、TTSModeID和SRModeID等的语音关键特征。借助于Add()方法和Command事件添加语音命令实现了在VB中自由进行语音识别与输出。另外,必须安装SAPI4.0运行期支持文件才能在Windows XP坏境下进行输出语音。 展开更多
关键词 MICROSOFT Agent角色 VISUAL Basic 语音处理 LanguageID TTSModeID SRModeID
在线阅读 下载PDF
多媒体网络实时监控平台中实时音频处理方法的研究 被引量:1
10
作者 张华忠 王修军 单宝森 《小型微型计算机系统》 CSCD 北大核心 2002年第9期1068-1070,共3页
本文以作者自行开发的多媒体网络实时监控平台为例 ,介绍了利用 WIN32 API低层音频函数进行实时音频录播及网络传输的方法 ,并详细论述了在平台上实现网络电话。
关键词 多媒体网络 实时监控平台 实时音频处理 低层音频函数 多缓冲机制
在线阅读 下载PDF
基于时频域特征的场景音频研究 被引量:3
11
作者 张勇 张溯 +2 位作者 王旭东 路阳 王臣 《吉林大学学报(信息科学版)》 CAS 2018年第3期300-305,共6页
随着人们对于场景音频研究的逐渐深入,现有的分析方式由于存在不能完整反映音频的声学特性等弊端,已经无法满足人们的需求。基于时频域特征的分析方式可以很好地解决这一问题,即通过提取场景音频的语谱图,使待分析信号中包含的声学事件... 随着人们对于场景音频研究的逐渐深入,现有的分析方式由于存在不能完整反映音频的声学特性等弊端,已经无法满足人们的需求。基于时频域特征的分析方式可以很好地解决这一问题,即通过提取场景音频的语谱图,使待分析信号中包含的声学事件得到完整保留,使其表现得更加直观。语谱图中包含着丰富的纹理信息,选取不同窗长,可分别得到场景音频的宽带语谱图和窄带语谱图。对比实验表明,窄带语谱图可以更好的反映出待分析信号中所包含声学事件的趋势、连续性及分布特征。因此对场景音频进行时频域特征分析更适合使用窄带语谱图。 展开更多
关键词 语谱图 场景音频 窗函数 窄带语谱图
在线阅读 下载PDF
语音功能在多参数检测仪上的实现 被引量:2
12
作者 周旭艳 萧斌 《自动化仪表》 CAS 2006年第z1期92-94,共3页
便携式安全检测仪的可靠性和稳定性直接影响着煤矿生产的安全。设计了一种以SPCE061A单片机为核心的多参数便携式语音检测仪。首先给出了该系统的总体设计方案,然后介绍了SPCE061A的音频压缩算法SACM 2000,最后详细论述了语音在仪器上... 便携式安全检测仪的可靠性和稳定性直接影响着煤矿生产的安全。设计了一种以SPCE061A单片机为核心的多参数便携式语音检测仪。首先给出了该系统的总体设计方案,然后介绍了SPCE061A的音频压缩算法SACM 2000,最后详细论述了语音在仪器上的实现方法。该设计大大提高了检测仪的稳定性、可靠性以及抗干扰性,为煤矿安全生产提供了有效的测量手段。 展开更多
关键词 传感器 音频 API函数
在线阅读 下载PDF
Microsoft Agent语音技术的Authorware调用 被引量:3
13
作者 朱永海 《计算机技术与发展》 2008年第8期169-173,共5页
为了深入开发调用Microsoft Agent技术,增添应用软件的智能性、趣味性和人性化特征,通过对微软公司Agent角色开发文档及国内外相关文献的研究,分析Agent语音的LanguageID和TTSModeID的关键特征和Authorware的SpeechXtra,及其角色调用相... 为了深入开发调用Microsoft Agent技术,增添应用软件的智能性、趣味性和人性化特征,通过对微软公司Agent角色开发文档及国内外相关文献的研究,分析Agent语音的LanguageID和TTSModeID的关键特征和Authorware的SpeechXtra,及其角色调用相关技术。有效的多媒体软件开发必须充分地掌握Microsoft Agent角色和Authorware语音技术特征。 展开更多
关键词 MICROSOFT AGENT 角色 AUTHORWARE LanguageID TTSModeID 语音调用
在线阅读 下载PDF
利用声卡形成正弦波函数发生器 被引量:5
14
作者 肖立 卢再奇 付强 《微处理机》 2003年第3期54-56,共3页
本文介绍了通过 Visual C+ + 编程使声卡输出正弦波的原理和方法 ,并对声卡输出正弦波的特点作了说明。
关键词 正弦波函数发生器 声卡 声音处理 音频服务 音频格式
在线阅读 下载PDF
维吾尔语口语考试系统的开发与应用 被引量:3
15
作者 贾志先 《计算机技术与发展》 2015年第5期205-208,213,共5页
维吾尔语口语考试系统,基于C/S结构,由考试系统、考试管理系统等模块组成。应用Socket实现管理机和考试机之间的通信。介绍了维吾尔语口试测试方案和流程,研究了维吾尔语的输入、输出,音频的输入、输出,系统开发平台和运行环境等问题。... 维吾尔语口语考试系统,基于C/S结构,由考试系统、考试管理系统等模块组成。应用Socket实现管理机和考试机之间的通信。介绍了维吾尔语口试测试方案和流程,研究了维吾尔语的输入、输出,音频的输入、输出,系统开发平台和运行环境等问题。讨论了在Windows 7下,利用回调函数管理音频数据块和应用低级音频函数进行录音的方法。给出了在录音过程中,采用波形图和柱形图实时显示录音音量大小变化的方法和录音设备故障检测的方法。在维吾尔语口语考试中,应用口语考试系统,取得了成功。 展开更多
关键词 口语考试系统 录音 波形图 低级音频函数
在线阅读 下载PDF
头相关传输函数的研究进展(一) 被引量:27
16
作者 钟小丽 谢菠荪 《电声技术》 北大核心 2004年第12期44-46,62,共4页
综述了头相关传输函数(HRTF)的研究进展,主要包括HRTF的定义、获取方式以及各种分析、近似和评价方法。同时,还探讨了HRTF研究中存在的问题。
关键词 头相关传输函数(HRTF) 虚拟声 听觉模型
在线阅读 下载PDF
一种基于内容的音频流二级分割方法 被引量:7
17
作者 张一彬 周杰 +1 位作者 边肇祺 张大鹏 《计算机学报》 EI CSCD 北大核心 2006年第3期457-465,共9页
基于内容的音频流分割是多媒体数据分析领域中的一个十分重要和困难的问题.目前大多数传统的音频流分割方法是基于小尺度音频分类的,但是这类分割方法普遍存在虚假分割点过多的缺点,严重影响了实际应用的效果.作者的研究表明,大尺度音... 基于内容的音频流分割是多媒体数据分析领域中的一个十分重要和困难的问题.目前大多数传统的音频流分割方法是基于小尺度音频分类的,但是这类分割方法普遍存在虚假分割点过多的缺点,严重影响了实际应用的效果.作者的研究表明,大尺度音频片段的分类正确率要明显高于小尺度音频片段的分类正确率,并且这个趋势与分类器选择无关.基于这个事实和减少虚假分割点的目的,作者提出了一种新的音频流分割方法.首先,采用基于大尺度音频分类的分割方法对音频流进行粗分割,以减少虚假分割点;然后定义了分割点评价函数,并利用它在边界区域中进一步精确定位分割点.实验结果表明这种音频流分割方法可以比较精确地获取分割点位置,同时将虚假分割点减少到传统方法的四分之一. 展开更多
关键词 音频分类 音频流分割 分割点评价函数 虚假分割 神经网络
在线阅读 下载PDF
三维音频技术综述 被引量:20
18
作者 胡瑞敏 王晓晨 +5 位作者 张茂胜 李登实 王松 高丽 杨乘 杨玉红 《数据采集与处理》 CSCD 北大核心 2014年第5期661-676,共16页
三维(Three-dimension,3D)多媒体技术,尤其是和3D视频相比有所差距的3D音频技术受到了广泛的关注。当前三维音频技术研究可分为基于物理声场重建的多声道音频技术和基于感知的声音场景重建的多声道音频技术两大类。物理声场重建技术的... 三维(Three-dimension,3D)多媒体技术,尤其是和3D视频相比有所差距的3D音频技术受到了广泛的关注。当前三维音频技术研究可分为基于物理声场重建的多声道音频技术和基于感知的声音场景重建的多声道音频技术两大类。物理声场重建技术的重要代表是基于球谐分解的声重放技术和波场合成技术(Wave field synthesis,WFS),基于感知的声音场景重建技术主要包括幅度平移技术(Amplitude panning,AP)和基于头相关传输函数的双耳重建技术(Head related transfer function,HRTF)。本文对上述4类三维音频技术及其对应的典型系统进行了介绍及对比分析,并对三维音频技术当前3大主要研究热点:空间听觉机制、三维音频压缩编码以及三维音频系统精简的现状与前沿技术进行了介绍。 展开更多
关键词 三维音频 波场合成 头相关传输函数 幅度平移 空间听觉 三维音频系统精简
在线阅读 下载PDF
三维音频技术综述 被引量:16
19
作者 殷福亮 汪林 陈喆 《通信学报》 EI CSCD 北大核心 2011年第2期130-138,共9页
论述了三维音频的基本原理,从头相关传递函数(HRTF)的测量、计算、插值和模型逼近以及串声消除算法与稳健性等方面,综述了信号处理方法在三维音频技术中的应用,总结了当前三维音频技术中的一些热点问题。最后,对三维音频技术的未来研究... 论述了三维音频的基本原理,从头相关传递函数(HRTF)的测量、计算、插值和模型逼近以及串声消除算法与稳健性等方面,综述了信号处理方法在三维音频技术中的应用,总结了当前三维音频技术中的一些热点问题。最后,对三维音频技术的未来研究方向进行了展望。 展开更多
关键词 三维音频 信号处理 头传递相关函数 串声消除
在线阅读 下载PDF
早期喂养支持联合智护训练对早产儿体智发育及视听功能的影响 被引量:2
20
作者 朱叶 黄勤 《全科护理》 2021年第3期365-367,共3页
目的:探讨早期喂养支持联合智护训练对早产儿体智发育及视听功能的影响。方法:选取医院2017年7月—2019年7月收治的早产儿50例作为研究对象,随机分为对照组、观察组,每组25例。对照组采用常规护理,观察组采用早期喂养支持联合智护训练,... 目的:探讨早期喂养支持联合智护训练对早产儿体智发育及视听功能的影响。方法:选取医院2017年7月—2019年7月收治的早产儿50例作为研究对象,随机分为对照组、观察组,每组25例。对照组采用常规护理,观察组采用早期喂养支持联合智护训练,比较两组早产儿体智发育及视听功能情况。结果:观察组婴幼儿智能发育量表(CDCC)中智力、运动量表评分、视力敏感评分及声音反射阈正常率均高于对照组(P<0.05)。结论:早期喂养支持联合智护训练在早产儿护理中的应用能促进早产儿体格、智能及视听功能发育。 展开更多
关键词 智护训练 早产儿 体智发育 视听功能
暂未订购
上一页 1 2 7 下一页 到第
使用帮助 返回顶部