期刊文献+
共找到308篇文章
< 1 2 16 >
每页显示 20 50 100
Content-Based Hierarchical Analysis of News Video Using Audio and Visual Information
1
作者 Yu Jun-qing Zhou Dong-ru +1 位作者 Jin Ye Liu Hua-yong 《Wuhan University Journal of Natural Sciences》 EI CAS 2001年第4期779-783,共5页
A schema for content-based analysis of broadcast news video is presented. First, we separate commercials from news using audiovisual features. Then, we automatically organize news programs into a content hierarchy at ... A schema for content-based analysis of broadcast news video is presented. First, we separate commercials from news using audiovisual features. Then, we automatically organize news programs into a content hierarchy at various levels of abstraction via effective integration of video, audio, and text data available from the news programs. Based on these news video structure and content analysis technologies, a TV news video Library is generated, from which users can retrieve definite news story according to their demands. 展开更多
关键词 content-based audio news video SEGMENTATION
在线阅读 下载PDF
Hierarchical Scene Analysis Method for Audio Sensor Networks
2
作者 Li Qi Wang Jiteng Zhang Miao 《China Communications》 SCIE CSCD 2012年第5期108-116,共9页
Abstract: A hierarchical method for scene analysis in audio sensor networks is proposed. This meth-od consists of two stages: element detection stage and audio scene analysis stage. In the former stage, the basic au... Abstract: A hierarchical method for scene analysis in audio sensor networks is proposed. This meth-od consists of two stages: element detection stage and audio scene analysis stage. In the former stage, the basic audio elements are modeled by the HMM models and trained by enough samples off-line, and we adaptively add or remove basic ele- ment from the targeted element pool according to the time, place and other environment parameters. In the latter stage, a data fusion algorithm is used to combine the sensory information of the same ar-ea, and then, a role-based method is employed to analyze the audio scene based on the fused data. We conduct some experiments to evaluate the per-formance of the proposed method that about 70% audio scenes can be detected correctly by this method. The experiment evaluations demonstrate that our method can achieve satisfactory results. 展开更多
关键词 audio sensor network audio surveil-lance audio scene analysis
在线阅读 下载PDF
An Improved Forest Fire Detection Model Using Audio Classification and Machine Learning
3
作者 Kemahyanto Exaudi Deris Stiawan +4 位作者 Bhakti Yudho Suprapto Hanif Fakhrurroja MohdYazid Idris Tami AAlghamdi Rahmat Budiarto 《Computers, Materials & Continua》 2026年第1期2062-2085,共24页
Sudden wildfires cause significant global ecological damage.While satellite imagery has advanced early fire detection and mitigation,image-based systems face limitations including high false alarm rates,visual obstruc... Sudden wildfires cause significant global ecological damage.While satellite imagery has advanced early fire detection and mitigation,image-based systems face limitations including high false alarm rates,visual obstructions,and substantial computational demands,especially in complex forest terrains.To address these challenges,this study proposes a novel forest fire detection model utilizing audio classification and machine learning.We developed an audio-based pipeline using real-world environmental sound recordings.Sounds were converted into Mel-spectrograms and classified via a Convolutional Neural Network(CNN),enabling the capture of distinctive fire acoustic signatures(e.g.,crackling,roaring)that are minimally impacted by visual or weather conditions.Internet of Things(IoT)sound sensors were crucial for generating complex environmental parameters to optimize feature extraction.The CNN model achieved high performance in stratified 5-fold cross-validation(92.4%±1.6 accuracy,91.2%±1.8 F1-score)and on test data(94.93%accuracy,93.04%F1-score),with 98.44%precision and 88.32%recall,demonstrating reliability across environmental conditions.These results indicate that the audio-based approach not only improves detection reliability but also markedly reduces computational overhead compared to traditional image-based methods.The findings suggest that acoustic sensing integrated with machine learning offers a powerful,low-cost,and efficient solution for real-time forest fire monitoring in complex,dynamic environments. 展开更多
关键词 audio classification convolutional neural network(CNN) environmental science forest fire detection machine learning spectrogram analysis IOT
在线阅读 下载PDF
A Probe on the Influential Factors in Content-Based ESP Courses Design
4
作者 LIU Yuan TAO Yu HUANG Su-min 《Sino-US English Teaching》 2012年第12期1760-1765,共6页
Recent years, problems of the current college English courses, such as test-oriented teaching, wasteful duplication of language skills teaching, etc., have been criticized by educators and students in China. Thus, tur... Recent years, problems of the current college English courses, such as test-oriented teaching, wasteful duplication of language skills teaching, etc., have been criticized by educators and students in China. Thus, turning skill-based English courses into content-based ESP (English for Special Purposes) courses has become a tendency at colleges and universities in China. The purpose of this paper is to analyze factors influencing the design of such courses through the means of questionnaire, individual interviews, data survey (e.g., educational plans) etc.. We found the following factors throw light on the questions relating to curriculum design of ESP courses: (1) the learners' learning needs; (2) the social needs (esp. labor market needs); and (3) the academic needs from the university. The analysis serves to reveal the gap between the school system and actual social and students needs. With these factors in mind, designers of such courses can adjust goals, contents, approaches, and assessments in the practical teaching. And thus these factors would enable content-based ESP courses to reflect learners' needs better and lead to more effective langrage learning in college English teaching field. 展开更多
关键词 content-based ESP (English for Special Purposes) courses needs analysis course design
在线阅读 下载PDF
Pinguin Audio Meter在调频广播监测中的应用
5
作者 张勇 孙鹏 《中国有线电视》 2011年第S1期396-399,共4页
Pinguin Audio Meter作为一款音频分析软件,将高分辨率数字电平表、声波频谱分析仪、相位及立体声示波表相结合,在声音、音乐制作方面得到广泛应用,其很容易应用到调频广播信号的监测中。就该软件应用于调频广播信号监测的可行性进行了... Pinguin Audio Meter作为一款音频分析软件,将高分辨率数字电平表、声波频谱分析仪、相位及立体声示波表相结合,在声音、音乐制作方面得到广泛应用,其很容易应用到调频广播信号的监测中。就该软件应用于调频广播信号监测的可行性进行了阐述,搭建实验平台,构建了基于Pinguin Audio Me-ter分析软件的监测系统。实验结果表明该软件可以对调频广播信号进行适时监测,并具有结构简单、功能丰富、投资较少的特点。 展开更多
关键词 audio METER 广播监测 频谱分析
在线阅读 下载PDF
Audio Highlight Detection Method for Cloud-Based Multimedia Service System
6
作者 李祺 徐国爱 +1 位作者 田斌 张淼 《China Communications》 SCIE CSCD 2011年第6期51-57,共7页
With the development of cloud-based data centers and multimedia technologies, cloud-based multimedia service systems have been paid more and more attention. Audio highlights detection plays an important role in the cl... With the development of cloud-based data centers and multimedia technologies, cloud-based multimedia service systems have been paid more and more attention. Audio highlights detection plays an important role in the cloud-based multimedia service system. In this paper, we proposed a novel highlight detection method to extract the audio highlight effects for the cloud-based multimedia service system using the unsupervised approach. In the proposed method, we first extract the audio features for each audio document. Then the spectral clustering scheme was used to decompose the audio document into several audio effects. Then, we introduce the TF-IDF method to label the highlight effect. We design some experiments to evaluate the performance of the proposed method, and the experimental results show that our method can achieve satisfying results. 展开更多
关键词 CLOUD multimedia service system audio highlight detection audio content analysis unsupervised approach
在线阅读 下载PDF
Integrating Audio-Visual Features and Text Information for Story Segmentation of News Video 被引量:1
7
作者 Liu Hua-yong, Zhou Dong-ru School of Computer,Wuhan University,Wuhan 430072, Hubei, China 《Wuhan University Journal of Natural Sciences》 CAS 2003年第04A期1070-1074,共5页
Video data are composed of multimodal information streams including visual, auditory and textual streams, so an approach of story segmentation for news video using multimodal analysis is described in this paper. The p... Video data are composed of multimodal information streams including visual, auditory and textual streams, so an approach of story segmentation for news video using multimodal analysis is described in this paper. The proposed approach detects the topic-caption frames, and integrates them with silence clips detection results, as well as shot segmentation results to locate the news story boundaries. The integration of audio-visual features and text information overcomes the weakness of the approach using only image analysis techniques. On test data with 135 400 frames, when the boundaries between news stories are detected, the accuracy rate 85.8% and the recall rate 97.5% are obtained. The experimental results show the approach is valid and robust. 展开更多
关键词 news video story segmentation audio-visual features analysis text detection
在线阅读 下载PDF
噪声暴露从业人员听力损失危险因素Logistic回归模型分析
8
作者 周彩玲 李勇 +2 位作者 胡祖应 陈旭红 朱赛群 《中国耳鼻咽喉头颈外科》 2025年第5期294-298,共5页
目的探讨噪声暴露从业人员发生听力损失的影响因素。方法选取2022年1月~2023年12月在杭州市职业病防治院进行听力检测的167例噪声暴露从业人员,对患者的左右耳分别进行听力测试,根据测试结果将患者分为听力损失患者(损失组)123例、未发... 目的探讨噪声暴露从业人员发生听力损失的影响因素。方法选取2022年1月~2023年12月在杭州市职业病防治院进行听力检测的167例噪声暴露从业人员,对患者的左右耳分别进行听力测试,根据测试结果将患者分为听力损失患者(损失组)123例、未发生听力损失患者(对照组)44例,对比两组的人群特征、实验室指标、噪声接触情况等,采用Logistic回归模型分析引起噪声暴露从业人员发生听力损失的危险因素。结果损失组患者右侧在2000、3000、4000、6000 Hz气导听阈测试中,听力阈值大于对照组,损失组患者左侧在500、1000、2000、3000、4000、6000 Hz气导听阈测试中,听力阈值大于对照组,差异均具有统计学意义(P<0.05)。损失组患者的年龄、合并慢性病患者占比、初中及以下文化程度患者占比均显著高于对照组,差异均具有统计学意义(P<0.05)。损失组患者的工龄、肝功能损失患者占比均显著高于对照组,损失组患者的噪声防护患者占比、经常使用噪声防护设备患者占比均显著低于对照组,差异均具有统计学意义(P<0.05)。Logistic回归模型结果显示,年龄越大、合并慢性疾病、工龄越长、未采取噪声防护、偶尔或从不使用噪声防护设备是噪声暴露从业人员发生听力损失的独立危险因素(P<0.05)。结论噪声暴露从业人员发生听力损失的影响因素众多,应根据高危因素进行针对性预防干预,降低人群听力损失的发生风险。 展开更多
关键词 噪声 职业性 听力损失 回归分析 人群特征 音频
暂未订购
基于可听化技术的电影三维声主客观评测
9
作者 王鑫 戎一泓 +1 位作者 李易航 杨静澜 《现代电影技术》 2025年第4期26-32,共7页
随着电影三维声技术发展,诸多影院都配备了三维声系统,在车载环境下欣赏三维声电影也成为一种趋势。然而,不论在影院还是车载环境下,进行现场评测都存在问题。可听化技术能在耳机等设备中模拟现场声学环境,便于进行主观评测实验。同时,... 随着电影三维声技术发展,诸多影院都配备了三维声系统,在车载环境下欣赏三维声电影也成为一种趋势。然而,不论在影院还是车载环境下,进行现场评测都存在问题。可听化技术能在耳机等设备中模拟现场声学环境,便于进行主观评测实验。同时,通过提取音频客观特征,进行主客观关联分析,可对主观评价实验的结果进行进一步分析和解释。因此,本文通过总结现有研究和相关国际标准,提出了基于可听化技术的电影三维声主客观评测框架,并基于该框架进行了实验。实验结果表明,该评测框架效果可靠,在不同重放场景下具有可迁移性。 展开更多
关键词 可听化 三维声 主观评价 主客观关联分析
在线阅读 下载PDF
融合音频特征的古籍文本分析研究
10
作者 龚成楷 王昊 +1 位作者 李晓敏 孟序阳 《情报科学》 北大核心 2025年第4期52-61,共10页
【目的/意义】将古籍的文本特征和语音特征进行融合,以多模态的方式对古籍进行分析研究。【方法/过程】首先利用BERT对文本特征进行提取,MFA语音强制对齐模型和Librosa音频处理工具对音频特征进行提取;然后,在多模态融合层对文本特征和... 【目的/意义】将古籍的文本特征和语音特征进行融合,以多模态的方式对古籍进行分析研究。【方法/过程】首先利用BERT对文本特征进行提取,MFA语音强制对齐模型和Librosa音频处理工具对音频特征进行提取;然后,在多模态融合层对文本特征和音频特征进行融合;最后,将融合特征输入BiLSTM-CRF层进行标签预测并输出结果,构建融合音频特征的古籍文本分析模型TAMAF。【结果/结论】融入合适的音频特征后,所提模型在4个下游验证任务中的表现均优于基线模型。其中,断句效果最高提升了8.54%;分词效果最高提升了0.21%;命名实体识别效果最高提升了0.97%;词性标注效果最高提升了0.85%。本文提出的TAMAF模型具有一定的优越性,能够有效捕捉模态间的交互关系,提升对古籍的处理效果。【创新/局限】语音处理领域还有表达其他物理意义的音频特征可以融入模型进行探究分析。此外,可以在更广泛的数据集更好地对音频和文本特征进行融合交互。 展开更多
关键词 数字人文 音频特征 多模态融合 文本分析 古籍文本
原文传递
音频信号处理技术在电梯故障诊断中的应用
11
作者 李小娜 《电声技术》 2025年第9期174-176,共3页
针对传统电梯故障诊断方法效率低、准确性差等问题,深入分析电梯故障的音频信号特征,探讨频域分析、数字滤波和音频特征提取3种音频信号处理技术在电梯故障诊断中的具体应用方法。实验结果表明,3种音频信号处理技术的各项关键性能指标... 针对传统电梯故障诊断方法效率低、准确性差等问题,深入分析电梯故障的音频信号特征,探讨频域分析、数字滤波和音频特征提取3种音频信号处理技术在电梯故障诊断中的具体应用方法。实验结果表明,3种音频信号处理技术的各项关键性能指标均超过行业标准要求,为电梯安全监测提供了高效可靠的技术手段。 展开更多
关键词 电梯故障诊断 频域分析 数字滤波 音频特征提取 音频信号处理技术
在线阅读 下载PDF
数字音频技术在职工教育培训系统中的应用
12
作者 李志超 梁晓东 《电声技术》 2025年第5期1-3,共3页
研究数字音频技术在职工教育培训系统中的应用,提出一种融合音频增强、自适应语音交互、多模态学习数据分析的创新培训系统。该系统解决复杂培训场景下音频传递不清、内容固定化及缺乏个性化的问题,显著提高职工学习效率、知识掌握程度... 研究数字音频技术在职工教育培训系统中的应用,提出一种融合音频增强、自适应语音交互、多模态学习数据分析的创新培训系统。该系统解决复杂培训场景下音频传递不清、内容固定化及缺乏个性化的问题,显著提高职工学习效率、知识掌握程度、满意度。实验结果证实该系统在多场景培训中具有卓越性能,为职工教育的智能化发展提供技术支持。 展开更多
关键词 数字音频技术 职工教育培训系统 音频增强 自适应语音交互 多模态学习数据分析
在线阅读 下载PDF
实时音频分析比对在广播发射台站运维监测中的应用
13
作者 赵炜畅 《广播与电视技术》 2025年第5期128-132,共5页
在当前智能化、集中化综合运维模式的大背景下,中心运维室整合了下属多个台站的多路信源音频和播出音频信号,构建了运维平台。然而,传统的运维监测平台仅能监测音频信号的有无和强弱,对于音源出现的异常,人力难以及时察觉。针对这一问题... 在当前智能化、集中化综合运维模式的大背景下,中心运维室整合了下属多个台站的多路信源音频和播出音频信号,构建了运维平台。然而,传统的运维监测平台仅能监测音频信号的有无和强弱,对于音源出现的异常,人力难以及时察觉。针对这一问题,运维室在原有监控系统的基础上,成功研发了音频比对分析模块。该模块能够实现信源音频与实际播出音频的多种音频特征提取,并进行实时比对。一旦出现异常,系统能够迅速发现并报警,从而显著提升监控平台对播出内容及播出质量的监测能力,有效减少劣播和错播事故的发生。 展开更多
关键词 多路信源监测 音频特征提取 聚类分析 分析比对
在线阅读 下载PDF
基于多声道特征分析的广播电视系统动态压缩还原技术研究
14
作者 廖海钧 李镇 李云宁 《电视技术》 2025年第3期24-26,共3页
随着广播电视技术的发展,多声道音频成为提升节目表现力的关键因素。针对多声道音频信号在传输中因动态范围压缩而导致的质量下降问题,提出一种基于多声道特征分析的动态压缩还原技术,该技术通过多声道一致性分析、频率选择性动态范围... 随着广播电视技术的发展,多声道音频成为提升节目表现力的关键因素。针对多声道音频信号在传输中因动态范围压缩而导致的质量下降问题,提出一种基于多声道特征分析的动态压缩还原技术,该技术通过多声道一致性分析、频率选择性动态范围调整及时间平滑与过冲控制3个步骤,能够有效恢复音频信号的动态范围,提高音质表现。 展开更多
关键词 多声道音频 动态压缩还原 特征分析
在线阅读 下载PDF
会议扩声系统常见音频问题的原因分析及处理方式
15
作者 朱舒挺 《河南科技》 2025年第16期13-16,共4页
【目的】对扩声系统常见音频故障原因进行分析,寻求合适的处理方案,消除和避免会议扩声系统故障带来的不良影响,保证会议效果。【方法】首先,理解各类声学设备的工作原理,并了解会场扩声系统的整体架构,以熟悉会场的扩声环境;其次,通过... 【目的】对扩声系统常见音频故障原因进行分析,寻求合适的处理方案,消除和避免会议扩声系统故障带来的不良影响,保证会议效果。【方法】首先,理解各类声学设备的工作原理,并了解会场扩声系统的整体架构,以熟悉会场的扩声环境;其次,通过部署专门的声音测量设备进行实际场地模拟测试,还原音频故障现象,逐步排查故障原因。在排查过程中可采取替代法、超越法和排除法来进行问题定位和分析;最后,采取更换故障设备线材、调整音频设备相关参数、优化会场环境布局、加强保障人员技能培训等方式来解决问题。【结果】根据故障产生的不同原因,应采取相应的处理方式。如话筒啸叫问题,应考虑调整话筒和音箱的相对位置;中低频电磁干扰应考虑扩声系统接地是否合理;高频的无线信号干扰应准确定位并避开干扰源。【结论】扩声系统是一个综合性的整体,是集声音采集、处理、传输和扩放于一体的复杂系统。熟悉常见的故障现象,并合理采取相应措施,有助于及时、高效地解决音频故障,提高会议效率和质量。 展开更多
关键词 音频故障 会议扩声 噪声成因分析
在线阅读 下载PDF
风电机组音视频智能巡检系统设计
16
作者 王龙 李阳 +2 位作者 王玉琛 孙子正 宋博文 《科技创新与应用》 2025年第11期37-40,44,共5页
随着新能源风力发电规模的不断扩大,越来越多风电场建设在沙戈荒、深远海等偏远地区,无人值守场站建设已成为大势所趋。这种情况下,智能巡检技术作为无人值守场站建设中必不可少的一环,对其准确性、可靠性方面的要求越来越高。该文设计... 随着新能源风力发电规模的不断扩大,越来越多风电场建设在沙戈荒、深远海等偏远地区,无人值守场站建设已成为大势所趋。这种情况下,智能巡检技术作为无人值守场站建设中必不可少的一环,对其准确性、可靠性方面的要求越来越高。该文设计一种风电机组音视频智能巡检系统,结合声纹分析、机器视觉技术,从多模态、多维度对风电机组关键部件进行状态识别分析,助力提升风电机组巡检智能化水平和各类型故障识别精度。 展开更多
关键词 风电机组 智能巡检 声纹分析 机器视觉 音视频巡检
在线阅读 下载PDF
转炉智慧炼钢相关的监测技术综述
17
作者 肖邦志 张浩 +2 位作者 赵广谙 朱万军 孙伟 《安徽冶金科技职业学院学报》 2025年第2期4-7,共4页
基于副枪的转炉计算机模型炼钢技术已经比较成熟,通过在吹炼后期测量TSC探头激活动态模型实时计算钢液碳含量及温度,为操作工拉碳提供决策依据,让停吹碳温双命中率大幅提高。为了更好地辅助炼钢模型,较多钢厂采用音频测渣技术监测化渣情... 基于副枪的转炉计算机模型炼钢技术已经比较成熟,通过在吹炼后期测量TSC探头激活动态模型实时计算钢液碳含量及温度,为操作工拉碳提供决策依据,让停吹碳温双命中率大幅提高。为了更好地辅助炼钢模型,较多钢厂采用音频测渣技术监测化渣情况,采用烟气分析预警喷溅及预测钢液碳温,采用炉口火焰识别技术来预警喷溅及预测钢液碳温,通过分析这些技术的特点,可以清楚地了解各技术在炼钢模型中起到的实际作用,基于副枪的炼钢模型准确可靠,烟气分析可以预测吹炼后期碳含量,精度不及基于副枪的炼钢模型,火焰识别可分析吹炼后期的碳含量,不可预测钢液温度,可识别吹炼状态,可预警喷溅,音频测渣有很多干扰因素,并不适用,从而选择成熟的技术,改善计算机模型炼钢,提高冶炼水平。 展开更多
关键词 副枪 音频测渣 烟气分析 火焰识别
在线阅读 下载PDF
基于声音增强技术的数控机床故障分析与维修方法
18
作者 李开艳 刘发江 +1 位作者 张志 李吴荣 《电声技术》 2025年第9期198-200,共3页
针对数控机床故障诊断精度不高、实时性差等问题,提出一套基于声音增强技术的数控机床故障分析与维修方法。该方法通过多通道声音传感器采集机床运行声音信号,采用深度学习算法进行声音增强与特征提取,利用支持向量机分类器实现故障类... 针对数控机床故障诊断精度不高、实时性差等问题,提出一套基于声音增强技术的数控机床故障分析与维修方法。该方法通过多通道声音传感器采集机床运行声音信号,采用深度学习算法进行声音增强与特征提取,利用支持向量机分类器实现故障类型识别与故障严重程度评估。实证研究结果表明,该方法的故障识别准确率达到97.7%,平均诊断时间为18.7 s,维修效率达到89.6%,各项指标均优于行业标准要求,为数控机床智能化维护提供了有效的技术支撑。 展开更多
关键词 声音增强技术 数控机床 故障分析 维修方法 深度学习
在线阅读 下载PDF
基于大数据分析的教师教育云平台语音互动功能设计
19
作者 任玲 《电声技术》 2025年第4期82-85,共4页
教师教育云平台是实现教育资源共享和提升教师专业发展水平的工具。平台集成大数据、人工智能和语音互动技术,为教师提供远程学习和教学支持,在提高教学质量的同时满足不同学习者的需求。基于大数据分析进行教师教育云平台语音互动功能... 教师教育云平台是实现教育资源共享和提升教师专业发展水平的工具。平台集成大数据、人工智能和语音互动技术,为教师提供远程学习和教学支持,在提高教学质量的同时满足不同学习者的需求。基于大数据分析进行教师教育云平台语音互动功能设计,优化语音和行为数据基础,精益语音转文本的识别技术,改进音频质量优化技术,设计个性化语言反馈系统。实验结果表明,平台在语音识别精度、音频清晰度及反馈满意度等方面表现优秀,可为未来教育技术的发展提供创新思路。 展开更多
关键词 教师教育云平台 大数据分析 语音互动 个性化反馈 音频优化
在线阅读 下载PDF
上一页 1 2 16 下一页 到第
使用帮助 返回顶部