期刊文献+
共找到171篇文章
< 1 2 9 >
每页显示 20 50 100
Prioritized MPEG-4 Audio-Visual Objects Streaming over the DiffServ
1
作者 黄天云 郑婵 《Journal of Electronic Science and Technology of China》 2005年第4期314-320,共7页
The object-based scalable coding in MPEG-4 is investigated, and a prioritized transmission scheme of MPEG-4 audio-visual objects (AVOs) over the DiffServ network with the QoS guarantee is proposed. MPEG-4 AVOs are e... The object-based scalable coding in MPEG-4 is investigated, and a prioritized transmission scheme of MPEG-4 audio-visual objects (AVOs) over the DiffServ network with the QoS guarantee is proposed. MPEG-4 AVOs are extracted and classified into different groups according to their priority values and scalable layers (visual importance). These priority values are mapped to the 1P DiffServ per hop behaviors (PHB). This scheme can selectively discard packets with low importance, in order to avoid the network congestion. Simulation results show that the quality of received video can gracefully adapt to network state, as compared with the ‘best-effort' manner. Also, by allowing the content provider to define prioritization of each audio-visual object, the adaptive transmission of object-based scalable video can be customized based on the content. 展开更多
关键词 video streaming quality of service (QoS) MPEG-4 audio-visual objects (AVOs) DIFFSERV PRIORITIZATION
在线阅读 下载PDF
CORBA A/V Streams服务的实现及其在远程教育中的应用 被引量:3
2
作者 黎富刚 沈卓炜 +1 位作者 冯名正 杨鹏 《计算机工程与应用》 CSCD 北大核心 2003年第16期142-145,共4页
文章详细介绍了CORBAA/VStreams规范,提出了基于ORBUS系统和RSVP资源预留的实现模型,并依据该模型实现了CORBAA/VStreams原型系统。利用该原型系统,设计并实现了一个实用的远程教育系统。
关键词 CORBA A/V streamS 资源预留 远程教育
在线阅读 下载PDF
VB环境下Audio/Video压缩数据流播放技术的应用
3
作者 顾善发 张中元 《青岛建筑工程学院学报》 2001年第3期56-59,共4页
介绍了在 Windwos操作系统中 ,利用 VB自身条件和原有控件 ,灵活调用 Windows下的动态链接库开发
关键词 MPEG audio/Video数据流 动态链接库
在线阅读 下载PDF
音视频流处理技术在会议室管理平台中的应用
4
作者 梁兆伟 《移动信息》 2026年第1期250-252,共3页
随着混合办公模式的普及,传统会议室系统在效率、用户体验及能耗管理方面面临严峻挑战。文中提出了一种基于多模态AI框架的智能会议室管理系统,通过融合视觉、音频及环境传感数据,构建动态决策引擎,实现了设备的自动化调度。实验表明,... 随着混合办公模式的普及,传统会议室系统在效率、用户体验及能耗管理方面面临严峻挑战。文中提出了一种基于多模态AI框架的智能会议室管理系统,通过融合视觉、音频及环境传感数据,构建动态决策引擎,实现了设备的自动化调度。实验表明,该框架在10间真实会议室场景中显著提升了用户体验,语音可懂度评分达3.4(PESQ标准),用户满意度较传统系统提升超40%。研究成果为智慧办公场景提供了高效、低耗、高鲁棒性的解决方案,推动了会议室管理向自动化、智能化的方向演进。 展开更多
关键词 多模态AI 会议室自动化管理 音视频流处理 轻量化模型 动态决策引擎 能耗优化
在线阅读 下载PDF
Multimedia Streaming for Ad Hoc Wireless Mesh Networks Using Network Coding
5
作者 Basil Saeed Chung-Horng Lung +1 位作者 Thomas Kunz Anand Srinivasan 《International Journal of Communications, Network and System Sciences》 2013年第5期204-220,共17页
Over the past years, we have witnessed an explosive growth in the use of multimedia applications such as audio and video streaming with mobile and static devices. Multimedia streaming applications need new approaches ... Over the past years, we have witnessed an explosive growth in the use of multimedia applications such as audio and video streaming with mobile and static devices. Multimedia streaming applications need new approaches to multimedia transmissions to meet the growing volume demand and quality expectations of multimedia traffic. This paper studies network coding which is a promising paradigm that has the potential to improve the performance of networks for multimedia streaming applications in terms of packet delivery ratio (PDR), latency and jitter. This paper examines several network coding protocols for ad hoc wireless mesh networks and compares their performance on multimedia streaming applications with optimized broadcast protocols, e.g., BCast, Simplified Multicast Forwarding (SMF), and Partial Dominant Pruning (PDP). The results show that the performance increases significantly with the Random Linear Network Coding (RLNC) scheme. 展开更多
关键词 Wireless Broadcast Multimedia streamING audio streamING Video streamING NETWORK CODING Random Linear NETWORK CODING PDP SMF BCast
在线阅读 下载PDF
基于音频挖掘的电商主播声音特征对带货业绩影响效应 被引量:3
6
作者 胡书逸 陈远高 +2 位作者 杨水清 姜辉 周莎莎 《系统管理学报》 北大核心 2025年第1期123-136,共14页
基于信号理论和非语言线索理论,应用音频挖掘技术,分析了淘宝直播平台上电商主播的直播视频和带货数据,研究了电商主播的声音特征(音调、响度、语速)对其销售业绩的影响作用。研究结果表明:音调、响度、语速对直播带货销售额有显著且稳... 基于信号理论和非语言线索理论,应用音频挖掘技术,分析了淘宝直播平台上电商主播的直播视频和带货数据,研究了电商主播的声音特征(音调、响度、语速)对其销售业绩的影响作用。研究结果表明:音调、响度、语速对直播带货销售额有显著且稳健的倒U型影响,背景音乐节奏正向调节了主播语速与带货销售额之间的倒U型关系,并且背景音乐节奏、主播语速和产品类型匹配时更有利于促进带货业绩提升。同时,进一步研究了主播声音特征在直播带货两阶段中的不同影响,发现主播语速特征在商品讲解阶段的倒U型效应不显著,而在说服购买阶段的倒U型效应显著。 展开更多
关键词 直播电商 主播 声音特征 信号理论 音频挖掘
在线阅读 下载PDF
基于音视频分流技术的呼叫中心视频能力升级方案
7
作者 李微微 孙记明 牛金翠 《邮电设计技术》 2025年第11期61-64,共4页
随着通信技术的发展和客户需求的提高,传统呼叫中心升级为视频呼叫中心成为必然趋势。探讨了基于音视频分流技术的呼叫中心视频能力升级的有效方案及优势。视频呼叫中心升级能提升客户体验、提高沟通效率、拓展服务范围并降低运营成本... 随着通信技术的发展和客户需求的提高,传统呼叫中心升级为视频呼叫中心成为必然趋势。探讨了基于音视频分流技术的呼叫中心视频能力升级的有效方案及优势。视频呼叫中心升级能提升客户体验、提高沟通效率、拓展服务范围并降低运营成本。最后以110接处警为例分析了成功升级的经验。 展开更多
关键词 音视频分流 视频呼叫中心 VoLTE VoNR WebRTC SIP
在线阅读 下载PDF
基于双向流式引擎的数字人交互体验优化研究
8
作者 陈嘉 林宏炜 胡俊 《广播与电视技术》 2025年第11期15-18,共4页
本文基于广电行业广泛应用的数字人播报系统,围绕实时音视频处理、多模态融合与低延迟传输等广电关键技术,探讨了数字人在实时交互体验中的优化路径。通过引入双向流式引擎架构,结合广电级音视频处理标准,重点优化语音动作融合输出与交... 本文基于广电行业广泛应用的数字人播报系统,围绕实时音视频处理、多模态融合与低延迟传输等广电关键技术,探讨了数字人在实时交互体验中的优化路径。通过引入双向流式引擎架构,结合广电级音视频处理标准,重点优化语音动作融合输出与交互时延控制,显著提升了数字人的应答自然度与流畅性,拓展了广电数字人在政务服务、智慧广电等融合业务场景中的应用。 展开更多
关键词 数字人实时交互 多模态融合引擎 双向流式引擎 音视频处理
在线阅读 下载PDF
智能化视频直播系统在传统广播直播间的设计与实现 被引量:1
9
作者 曹桔香 王志杰 《广播与电视技术》 2025年第3期31-36,共6页
为实现新媒体时代的转型发展,需要对传统广播直播间进行融合制播平台改造,以实现多信源采集、音视频共做和多渠道分发。本文简要阐述项目的需求背景,并兼顾传统广播及广播新媒体需求,重点分析整个系统架构及实现难点,最终设计实现了智... 为实现新媒体时代的转型发展,需要对传统广播直播间进行融合制播平台改造,以实现多信源采集、音视频共做和多渠道分发。本文简要阐述项目的需求背景,并兼顾传统广播及广播新媒体需求,重点分析整个系统架构及实现难点,最终设计实现了智能化视频直播系统,满足了节目创新创优,并有效缩减了人力和系统成本。 展开更多
关键词 视频直播系统 自动切换 逻辑控制 音频处理
在线阅读 下载PDF
基于云化架构的车机算力及生态结构性瓶颈的解决方案
10
作者 权香妮 蔡勇 韦建平 《时代汽车》 2025年第24期117-119,共3页
传统车机系统在算力扩展与生态集成方面存在结构性瓶颈。文章面向弱终端强云端的架构模式构建了以编解码显示为车端基础、算力与应用完全云托管的云车机方案,设计了云端GPU弹性调度、边缘计算部署、指令优先级策略与低延时视频传输机制... 传统车机系统在算力扩展与生态集成方面存在结构性瓶颈。文章面向弱终端强云端的架构模式构建了以编解码显示为车端基础、算力与应用完全云托管的云车机方案,设计了云端GPU弹性调度、边缘计算部署、指令优先级策略与低延时视频传输机制,并构建车端与云端之间的实时双向控制通道。结果表明该架构具备显著的算力解耦能力与生态适配灵活性,对智能座舱向平台化、低成本演进具有支撑意义。 展开更多
关键词 云车机 车云协同 音视频串流 交互控制
在线阅读 下载PDF
高校数字化教学资源的音频压缩与优化策略
11
作者 罗凯 马靖淇 《电视技术》 2025年第1期93-96,共4页
高校数字化教学资源中,音频的优化和压缩是提升教学质量和资源利用效率的关键环节。深入分析高校音频资源的特点和优化现状,通过探讨采样率、比特率调节等技术原理总结在音频优化实践中遇到的挑战与相应的解决策略。
关键词 音频优化 数字化教学资源 流媒体
在线阅读 下载PDF
流媒体节目制作域双耳渲染三维声制播探索——以中国传媒大学2023年校级合唱比赛节目制播为例
12
作者 张云帆 《演艺科技》 2025年第2期48-52,共5页
以中国传媒大学2023年校级合唱比赛节目制播为例,探索一套在制作域内利用双耳渲染技术实现流媒体节目三维声直播的解决方案,基于现有制播系统,以及配置带有Renderer渲染器、后期制作插件的音频工作站,实现双声道立体声、5.1.2格式三维... 以中国传媒大学2023年校级合唱比赛节目制播为例,探索一套在制作域内利用双耳渲染技术实现流媒体节目三维声直播的解决方案,基于现有制播系统,以及配置带有Renderer渲染器、后期制作插件的音频工作站,实现双声道立体声、5.1.2格式三维声的制作,并在流媒体平台同步播出。 展开更多
关键词 三维声 制作域双耳渲染 流媒体节目制作 渲染器 监听 播出
在线阅读 下载PDF
区县级媒体融合直播系统的设计与应用
13
作者 潘家荣 《广播与电视技术》 2025年第10期39-42,共4页
本文以“贵阳路边音乐会·新光里”活动实践为例,阐述贵阳市乌当区融媒体中心设计并搭建的一套区县级媒体融合直播系统。该系统集成多源信号采集和多链路传输技术,以低成本实现高效率稳定运行,完成电视及新媒体平台的同步直播任务,... 本文以“贵阳路边音乐会·新光里”活动实践为例,阐述贵阳市乌当区融媒体中心设计并搭建的一套区县级媒体融合直播系统。该系统集成多源信号采集和多链路传输技术,以低成本实现高效率稳定运行,完成电视及新媒体平台的同步直播任务,为区县级媒体融合直播系统搭建提供参考。 展开更多
关键词 区县级媒体融合 直播系统 信号传输 音视频处理 通话系统
在线阅读 下载PDF
AI技术在大型直播活动音频混音自动化处理中的应用
14
作者 刘峻 《电声技术》 2025年第10期115-117,共3页
大型直播活动音频混音涉及多通道信号处理、声学环境变化与声源快速切换,对实时性与精度要求极高。人工智能(Artificial Intelligence,AI)技术在声源分类、特征提取、参数优化及空间校正等方面具有自适应能力,成为提高混音质量与效率的... 大型直播活动音频混音涉及多通道信号处理、声学环境变化与声源快速切换,对实时性与精度要求极高。人工智能(Artificial Intelligence,AI)技术在声源分类、特征提取、参数优化及空间校正等方面具有自适应能力,成为提高混音质量与效率的重要途径。分析AI技术在大型直播活动音频混音自动化处理中的应用路径,包括声音信号精准识别、响度变化动态控制、频谱结构智能均衡以及空间声场实时校正,并结合实际案例从多维度对技术性能进行对比分析,验证了其在复杂演出环境下的适配性与优化效果。 展开更多
关键词 人工智能(AI)技术 大型直播 自动混音 声学特征 音频处理
在线阅读 下载PDF
特定类型音频流泛化识别方法 被引量:5
15
作者 罗森林 李金玉 潘丽敏 《北京理工大学学报》 EI CAS CSCD 北大核心 2011年第10期1231-1235,共5页
提出一种基于Mel频率倒谱系数(MFCC)和AdaBoost算法的特定类型音频流泛化识别方法,通过分析特定类型音频流的子类别间的共性和差异性,利用共性特征进行泛化识别,能够准确地检测并定位音频流中特定类型的音频.文中将枪声作为特定类型音... 提出一种基于Mel频率倒谱系数(MFCC)和AdaBoost算法的特定类型音频流泛化识别方法,通过分析特定类型音频流的子类别间的共性和差异性,利用共性特征进行泛化识别,能够准确地检测并定位音频流中特定类型的音频.文中将枪声作为特定类型音频进行研究,通过提取各种枪声子类别的共性,弱化子类间的差异得到一个泛化的枪声模板,利用一个模板就可以支持多子类的准确识别.实验结果表明,算法的识别准确率为87.6%,查全率达到91.8%. 展开更多
关键词 音频检索 ADABOOST MEL频率倒谱系数 特定音频流
在线阅读 下载PDF
音视频流和屏幕流的同步传输方法研究 被引量:4
16
作者 黄若宏 刘怀兰 陈永强 《计算机工程与设计》 CSCD 北大核心 2007年第19期4686-4689,共4页
针对音视频流在网络上同步传输的难点问题,分析了基于Internet的网络教学中音视频流和计算机屏幕流传输的特点,提出了MPEG-4音视频流和屏幕流同步传输算法,采用仿真系统详细实现了一套采用实时传输协议的同步传输方案。通过开发的实际... 针对音视频流在网络上同步传输的难点问题,分析了基于Internet的网络教学中音视频流和计算机屏幕流传输的特点,提出了MPEG-4音视频流和屏幕流同步传输算法,采用仿真系统详细实现了一套采用实时传输协议的同步传输方案。通过开发的实际系统验证,有效地解决了将教师授课的音频和视频信息以及教师授课机的屏幕信息同步直播这一问题,达到了较好的使用效果。 展开更多
关键词 时间戳 实时传输协议 同步传输 音频流 视频流 屏幕流 直播
在线阅读 下载PDF
基于DirectSound技术的音频捕获与多路混音的实现 被引量:7
17
作者 苑春苗 杨清永 《计算机工程与设计》 CSCD 北大核心 2007年第3期613-614,634,共3页
给出了一个如何使用DirectSound技术实现音频流的捕获并实现网络上多路声音混合的方案。该方案通过Direct-Sound提供的缓冲机制实现了音频流的捕获,结合网络技术和辅助缓冲技术可实现网络上多路声音的混合,提高了音频处理的效率和通用... 给出了一个如何使用DirectSound技术实现音频流的捕获并实现网络上多路声音混合的方案。该方案通过Direct-Sound提供的缓冲机制实现了音频流的捕获,结合网络技术和辅助缓冲技术可实现网络上多路声音的混合,提高了音频处理的效率和通用性。阐述了DirectSound的相关技术,给出了系统的框架图及音频捕获与混音的实现方法,提出了环形缓冲区设计方案,最后给出了系统优化方案。 展开更多
关键词 DIRECTSOUND 网络 音频流 混音 缓冲技术
在线阅读 下载PDF
丢包对音频流体验质量的影响分析 被引量:2
18
作者 张大陆 沈斌 +1 位作者 胡治国 侯翠平 《计算机应用》 CSCD 北大核心 2009年第1期16-17,31,共3页
分组网络中丢包对音频流媒体用户体验具有显著影响,为了深入分析两者间的相关性,设计了丢包可控的多媒体仿真传输实验平台,采用回归分析,建立了编码方式、RTP分组间隔等多因素限定下丢包率与体验质量间的映射模型。该模型计算复杂度低,... 分组网络中丢包对音频流媒体用户体验具有显著影响,为了深入分析两者间的相关性,设计了丢包可控的多媒体仿真传输实验平台,采用回归分析,建立了编码方式、RTP分组间隔等多因素限定下丢包率与体验质量间的映射模型。该模型计算复杂度低,可实时预测丢包对体验质量的损害。 展开更多
关键词 体验质量 音频流 丢包 映射模型
在线阅读 下载PDF
利用VFW库函数快速分解AVI数据流 被引量:14
19
作者 肖永隆 王理 《信息工程大学学报》 2001年第3期39-42,共4页
本文在简要分析AVI数据结构的基础上 ,着重介绍了如何调用vfw库中的函数快速分解AVI数据流的方法 。
关键词 AVI数据流 vfw库 音频流 视频流 函数 视频压缩 数据结构
在线阅读 下载PDF
在接收端实现的媒体同步控制算法 被引量:4
20
作者 吴炜 常义林 《系统工程与电子技术》 EI CSCD 北大核心 2006年第10期1587-1591,共5页
提出一种在接收端实现的媒体同步控制算法。算法分别根据音频和视频播放缓冲区的占用水平,在不影响音频播放质量的情况下调整音频帧的长度,实现音频流媒体内同步;通过改变视频流的播放帧率达到视频流媒体内同步。并以音频流为主媒体流,... 提出一种在接收端实现的媒体同步控制算法。算法分别根据音频和视频播放缓冲区的占用水平,在不影响音频播放质量的情况下调整音频帧的长度,实现音频流媒体内同步;通过改变视频流的播放帧率达到视频流媒体内同步。并以音频流为主媒体流,视频流为从媒体流,比较最近播放的音频帧和视频帧的播放时间标签,调整视频帧的播放持续时间来取得音视频媒体间同步。实验结果表明,在不增加播放时延的情况下,该算法可以实现单个媒体流的媒体内同步,并达到音视频媒体间同步。 展开更多
关键词 媒体同步 播放缓冲区 音频流 视频流
在线阅读 下载PDF
上一页 1 2 9 下一页 到第
使用帮助 返回顶部