期刊文献+
共找到368篇文章
< 1 2 19 >
每页显示 20 50 100
Human Perception of Group Synchronization Error in Remote Learning: Dependencies of Voice and Video Contents in One-Way Communication
1
作者 Hay Mar Mo Mo Lwin Yutaka Ishibashi Khin Than Mya 《International Journal of Communications, Network and System Sciences》 2022年第3期31-42,共12页
This paper examines dependencies of voice and video contents on human perception of group (or inter-destination) synchronization error in remote learning by Quality of Experience (QoE) assessment. In our assessment, w... This paper examines dependencies of voice and video contents on human perception of group (or inter-destination) synchronization error in remote learning by Quality of Experience (QoE) assessment. In our assessment, we use two videos and three voices (two voices for one video and one voice for the other video). We also investigate influences of silence periods in the voices and temporal relations between the voices and videos (called the tightly-coupled and loosely-coupled contents here). The voices are spoken by a teacher according to the videos. Each subject as a student assesses the group synchronization quality by watching each lecture video and the corresponding explanation voice, and then the subject answers whether he/she perceives the group synchronization error or not. As a result, assessment results illustrate that silence periods mitigate the perception rate of the error, and we can also find that we can more easily perceive the error for tightly-coupled contents than loosely-coupled ones. 展开更多
关键词 Remote Learning VOICE video Group synchronization Error Human Perception QoE Assessment
在线阅读 下载PDF
基于模态仿射融合的语音控制说话人脸视频对抗生成
2
作者 陈诗航 孙玉宝 《计算机工程》 北大核心 2026年第2期393-403,共11页
语音生成说话人脸视频是当前一个研究热点,涉及音频和视觉两个模态的处理,需要着重解决说话时唇部运动和输入音频对齐的问题。针对该问题提出一种端到端的语音控制说话人脸视频生成对抗模型,主要包括模态仿射融合的生成器、视觉质量判... 语音生成说话人脸视频是当前一个研究热点,涉及音频和视觉两个模态的处理,需要着重解决说话时唇部运动和输入音频对齐的问题。针对该问题提出一种端到端的语音控制说话人脸视频生成对抗模型,主要包括模态仿射融合的生成器、视觉质量判别器和唇形同步判别器,基于仿射融合的生成器通过模态仿射融合模块(MAFBlock),在人脸特征解码过程中添加音频信息,有效地融合音频信息和人脸信息,使得音频能够更好地控制说话人脸视频生成。引入空间注意力和通道注意力机制,增强模型对于局部区域的关注。基于双判别器提高模型生成质量和唇形同步率,唇形同步判别器用于约束唇部运动,对音频和唇形进行相似性判断,在不改变整体轮廓和脸部细节的前提下更精细地控制唇部动作生成,视觉质量判别器判断生成图片的真实性,提高生成图片质量。在两个视听数据集上与多个现有的代表性模型进行对比实验,结果表明:该模型在LRS2验证集上具有8.128的LSE-C分数和6.112的LSE-D分数,相比于Baseline分别提升了4.3%和4.4%;在LRS3验证集上具有7.963的LSE-C分数和6.259的LSE-D分数,相比于Baseline分别提升了6.2%和6.9%。 展开更多
关键词 说话人脸生成 视频生成 唇形同步 音频驱动生成 空间注意力 通道注意力
在线阅读 下载PDF
基于区域显著性与空间特征提取的说话人像合成方法 被引量:1
3
作者 王邢波 张浩 +2 位作者 高浩 翟明亮 谢九成 《计算机科学》 北大核心 2025年第3期58-67,共10页
音频驱动的说话人像合成技术致力于将任意的输入音频序列转换为逼真的说话人像视频。近期,基于神经辐射场(NeRF)的多个说话人像合成工作取得了优秀的视觉效果。但是,此类工作仍普遍存在着语音-嘴唇同步欠佳、躯干抖动和合成视频清晰度... 音频驱动的说话人像合成技术致力于将任意的输入音频序列转换为逼真的说话人像视频。近期,基于神经辐射场(NeRF)的多个说话人像合成工作取得了优秀的视觉效果。但是,此类工作仍普遍存在着语音-嘴唇同步欠佳、躯干抖动和合成视频清晰度较低等不足。为了解决上述问题,提出了一种基于区域显著特征和空间体积特征的高保真说话人像合成方法。具体而言,一方面,开发了一个区域显著性感知模块用于头部建模。它利用多模态输入信息动态调整头部空间点的体积特征,同时优化基于哈希表的特征存储,从而提高面部细节表征的精确度和渲染效率。另一方面,设计了一个空间特征提取模块用于躯干的独立建模。不同于现有方法普遍采用的直接基于躯干表面空间点坐标估计其颜色和密度的方式,该模块利用参考图像构建躯干场以提供对应的纹理和几何先验,从而实现更清晰的躯干渲染和自然的躯干运动。应用于多个人物主体的实验结果表明,在自我重建场景中,所提方法相较于当前最优的基线模型,在图像质量上(PSNR,LPIPS,FID,LMD)分别取得了10.15%,12.12%,0.77%和1.09%的提升,在嘴唇同步精度上(AUE)提高了14.20%。此外,在交叉驱动(使用非训练集音频)的场景下,该算法在嘴唇同步精度(AUE)上提升了4.74%。 展开更多
关键词 说话人像合成 三维重建 音视频同步 神经辐射场 注意力机制
在线阅读 下载PDF
抗时间同步攻击的鲁棒视频水印算法优化研究
4
作者 赵亚宁 严利民 《计算机仿真》 2025年第2期259-262,292,共5页
为最大限度抵抗时间同步攻击下帧置换、帧删除给视频内容带来的冲击,保证视频完整性与真实性,提出一种抗时间同步攻击的鲁棒视频水印算法优化策略。求解当前帧的帧间差分图像,更新视频背景信息,采用饱和度与亮度两个分量分割阴影与背景... 为最大限度抵抗时间同步攻击下帧置换、帧删除给视频内容带来的冲击,保证视频完整性与真实性,提出一种抗时间同步攻击的鲁棒视频水印算法优化策略。求解当前帧的帧间差分图像,更新视频背景信息,采用饱和度与亮度两个分量分割阴影与背景,获得视频连续帧运动特征;通过Arnold置乱让图像数据分布呈散乱形态,使用二阶Hadamard矩阵对混合编码采取正交变换,完成水印信号预处理;计算图像嵌入强度,运用帧离散余弦变换嵌入视频水印,令水印子矩阵和视频帧的亮度分量相互对应,引入结构张量选块机制,优化视频水印不可见性与鲁棒性,利用水印预处理逆向运算实现水印提取。实验结果表明,所提算法针对时间同步攻击具备极强的鲁棒性,提高了视频应用安全,可靠性较强。 展开更多
关键词 时间同步攻击 视频水印 特征提取 鲁棒性
在线阅读 下载PDF
基干MCU架构的远距离高清视频控制系统设计
5
作者 肖云杰 张家慧 +1 位作者 余江涛 罗威 《信息技术》 2025年第7期68-75,共8页
为保证高清视频的应用价值,利用MCU架构从硬件和软件两个部分优化设计远距离高清视频控制系统。加设MCU架构单元作为系统控制器,改装高清视频数据处理器,调整远距离通信模块的连接方式,完成硬件系统的优化。设置RTP/RTCP协议作为高清视... 为保证高清视频的应用价值,利用MCU架构从硬件和软件两个部分优化设计远距离高清视频控制系统。加设MCU架构单元作为系统控制器,改装高清视频数据处理器,调整远距离通信模块的连接方式,完成硬件系统的优化。设置RTP/RTCP协议作为高清视频远距离控制条件,在MCU架构下完成高清视频的编解码,从视频画面质量、声画同步等方面,实现高清视频的远距离控制功能。通过系统测试实验得出结论:与传统控制系统相比,在优化设计系统控制下,视频画面失真率明显下降,声画偏差减小0.1ms,同时延长系统的控制距离。 展开更多
关键词 远距离控制 高清视频 通信模块 声画同步 编解码
在线阅读 下载PDF
基于音视频同步技术的电视新闻多机位编辑模式研究
6
作者 孙宝平 《电视技术》 2025年第8期211-213,共3页
音视频同步技术能够消除由于设备延迟和信号传输引起的时序偏差,确保观众感知到流畅且一致的画面与声音。基于此,提出基于音视频同步技术的多机位编辑模式,分析音频轨道实时调节、视频切换过渡优化及图像显示延时补偿等环节的技术实施细... 音视频同步技术能够消除由于设备延迟和信号传输引起的时序偏差,确保观众感知到流畅且一致的画面与声音。基于此,提出基于音视频同步技术的多机位编辑模式,分析音频轨道实时调节、视频切换过渡优化及图像显示延时补偿等环节的技术实施细节,并对多个典型场景进行实验验证。研究结果表明,该模式的各项评价指标均优于传统模式,在同步精度、流畅度、延时控制和观众体验方面具有显著优势,能够为未来的新闻节目制作提供稳定和高效的技术支持。 展开更多
关键词 音视频同步技术 多机位编辑 延时补偿 电视新闻
在线阅读 下载PDF
音视频同步技术在广播电视节目制作中的应用
7
作者 章卫峰 《电声技术》 2025年第2期131-133,共3页
随着高清电视和网络媒体的快速发展,音视频同步技术在广播电视节目制作中的重要性日益突出。通过对当前音视频同步系统的分析,深入研究节目时钟参考(Program Clock Reference,PCR)、显示时间戳(Presentation Time Stamp,PTS)/解码时间戳... 随着高清电视和网络媒体的快速发展,音视频同步技术在广播电视节目制作中的重要性日益突出。通过对当前音视频同步系统的分析,深入研究节目时钟参考(Program Clock Reference,PCR)、显示时间戳(Presentation Time Stamp,PTS)/解码时间戳(Decoding Time Stamp,DTS)、音视频缓冲区控制等关键技术在实际制作环境中的应用。基于自适应缓冲区控制的音视频同步方案能将音视频延迟控制在±15 ms以内,满足广播级节目制作要求。 展开更多
关键词 音视频同步 时间戳 缓冲区控制 节目时钟参考(PCR)时钟恢复
在线阅读 下载PDF
广播电视工程图像显示实时处理控制技术研究
8
作者 董宪平 《电视技术》 2025年第6期135-137,144,共4页
广播电视工程图像显示技术是多学科交叉领域的重要研究方向,其目标是借助实时处理控制技术实现高分辨率、多场景适应的图像呈现。结合广播电视工程中的实际需求,围绕图像显示实时处理控制技术,提出基于多线程架构的低延迟解码方案,构建... 广播电视工程图像显示技术是多学科交叉领域的重要研究方向,其目标是借助实时处理控制技术实现高分辨率、多场景适应的图像呈现。结合广播电视工程中的实际需求,围绕图像显示实时处理控制技术,提出基于多线程架构的低延迟解码方案,构建动态图像质量优化算法,设计音视频时序校准与缓冲调节机制,开发环境感知与刷新率匹配的显示硬件调节方法,建立信号监测、切换与恢复的容错技术框架,从多个技术维度优化广播电视图像显示的实时性与可靠性,为复杂场景下的图像处理提供系统性解决方案。 展开更多
关键词 广播电视工程 图像显示 实时处理 音视频同步 容错技术
在线阅读 下载PDF
音视频同步处理技术在广播直播间中的应用实践
9
作者 季宝鹏 《电声技术》 2025年第9期126-128,共3页
随着广播电视技术的不断演进,音视频信号的同步处理成为保障直播质量的关键。在广播直播间中,音视频同步关系观众的观看体验,且会影响节目制作效率及后期内容传播效果。重点探讨音视频同步处理技术在广播直播间中的应用。其利用时间戳... 随着广播电视技术的不断演进,音视频信号的同步处理成为保障直播质量的关键。在广播直播间中,音视频同步关系观众的观看体验,且会影响节目制作效率及后期内容传播效果。重点探讨音视频同步处理技术在广播直播间中的应用。其利用时间戳校准、时钟同步等关键技术精准控制音频与视频在各环节中的时序一致性,从而解决因多源输入、网络波动等造成的不同步问题。 展开更多
关键词 音视频同步处理技术 广播直播间 多机位信号切换 远程连线直播
在线阅读 下载PDF
三汇记录仪同步回放与音视频融合功能在AirNet系统中的应用
10
作者 邹艳 《自动化应用》 2025年第1期232-234,238,共4页
空中交通管理是民航管理的重要组成部分,管制员通过自动化系统上显示的航班态势对空中飞行航班进行交通管制,以确保航班安全起降。记录仪作为空管设备中不可或缺的一部分,可通过记录飞行过程中的管制员指令和雷达信号,在需要时完整地回... 空中交通管理是民航管理的重要组成部分,管制员通过自动化系统上显示的航班态势对空中飞行航班进行交通管制,以确保航班安全起降。记录仪作为空管设备中不可或缺的一部分,可通过记录飞行过程中的管制员指令和雷达信号,在需要时完整地回放管制员指挥时的动态界面,为进一步分析和判断事件提供了重要依据,也为空中交通管制提供了支持。随着航班量的不断增加,对记录仪系统的性能要求也越来越高,以持续提升飞行的安全性。基于三汇语音数据记录仪丰富的系统功能,对云南空管分局三汇语音数据记录仪的语音同步回放功能和音视频融合功能在AirNet空管自动化系统中的应用进行了研究,以期为相关单位提供一定参考。 展开更多
关键词 记录仪系统 自动化系统 同步回放 音视频融合 AirNet空管自动化系统
在线阅读 下载PDF
分布式跨网络即时通信平台的构建及应用安全研究
11
作者 王智敏 《计算机应用文摘》 2025年第12期161-166,共6页
针对现代企业对高效即时通信与高标准网络信息安全的迫切需求,尤其是在铁路行业背景下,文章深入研究并强化了网络通信、加密与即时通信等关键技术,构建了一套先进的分布式跨网络即时通信平台。该平台不仅实现了企业内外网之间的无缝即... 针对现代企业对高效即时通信与高标准网络信息安全的迫切需求,尤其是在铁路行业背景下,文章深入研究并强化了网络通信、加密与即时通信等关键技术,构建了一套先进的分布式跨网络即时通信平台。该平台不仅实现了企业内外网之间的无缝即时通信,还集成了数据保护与可信访问等核心安全机制,确保大规模文本消息、文件传输及音视频数据流的实时、安全交换。平台采用分布式与组件化架构设计,支持多节点的分布式部署。通过内置消息队列和同步广播机制构建节点通信与核心消息服务,设计了消息送达缓存机制及回执反馈机制,有效保障消息可靠传输。同时,平台通过正向与反向代理实现跨网络的数据传输能力,突破网络边界限制。在具体通信服务方面,平台构建了基于HTTPS的信令交换服务,并设计了基于选择性转发单元架构(SFU)的流媒体转发模块,提升了实时音视频通信的效率与可扩展性。该平台的技术创新和应用拓展不仅助力铁路行业实现高效、安全的数字通信,也为其他行业的数字化转型和智能化升级提供了有力的技术支撑与实践范例。 展开更多
关键词 即时通信 实时音视频 消息队列 消息同步广播 网络代理 可信访问 端到端加密
在线阅读 下载PDF
多媒体音频视频对象的同步技术研究 被引量:17
12
作者 李国辉 许健 汤大权 《计算机研究与发展》 EI CSCD 北大核心 1995年第4期49-54,共6页
多媒体同步是多媒体研究的一个主要方面,本文分析了多媒体对象表现的时间关系,采用参考时间线和参考点同步的模型描述音频视频对象的同步关系,并相应地提出了具体实现流同步的控制方法。
关键词 多媒体 同步 音频 视频
在线阅读 下载PDF
IP视频会议系统中音视频同步的研究 被引量:14
13
作者 曹宁 胡建荣 马银松 《中国图象图形学报(A辑)》 CSCD 北大核心 2005年第2期255-259,共5页
在IP视频会议系统中,音频流需要保持其连续性(媒体内同步),而视频流的变化应与音频信息保持一致(媒体间同步)。由于网络状态的变化给传输带来延迟抖动,因此接收方要如实地播放,就必须进行同步控制,以恢复数据之间的时间关系。为此探讨了... 在IP视频会议系统中,音频流需要保持其连续性(媒体内同步),而视频流的变化应与音频信息保持一致(媒体间同步)。由于网络状态的变化给传输带来延迟抖动,因此接收方要如实地播放,就必须进行同步控制,以恢复数据之间的时间关系。为此探讨了在MCU集中管理模式下的视频会议系统中,音视频同步控制的问题,并结合RTP/RTCP协议给出具体可行的解决方案。 展开更多
关键词 IP视频会议系统 音视频 媒体内同步 行同步 延迟抖动 音频流 接收 网络状态 RTP/RTCP协议 音频信息
在线阅读 下载PDF
基于H.264的嵌入式音视频同步编码技术 被引量:6
14
作者 李晓妮 陈贺新 +2 位作者 孙元 陈绵书 刘添 《吉林大学学报(工学版)》 EI CAS CSCD 北大核心 2011年第5期1475-1479,共5页
提出了一种在H.264帧间预测过程中嵌入音频的音视频同步压缩编码方法,利用H.264中匹配块的尺寸可变性,解决了音视频同步编码问题。在发送端,根据编码准则,不同尺寸的匹配块携带不同的音频信息,通过对匹配块的选择将音频压缩流嵌入视频中... 提出了一种在H.264帧间预测过程中嵌入音频的音视频同步压缩编码方法,利用H.264中匹配块的尺寸可变性,解决了音视频同步编码问题。在发送端,根据编码准则,不同尺寸的匹配块携带不同的音频信息,通过对匹配块的选择将音频压缩流嵌入视频中,然后对嵌入音频的视频流进行压缩编码。在解码端,根据嵌入准则,提取音频信息,再对音频和视频信号进行重构和恢复。实验表明,本文方法在一定开销内,视频质量下降较小的情况下,实现了音视频同步压缩编码和传输。 展开更多
关键词 通信技术 同步编码 帧间预测编码 音视频
在线阅读 下载PDF
H.264/AVC标准中基于CABAC的数字视频加密研究 被引量:10
15
作者 包先雨 蒋建国 +1 位作者 袁炜 李援 《通信学报》 EI CSCD 北大核心 2007年第6期24-29,共6页
分析和总结了用于新一代视频编码标准H.264/AVC加密的候选域,在此基础上提出了一种新的基于CABAC(基于上下文的自适应二进制算术编码)的数字视频加密方案,并给出了2种安全加密操作:RCME(规则编码模式加密)和BCME(旁路编码模式加密)实现... 分析和总结了用于新一代视频编码标准H.264/AVC加密的候选域,在此基础上提出了一种新的基于CABAC(基于上下文的自适应二进制算术编码)的数字视频加密方案,并给出了2种安全加密操作:RCME(规则编码模式加密)和BCME(旁路编码模式加密)实现了残差系数码字、运动矢量差码字和帧内预测模式的加密保护。实验结果表明,该方案具有较好的安全性、编码效率和误码顽健性。 展开更多
关键词 视频加密 混沌加密 保密性 密钥同步 熵编码 CABAC
在线阅读 下载PDF
嵌入式高速DSP视频图像处理系统中数据存储器的接口设计 被引量:12
16
作者 李武森 迟泽英 陈文建 《红外技术》 CSCD 北大核心 2003年第1期51-53,57,共4页
探讨了高速DSP视频处理系统中外部数据存储器的容量、速度及与TMS32 0C6X的接口方法 ,设计了实际的接口电路 ,讨论了TMS32 0C6X的片内数据存储器及其地址冲突问题 ,以及视频处理过程中图像数据的存放问题。
关键词 嵌入式 DSP 视频图像处理系统 数据存储器 接口设计 数字信号处理器 同步动态扫描存储器
在线阅读 下载PDF
一种外置式视频同步信号发生器的设计 被引量:5
17
作者 林明秀 姚剑敏 +1 位作者 许廷发 宋建中 《液晶与显示》 CAS CSCD 2004年第5期391-395,共5页
对随机视频信号的特点进行了研究,提出了采用谱分析提取随机视频信号的同步频率的方法,根据数据传输的要求设计了基于USB接口的外置式视频同步信号发生器并给出了系统的硬件框图和软件流程。系统具有自动分析随机视频信息隐含的同步信... 对随机视频信号的特点进行了研究,提出了采用谱分析提取随机视频信号的同步频率的方法,根据数据传输的要求设计了基于USB接口的外置式视频同步信号发生器并给出了系统的硬件框图和软件流程。系统具有自动分析随机视频信息隐含的同步信号频率,精确产生同步脉冲信号的特点,满足随机视频信号采集和稳定显示的同步要求,同步精度达到300帧内图像漂移小于1个像素。利用该视频同步信号发生器控制非标准图像采集卡实现了计算机辐射的随机视频信号的采集和稳定显示。 展开更多
关键词 随机视频信息 同步信号 USB接口 稳定显示 信号频率 系统设计
在线阅读 下载PDF
高清晰度电视芯片中视频和音频同步的异步实现 被引量:5
18
作者 王维东 姚庆栋 虞露 《红外与激光工程》 EI CSCD 北大核心 2002年第1期72-76,共5页
高清晰度电视的传输流采用了MPEG 2系统层标准ISO/IEC 13818 1。阐述了高清晰度电视 (HDTV)传送流中时间信息码在视频和音频同步中的作用 ,分析了信源解码器中视频和音频同步的原理。就实际芯片中系统时钟的恢复、视频和音频的跳帧等机... 高清晰度电视的传输流采用了MPEG 2系统层标准ISO/IEC 13818 1。阐述了高清晰度电视 (HDTV)传送流中时间信息码在视频和音频同步中的作用 ,分析了信源解码器中视频和音频同步的原理。就实际芯片中系统时钟的恢复、视频和音频的跳帧等机制进行了讨论 ,并提出了一种非锁相异步全数字视音频同步实现方案。该方案采用了直接置数法恢复系统时钟 ,滞后跳帧法实现视频与系统时钟的同步 ,数字锁相法控制音频与系统时钟同步。最后 。 展开更多
关键词 异步 高清晰度电视 信源解码 视频同步 音频同步
原文传递
VBS─全软件动态视频图像编辑与播放系统的设计与实现 被引量:5
19
作者 李国辉 汤大权 许健 《小型微型计算机系统》 CSCD 北大核心 1994年第6期14-20,共7页
用纯软件实现动态视频对象的管理是多媒体技术中的一个难点。本文介绍VBS─全软件动态视频图像编辑与播放系统的结构组成以及各模块的设计思想和实现技术。
关键词 多媒体 动态视频 音频 VBS
在线阅读 下载PDF
分布式IP视频会议系统中声像同步技术的研究与实现 被引量:5
20
作者 郑力明 张会汀 +1 位作者 刘伟平 薛沛林 《计算机工程与应用》 CSCD 北大核心 2002年第11期227-229,共3页
在分布式多媒体系统中,多媒体信息的同步传输是一项关键问题。该文探讨了在分布式IP视频会议系统中如何实现声像同步控制的问题,并给出了具体可行的解决方案。
关键词 分布式IP视频会议系统 声像同步 IP组播 多媒体通信
在线阅读 下载PDF
上一页 1 2 19 下一页 到第
使用帮助 返回顶部