期刊文献+
共找到1,621篇文章
< 1 2 82 >
每页显示 20 50 100
孤独症访谈场景下融入角色信息的说话人日志方法
1
作者 王康月 程铭 +2 位作者 谢奕香 邹小兵 李明 《计算机科学》 北大核心 2025年第2期231-241,共11页
说话人日志技术在智能语音转写领域扮演着关键的角色,其核心任务是按照说话人的身份对多人音频进行分割和聚类,以便更好地对音频内容及转写文本进行整理。在医疗访谈领域,说话人日志技术是自动化评估的前置条件。医疗交互对话领域天然... 说话人日志技术在智能语音转写领域扮演着关键的角色,其核心任务是按照说话人的身份对多人音频进行分割和聚类,以便更好地对音频内容及转写文本进行整理。在医疗访谈领域,说话人日志技术是自动化评估的前置条件。医疗交互对话领域天然存在角色信息,以孤独症辅助诊断为例,典型的情境包括医生、家长和接受诊断的孩子这3种明确定义的角色。但在实际对话中,角色和说话人之间的对应关系可能并非一一对应。例如,在孤独症诊断过程中,每次会话仅涉及一个孩子,而医生或家长的数量却是不确定的。文中认为语音片段中隐含的角色信息与声纹信息可以进行有效的互补,进而降低错误率,故提出一种将角色信息引入序列到序列目标说话人语音活动检测(Seq2Seq-TSVAD)中的方法。在CPEP-3数据集上,说话人日志的错误率(DER)为20.61%,相比Seq2Seq-TSVAD方法降低了9.8%,相比模块化说话人日志方法降低了19.3%,表明孤独症访谈场景下角色信息在提升说话人日志性能方面具有明显的作用。 展开更多
关键词 说话人日志 角色分类 特定说话人语音活动检测 声纹特征提取 孤独症谱系障碍
在线阅读 下载PDF
嵌入式翻译器语音识别系统误差自动检测方法
2
作者 贾梦琦 《自动化技术与应用》 2025年第4期103-106,129,共5页
嵌入式翻译器语音识别系统识别过程中受到多种因素影响,产生不同的误差结果,影响后续的语音控制,提出嵌入式翻译器语音识别系统的误差自动检测方法。通过分帧加窗理论,预处理嵌入式翻译器语音信息;依据语音信息选择语言与声学模型,设定... 嵌入式翻译器语音识别系统识别过程中受到多种因素影响,产生不同的误差结果,影响后续的语音控制,提出嵌入式翻译器语音识别系统的误差自动检测方法。通过分帧加窗理论,预处理嵌入式翻译器语音信息;依据语音信息选择语言与声学模型,设定语音信息特征提取流程,预测误差信息的特征指数,提取语音信息特征;采用注意力机制,建立共享参数函数,在划定区域内自动检测识别系统误差,实现误差自动检测。实验结果表明,以“five”语句为翻译识别对象,分别在噪声因素为50 dB和150 dB条件下检测误差,所提方法能够准确地对误差信号进行识别。 展开更多
关键词 误差检测 嵌入式翻译器 语音识别系统 分帧加窗 注意力机制
在线阅读 下载PDF
基于减小高频混响和RF-DRSN-EMA的声音事件分类方法
3
作者 曹毅 王彦雯 +2 位作者 李杰 郑植 孙浩 《华南理工大学学报(自然科学版)》 北大核心 2025年第7期70-79,共10页
针对现有声音事件分类方法分类准确率不高、泛化能力不强的问题,该文提出了一种基于减小高频混响和多尺度注意力的频域残差收缩网络(RF-DRSN-EMA)的声音事件分类方法。首先,根据减小声音混响的原理,提出了一种减小高频混响的方法,该方... 针对现有声音事件分类方法分类准确率不高、泛化能力不强的问题,该文提出了一种基于减小高频混响和多尺度注意力的频域残差收缩网络(RF-DRSN-EMA)的声音事件分类方法。首先,根据减小声音混响的原理,提出了一种减小高频混响的方法,该方法仅减小分离出音频中的高频段混响而保留其余频段的关键频率信息,以便在提升语音清晰度的同时尽可能地减小语音失真的影响。然后,以深度残差收缩网络为基础网络,结合改进的频域自校正算法和多尺度注意力模块,提出了多尺度注意力的频域残差收缩网络RF-DRSN-EMA;该网络采用RF自校正模块(其内部的长短距离残差结构能缓解特征坍塌),以实现频域信息的高效采集,并在单元的输出采用多尺度注意力模块,进一步关注单元在输出层的有效信息,以强化模型的表征能力。最后,基于数据集ESC-10、UrbanSound8K和DCASE2020 Task 1A开展了声音事件分类实验。结果表明:该文提出的减小高频混响的语音增强方法能有针对性地减小高频段混响等背景噪音的影响和消除冗余特征,音质损伤较小,从而具有更好的分类性能;RF-DRSN-EMA实现了网络中频域的典型特征去噪以及信息的高效采集,在3个数据集上的最佳分类准确率分别达到98.00%、93.42%、72.80%,从而验证了该方法的有效性和泛化性。 展开更多
关键词 声音事件分类 减小高频混响 频域残差收缩网络 多尺度注意力 语音增强
在线阅读 下载PDF
基于音节类型识别的自动语音分割算法
4
作者 孙林嘉 秦磊 +1 位作者 康美金 王莹琳 《计算机应用》 北大核心 2025年第6期2034-2042,共9页
基于边界检测的方法侧重利用时域和频域的突变来将语音数据切分成音节单元,较少关注语言知识在分割中发挥的作用。同时,此类方法通常需要设置各项参数以获得满意的分割结果,致使这些方法在大数据量和跨语言的环境下存在稳定性差、调整... 基于边界检测的方法侧重利用时域和频域的突变来将语音数据切分成音节单元,较少关注语言知识在分割中发挥的作用。同时,此类方法通常需要设置各项参数以获得满意的分割结果,致使这些方法在大数据量和跨语言的环境下存在稳定性差、调整参数难和泛化能力弱的缺点。针对上述问题,提出一种基于音节类型识别的自动语音分割算法。该算法的特点在于所要识别的对象是语音数据中的音节类型,而非具体的音节内容。首先,利用语言学研究成果和音节构成规律获得不同语言在自然发音下较通用的音节类型;其次,采用经典的高斯混合模型(GMM)和隐马尔可夫模型(HMM)为每种音节类型构建声学模型;另外,为了更好地描述音节属性,提出一种基于多频带分析和显著信息融合的特征提取通道;最后,在所识别音节类型序列的基础上,使用维特比算法确定对应音节起止点的语音帧。在实验阶段利用3种常见语言的语音数据训练得到音节类型的声学模型,再在6种语言和方言上进行识别实验。实验结果表明,所提算法的平均识别准确率至少达到了91.93%;与使用梅尔频率倒谱系数(MFCC)相比,使用所提特征获得的平均识别准确率至少提升了27.16个百分点;当容差阈值为20 ms时,在6种语言和方言上依然可以取得90.70%以上的平均分割准确率;相较于近年来有代表性的4种算法,所提算法的平均分割准确率至少提升了5.73个百分点。以上说明所提算法具有较强的泛化能力、较好的稳定性和较高的分割准确率。 展开更多
关键词 语音分割 音节类型 声学模型 多频带分析 特征融合
在线阅读 下载PDF
智能显示设备视觉健康标准建设
5
作者 王亚军 《质量与认证》 2025年第6期26-28,共3页
通过实施标准建设与产业化应用,视觉健康友好度认证已取得良好成效,本文聚焦智能显示设备视觉健康新技术的研究与发展,探讨智能显示设备视觉健康标准建设的要求及关键要点。并分析未来智能显示设备视觉健康的发展方向与路径,推动显示设... 通过实施标准建设与产业化应用,视觉健康友好度认证已取得良好成效,本文聚焦智能显示设备视觉健康新技术的研究与发展,探讨智能显示设备视觉健康标准建设的要求及关键要点。并分析未来智能显示设备视觉健康的发展方向与路径,推动显示设备向健康友好方向发展,为消费者创造更美好的健康生活。 展开更多
关键词 健康友好 智能显示设备 新技术 视觉健康 标准建设
在线阅读 下载PDF
智能语音助手用户的持续使用行为影响因素研究——基于“认知-情感-意动”的理论视角
6
作者 杨秀丽 《信息与电脑》 2025年第14期160-162,共3页
探究智能语音助手用户持续使用行为的影响因素及其作用机理,以期揭示智能语音助手用户持续使用行为背后的深层次原因,对于智能语音助手企业在当前激烈竞争中保持优势具有重要意义。在“认知-情感-意动”理论框架基础上,构建智能语音助... 探究智能语音助手用户持续使用行为的影响因素及其作用机理,以期揭示智能语音助手用户持续使用行为背后的深层次原因,对于智能语音助手企业在当前激烈竞争中保持优势具有重要意义。在“认知-情感-意动”理论框架基础上,构建智能语音助手用户持续使用意向影响机理模型,通过问卷调查收集400份有效样本数据,采用结构方程模型进行假设检验与实证分析。研究结果表明,实用价值、享乐价值和社会存在正向影响技术信任,感知隐私风险负向影响技术信任,而象征价值对技术信任没有显著影响,技术信任正向影响持续使用意图。 展开更多
关键词 智能语音助手 使用行为影响因素 “认知-情感-意动”理论 技术信任
在线阅读 下载PDF
大数据时代下广电行业音像资料数字化管理路径探究
7
作者 温宇涵 刘杰 +1 位作者 李根 芦梦娇 《信息产业报道》 2025年第3期0092-0094,共3页
文章聚焦大数据时代下,广播电视音像资料数字化管理,深入剖析其主要特点、现状及发展趋势,明确其重要性和研究价值。通过揭示传统模式在管理理念、检索精准度、资源利用和安全性等方面的不足,进而从树立大数据管理观念、建立编目检索子... 文章聚焦大数据时代下,广播电视音像资料数字化管理,深入剖析其主要特点、现状及发展趋势,明确其重要性和研究价值。通过揭示传统模式在管理理念、检索精准度、资源利用和安全性等方面的不足,进而从树立大数据管理观念、建立编目检索子系统、提升利用和服务水平、加强安全管理保护等方面探讨改进策略,提出加强广播电视音像资料数字化管理的有效途径。以期为广电行业数字化发展提供有益参考。 展开更多
关键词 大数据 广播电视 音像资料 数字化
在线阅读 下载PDF
基于SE-ResNet-DBN的声纹识别方法
8
作者 苏俊亮 王峥 +2 位作者 易黎 宋南 刘泽正 《计算机与数字工程》 2025年第6期1658-1662,共5页
针对现有模型方法中话语级的特征过于依赖上下帧的问题,为了提高声纹识别的性能,文中提出通过联合捕捉进行深度提取说话人特征关系进行无文本音频的说话人辨认;采用残差网络结构提取声纹的空间特征,通过对空间特征进行下采样进一步获得... 针对现有模型方法中话语级的特征过于依赖上下帧的问题,为了提高声纹识别的性能,文中提出通过联合捕捉进行深度提取说话人特征关系进行无文本音频的说话人辨认;采用残差网络结构提取声纹的空间特征,通过对空间特征进行下采样进一步获得说话人的高维度特征;利用特征压缩与激励捕获局部空间关系,最后通过深度置信网络对输出特征进行建模,提升声纹识别准确率。实验结果表明,文中所提的声纹识别方法的等错误率相比于现有模型方法降低了0.57%,识别准确率达到了96.36%。 展开更多
关键词 声纹识别 卷积神经网络 残差网络(ResNet) 深度置信网络(DBN)
在线阅读 下载PDF
声纹识别技术在企业安全管理系统中的应用
9
作者 李晴晴 《电声技术》 2025年第7期25-27,共3页
概述声纹识别技术的基本原理,分析企业安全管理系统的构成与发展趋势,重点探讨声纹识别在身份验证、访问控制以及行为审计中的应用,同时深入剖析该技术在企业安全管理系统应用过程中所面临的挑战,并提出相应的优化策略,为其在企业安全... 概述声纹识别技术的基本原理,分析企业安全管理系统的构成与发展趋势,重点探讨声纹识别在身份验证、访问控制以及行为审计中的应用,同时深入剖析该技术在企业安全管理系统应用过程中所面临的挑战,并提出相应的优化策略,为其在企业安全管理领域的创新应用提供参考。 展开更多
关键词 声纹识别 企业安全管理 生物特征识别
在线阅读 下载PDF
基于改进Transformer的端到端说话人确认模型
10
作者 周云龙 陈德富 +2 位作者 刘小湖 桑伊健 周晗昀 《计算机应用》 北大核心 2025年第S1期89-94,共6页
基于自注意力机制的Transformer在大多数自然语言处理(NLP)任务中表现出色,但以往的工作表明,将Transformer应用于说话人确认时竞争力不强,特别是在局部建模能力、轻量级的结构以及实时推理能力上。针对这些问题,从3个方面提出一种改进T... 基于自注意力机制的Transformer在大多数自然语言处理(NLP)任务中表现出色,但以往的工作表明,将Transformer应用于说话人确认时竞争力不强,特别是在局部建模能力、轻量级的结构以及实时推理能力上。针对这些问题,从3个方面提出一种改进Transformer的端到端说话人确认模型DTF-Transformer(Deep Treatment Fusion-Transformer)。首先,使用一种简化的多尺度注意力代替多头注意力,以提升模型的局部建模能力并降低参数量;其次,设计轻量级的前馈网络(FFN),进一步在降低模型参数量的同时加快推理;最后,对于不同深度下的特征应用融合机制提高模型对深层特征的表达与泛化能力。在公共基准数据集VoxCeleb和CN-Celeb上的实验结果表明,相较于流行的ResNet34和ECAPA-TDNN(Emphasized Channel Attention, Propagation and Aggregation in Time Delay Neural Network based speaker verification)结构,DTFTransformer在VoxCeleb1-O和CN-Celeb(E)测试集上的等错误率(EER)分别下降了14%、24%和43%、15%,并且,DTFTransformer在不损失精度的情况更轻量,推理速度较优。 展开更多
关键词 说话人确认 说话人嵌入 TRANSFORMER 自注意力机制 特征融合
在线阅读 下载PDF
采用表示分离自编码器的任意说话人语音转换 被引量:1
11
作者 简志华 章子旭 《通信学报》 EI CSCD 北大核心 2024年第2期162-172,共11页
针对非平行语料库下任意说话人之间的语音转换存在语言内容信息和说话人个性特征难以分离,从而导致语音转换的性能不佳的问题,提出了一种采用表示分离自编码器的语音转换方法RSAE-VC。该方法将语音信号的说话人个性特征视为时不变,而将... 针对非平行语料库下任意说话人之间的语音转换存在语言内容信息和说话人个性特征难以分离,从而导致语音转换的性能不佳的问题,提出了一种采用表示分离自编码器的语音转换方法RSAE-VC。该方法将语音信号的说话人个性特征视为时不变,而将内容信息视为时变,利用编码器中的实例归一化和激活引导层将两者进行分离,再由解码器将源语音的内容信息与目标语音的个性特征进行合成,从而生成转换后的语音。实验结果表明,RSAE-VC在梅尔倒谱距离上比现有的AGAIN-VC转换方法平均降低了3.11%,在基音频率均方根误差上降低了2.41%,MOS分和ABX值分别提升了5.22%和8.45%。RSAE-VC方法通过自内容损失进行约束使语音更好地保留内容信息,通过自说话人损失将说话人个性特征更好地从语音中分离,可以确保说话人个性特征尽少地遗留在内容信息中,从而提高语音转换性能。 展开更多
关键词 语音转换 表示分离 自适应实例归一化 自内容损失 自说话人损失
在线阅读 下载PDF
基于EMD和小波包变换的天气雷达回波去噪方法 被引量:4
12
作者 李静 华夏 +1 位作者 刘佳 丁妍 《自动化技术与应用》 2024年第10期108-111,共4页
C波段多普勒天气雷达回波数据由雷达回波信号和噪声构成,噪声严重影响雷达基本反射率的准确性。利用EMD方法对雷达回波信号进行分解后,将含有噪声的高频IMF分量去除,可实现去噪,但是容易损失有用信号。针对有降水特征的雷达基本反射率数... C波段多普勒天气雷达回波数据由雷达回波信号和噪声构成,噪声严重影响雷达基本反射率的准确性。利用EMD方法对雷达回波信号进行分解后,将含有噪声的高频IMF分量去除,可实现去噪,但是容易损失有用信号。针对有降水特征的雷达基本反射率数据,提出基于EMD和小波包变换的多普勒天气雷达回波去噪方法,并与EMD方法去噪结果进行比较。研究结果表明,该方法能更加有效地去除雷达回波信号中的噪声,并降低了信号特征损失。 展开更多
关键词 EMD 小波包 基本反射率 去噪 信噪比
在线阅读 下载PDF
不同平茬措施下梭梭液流变化及其影响因素
13
作者 黄雅茹 马迎宾 +4 位作者 郝需婷 海鹭 韩春霞 崔健 董雪 《陕西师范大学学报(自然科学版)》 CAS CSCD 北大核心 2024年第5期122-136,共15页
以乌兰布和沙漠东北部不同平茬处理及未平茬梭梭(Haloxylon ammodendron)为研究对象,实时动态监测其液流速率及当地气象因子,研究不同平茬处理梭梭在生长旺盛季(6~8月)不同时间尺度的液流特征及其对气象因子的响应,建立耗水量与气象因... 以乌兰布和沙漠东北部不同平茬处理及未平茬梭梭(Haloxylon ammodendron)为研究对象,实时动态监测其液流速率及当地气象因子,研究不同平茬处理梭梭在生长旺盛季(6~8月)不同时间尺度的液流特征及其对气象因子的响应,建立耗水量与气象因子的拟合模型,揭示梭梭平茬后的水分传输规律。利用热扩散茎流计和自动气象站对乌兰布和沙漠不同平茬处理与未平茬梭梭的液流及太阳辐射、空气温度、相对饱和湿度、水汽压差进行监测。结果表明,不同平茬处理(留茬120 cm、留茬90 cm、留茬60 cm)梭梭晴天液流变化呈“几字宽峰型”曲线,未平茬梭梭呈“单峰型”曲线。雨天,液流速率波动非常剧烈,呈“不规则多峰型”曲线,雨天的液流速率低于晴天。未平茬、留茬120 cm、留茬90 cm、留茬60 cm梭梭的日平均液流速率分别为2.3146、3.3334、1.3333、0.7672 cm/h,日均耗水量分别为8.62、13.43、2.40、2.89 kg/d。小时尺度下,太阳辐射是影响平茬及未平茬梭梭液流速率的主要因子;日尺度下,太阳辐射是影响留茬90 cm及未平茬梭梭液流速率的主要因子,空气温度是影响留茬120 cm梭梭液流速率的主要因子,留茬60 cm梭梭的液流速率主要受风速影响;月尺度下,留茬120 cm梭梭耗水量主要受太阳辐射、空气温度影响,留茬90 cm梭梭耗水量主要受相对湿度、太阳辐射影响,留茬60 cm梭梭耗水量主要受风速影响。随着时间尺度的增加,气象因子入选回归方程的数量呈减小趋势,对液流的解释程度呈降低趋势。该研究的拟合方程均达到显著水平,可在不同时间尺度下预测梭梭蒸腾耗水特征。研究结果对明确梭梭平茬后的水分传输规律具有指导意义。 展开更多
关键词 平茬 茎流 梭梭 乌兰布和沙漠 气象因子
在线阅读 下载PDF
基于特征脸的面部情绪识别研究 被引量:1
14
作者 路金叶 郑方圆 +1 位作者 王隽滔 马宇红 《西北师范大学学报(自然科学版)》 2025年第1期117-124,I0005,共9页
人脸面部情绪通常分为开心、伤心、害怕、厌恶、生气、惊讶和正常7种类别.由于面部光照不均匀、情绪变化细微等原因导致现有的人脸情绪识别算法准确率较低,为此本文建立了一种基于特征脸的人脸情绪识别算法.首先应用Viola-Jones算法精... 人脸面部情绪通常分为开心、伤心、害怕、厌恶、生气、惊讶和正常7种类别.由于面部光照不均匀、情绪变化细微等原因导致现有的人脸情绪识别算法准确率较低,为此本文建立了一种基于特征脸的人脸情绪识别算法.首先应用Viola-Jones算法精准检测和定位面部区域,然后使用Gauss滤波对面部图像降噪后再应用Gamma矫正进行光照均匀化处理,得到精准而清晰的面部图像;其次,应用Haar-like特征对左、右眼睛中心点进行精准定位后,结合人体测量学方法对眉毛、眼睛和嘴巴等情绪器官进行定位与分割,构造特征脸,降低非情绪面部区域的信息冗余;最后,引入经典的Le-Net5卷积神经网络提取特征脸的深层次数字特征进行情绪识别.实验结果表明,该方法可以有效提高人脸面部情绪识别的准确性,在JAFFA公开数据集上的准确率可达90.12%,优于几何特征的53.75%和全脸特征的87.46%,而且性能更为稳定. 展开更多
关键词 情绪识别 面部特征 特征脸 Le-Net5卷积神经网络
在线阅读 下载PDF
基于图表征知识蒸馏的图像分类方法 被引量:4
15
作者 杨传广 陈路明 +2 位作者 赵二虎 安竹林 徐勇军 《电子学报》 EI CAS CSCD 北大核心 2024年第10期3435-3447,共13页
知识蒸馏的核心思想是利用1个作为教师网络的大型模型来指导1个作为学生网络的小型模型,提升学生网络在图像分类任务上的性能.现有知识蒸馏方法通常从单一的输入样本中提取类别概率或特征信息作为知识,并没有对样本间关系进行建模,造成... 知识蒸馏的核心思想是利用1个作为教师网络的大型模型来指导1个作为学生网络的小型模型,提升学生网络在图像分类任务上的性能.现有知识蒸馏方法通常从单一的输入样本中提取类别概率或特征信息作为知识,并没有对样本间关系进行建模,造成网络的表征学习能力下降.为解决此问题,本文引入图卷积神经网络,将输入样本集视为图结点构建关系图,图中的每个样本都可以聚合其他样本信息,提升样本的表征能力.本文从图结点和图关系2个角度构建图表征知识蒸馏误差,利用元学习引导学生网络自适应学习教师网络更佳的图表征,提升学生网络的图建模能力.相比于基线方法,本文提出的图表征知识蒸馏方法在加拿大高等研究院(Canadian Institute For Advanced Research,CIFAR)发布的100种分类数据集上提升了3.70%的分类准确率,表明本文方法引导学生网络学习到了更具有判别性的特征空间,提升了图像分类能力. 展开更多
关键词 知识蒸馏 图卷积神经网络 图像分类 元学习 表征学习
在线阅读 下载PDF
基于通道和帧级特征注意力模型的环境声音识别 被引量:9
16
作者 苏瑞轩 葛动元 姚锡凡 《科学技术与工程》 北大核心 2024年第16期6792-6798,共7页
为了对环境声音进行更好的识别,提出基于通道和帧级特征注意力的环境声音识别卷积神经网络模型。该模型针对声音特征特点选取一维卷积以提高模型对声音特征信息的提取能力,并引入SE-Res2Net模块实现对声音特征细粒度上的全局感受并帮助... 为了对环境声音进行更好的识别,提出基于通道和帧级特征注意力的环境声音识别卷积神经网络模型。该模型针对声音特征特点选取一维卷积以提高模型对声音特征信息的提取能力,并引入SE-Res2Net模块实现对声音特征细粒度上的全局感受并帮助模型关注特征通道间的信息,在全连接层前加入注意力统计池化模块,增强模型对表征不同声音类别的关键帧级特征的学习以提高模型识别性能。采用Urbansound8K数据集,实验结果表明:所提模型在测试集上的训练准确率达到94.5%,即模型可以有效学习声音特征中表征不同环境声音的关键信息并进行正确预测。对消融实验结果分析可得,所提模型的设计可使其分类错误率的下降率达到43.8%,表明模型对一维卷积的应用和各个模块的引入是有效的,可见所提环境声音识别模型性能优越。 展开更多
关键词 声音识别 细粒度 通道加权 帧级特征 注意力统计池化
在线阅读 下载PDF
葡萄VvAGL12基因启动子克隆及表达活性分析 被引量:1
17
作者 姜宁 王雪婷 +4 位作者 王春楠 曲日涛 郭俊娇 张娟 于春燕 《陕西师范大学学报(自然科学版)》 CAS CSCD 北大核心 2024年第5期31-41,共11页
MADS-box家族是植物最大的转录因子家族之一,在参与逆境胁迫与调控开花应答中具有重要作用,其AGL12-like亚组在葡萄中的功能尚不清楚。从黑比诺葡萄基因组克隆获得VvAGL12启动子(proVvAGL12),对启动子序列元件进行分析,发现该启动子区... MADS-box家族是植物最大的转录因子家族之一,在参与逆境胁迫与调控开花应答中具有重要作用,其AGL12-like亚组在葡萄中的功能尚不清楚。从黑比诺葡萄基因组克隆获得VvAGL12启动子(proVvAGL12),对启动子序列元件进行分析,发现该启动子区域存在多种与逆境胁迫相关的顺式作用元件。构建proVvAGL12驱动的GUS表达载体,并在拟南芥和烟草中进行转化,发现proVvAGL12启动子片段在拟南芥中具有启动活性,其驱动GUS在转基因拟南芥植株的叶片、茎段、花器官、根、果荚部位表达,表达活性可持续整个生长周期。转基因拟南芥和烟草胁迫处理实验表明,proVvAGL12驱动的GUS活性受赤霉素、脱落酸、聚乙二醇和低温调控。 展开更多
关键词 葡萄 VvAGL12基因 启动子克隆 GUS活性 非生物胁迫
在线阅读 下载PDF
矩阵数据基于鲁棒主成分分析的距离加权判别分析 被引量:1
18
作者 葛焌迟 赵为华 《计算机应用》 CSCD 北大核心 2024年第7期2073-2079,共7页
距离加权判别(DWD)是一种已被广泛应用的矩阵数据分类模型,当数据中存在严重的噪声污染时,该模型的性能会明显下降。鲁棒主成分分析(RPCA)因具备分离数据矩阵低秩结构和稀疏部分的特性已成为解决该问题的有效手段之一。因此,提出一种矩... 距离加权判别(DWD)是一种已被广泛应用的矩阵数据分类模型,当数据中存在严重的噪声污染时,该模型的性能会明显下降。鲁棒主成分分析(RPCA)因具备分离数据矩阵低秩结构和稀疏部分的特性已成为解决该问题的有效手段之一。因此,提出一种矩阵数据鲁棒距离加权判别(RDWD-2D)模型。特别地,该模型以有监督的方式对数据矩阵进行鲁棒主成分分析,并同步实现干净数据的恢复与分类。在MNIST和COIL20数据集上的实验结果表明,针对有噪声污染或数据缺失的矩阵数据,与DWD-2D、RPCA+DWD等模型相比,RDWD-2D模型有最好的数据恢复能力和最高的分类准确率;同时RDWD-2D模型对于数据污染度也有较好的鲁棒性。 展开更多
关键词 鲁棒分类模型 距离加权判别(DWD) 矩阵数据 主成分分析(PCA)
在线阅读 下载PDF
基于双微麦克风阵列与WideResNet网络的语音命令词识别 被引量:1
19
作者 祁潇潇 曾庆宁 赵学军 《计算机应用与软件》 北大核心 2024年第5期126-130,共5页
为了提高噪声环境下语音识别的稳健性[1],提出宽残差深度神经网络的语音识别算法。该算法结合双微麦克风阵列系统、语音数据集为双微麦克风数据集,使用功率归一化倒谱系数作为特征参数输入到残差网络中进行训练。实验表明,与ResNet15模... 为了提高噪声环境下语音识别的稳健性[1],提出宽残差深度神经网络的语音识别算法。该算法结合双微麦克风阵列系统、语音数据集为双微麦克风数据集,使用功率归一化倒谱系数作为特征参数输入到残差网络中进行训练。实验表明,与ResNet15模型、ResNet18模型相比,只有三个残差模块的宽残差网络在噪声环境下语音命令词的识别和内外部说话人检测任务中具有较高的准确度,均达到了95%以上。 展开更多
关键词 语音识别 宽残差神经网络 功率归一化倒谱系数 双微麦克风阵列
在线阅读 下载PDF
基于轻量级卷积神经网络的车辆声学识别 被引量:4
20
作者 封慧杰 赵红东 +1 位作者 于快快 刘赫 《传感器与微系统》 CSCD 北大核心 2024年第7期136-140,共5页
车型识别技术对交通监测具有重要意义。针对行驶中车辆的视觉信息易受环境干扰等问题,提出了一种基于ShuffleNet V2的车辆声学特征识别模型S-ShuffleNet,包含对ShuffleNet V2网络深度的缩减以及深度可分离卷积(DSC)中卷积(Conv)核大小... 车型识别技术对交通监测具有重要意义。针对行驶中车辆的视觉信息易受环境干扰等问题,提出了一种基于ShuffleNet V2的车辆声学特征识别模型S-ShuffleNet,包含对ShuffleNet V2网络深度的缩减以及深度可分离卷积(DSC)中卷积(Conv)核大小的改进,通过提取车辆声信号的对数—梅尔谱图(LMS)特征作为该模型的输入,进行车型识别。同时,将风、雨、雷暴噪声叠加在车辆音频上,以验证不同环境噪声的影响。实验结果表明:该模型参数量少、训练速度快,在VS10数据集上识别精度比基础网络ShuffleNet V2提高2.4%,识别准确率可达97.5%,与不同分类网络相比,S-ShuffleNet也具有良好性能。 展开更多
关键词 车型识别 声学特征 对数梅尔谱图 轻量级 卷积神经网络 环境噪声
在线阅读 下载PDF
上一页 1 2 82 下一页 到第
使用帮助 返回顶部