期刊文献+
共找到2,810篇文章
< 1 2 141 >
每页显示 20 50 100
LA Sound银乐声 Olympia Speaker S4喇叭线
1
《视听前线》 2026年第1期48-49,共2页
意大利LA Sound的产品线共有4个系列,入门的Deviank迪卡系列及进阶Titan泰坦系列采用银铜合金作为导体,Olympia奥林匹亚以及顶级的Corium真皮“豪华发烧”系列则采用了4N纯银导体。Olympia奥林匹亚是LA Sound成立后推出的首个线材系列,... 意大利LA Sound的产品线共有4个系列,入门的Deviank迪卡系列及进阶Titan泰坦系列采用银铜合金作为导体,Olympia奥林匹亚以及顶级的Corium真皮“豪华发烧”系列则采用了4N纯银导体。Olympia奥林匹亚是LA Sound成立后推出的首个线材系列,也是曾经的旗舰系列。Speaker S4是Olympia奥林匹亚系列中的喇叭线。 展开更多
关键词 speaker S4 4N纯银 OLYMPIA 喇叭线
在线阅读 下载PDF
Fine-scale Phased-array Radar Observations of an EF2 Tornadic Supercell near Mountain Lee
2
作者 Zhaoming LI Lanqiang BAI +1 位作者 Pak Wai CHAN Peiling FU 《Advances in Atmospheric Sciences》 2025年第7期1365-1375,共11页
This study presents finely resolved radar signatures of multiple cyclonic vortices associated with an EF2 tornadic supercell that occurred in Guangzhou on 16 June 2022 and discusses how the mesocyclone formed on the l... This study presents finely resolved radar signatures of multiple cyclonic vortices associated with an EF2 tornadic supercell that occurred in Guangzhou on 16 June 2022 and discusses how the mesocyclone formed on the lee side of mountain.A nearby X-band phased-array radar provides evidence that the mesocyclone was shallow,with a depth generally confined to less than 3 km.The mesocyclonic feature was observed to initiate from near-ground level,driven by the interaction between intensifying cold pool surges and shallow lee-side ambient flows.It was first recognized shortly after the presence of near-ground cyclonic convergence signatures over the leading edges of cold pool outflows.Over the subsequent 17 min,the mesocyclone developed upward,reaching a maximum height of 3 km,and produced a tornado 8min later.Nearly coinciding with the time of tornadogenesis,a noticeable separation of the low-level tornado cyclone from the midlevel mesocyclone was observed.This shift in the vertically oriented vortex tube was likely caused by modifications to the low-level flow due to the complex hilly terrain or by occlusions associated with rear-flank downdrafts.After tornadogenesis,high-resolution X-PAR observations revealed that the lowest-level mesocyclonic signature contracted into a gate-to-gate tornadic vortex signature(TVS)at the tip of hook echoes.Compared to conventional S-band operational weather radars,rapid-scan X-PAR observations indicate that a core diameter threshold of 1.5–2 km could be employed to identify a cyclonically sheared radial velocity couplet as a TVS,potentially extending the lead time for Doppler-based tornado warnings. 展开更多
关键词 phased-array radar MESOCYCLONE TORNADO cold pool outflow topography
在线阅读 下载PDF
Forest Fire Monitoring Analysis Based on X-band Dual-Polarization Phased-Array Radar and Himawari-8 Satellite Remote Sensing
3
作者 WEN Wen ZHANG Yu +3 位作者 LIU Xian-tong ZHAO Wen-hua XIAO Hui XU Bi-yu 《Journal of Tropical Meteorology》 2025年第4期422-433,共12页
To verify the detection capability of X-band dual-polarization phased-array radar for forest fires,this paper utilizes X-band dual-polarization phased-array radar data,Himawari-8 satellite data,combined with ground me... To verify the detection capability of X-band dual-polarization phased-array radar for forest fires,this paper utilizes X-band dual-polarization phased-array radar data,Himawari-8 satellite data,combined with ground meteorological automatic station data.A case study of a forest fire in Ao Feng Mountain on February 19,2021,was conducted to comparatively analyze the monitoring results from these two remote sensing methods.The results show that both methods exhibit significant features associated with the forest fire process observed and are effective modern methods of forest fire monitoring.The Himawari-8 satellite identified the fire point at 07:10(LST;LST=UTC+8)with subsequent observations every 10 minutes until 10:00,nearly two hours before the fire was fully extinguished.Compared with the satellite,the Xband dual polarization phased array radar detectedthe fire 14 minutes earlier,with an improved temporal resolution of one minute,and was not affected by cloud cover.In the triggering stage,vigorous stage,sustained burning stage,and extinguishing stage of the forest fire,radar characteristic factors including reflectivity(Z),differential reflectivity(ZDR),and correlation coefficient(CC)showed strong correlations with the fire progression.The radar monitoring results were continuous,complete,and precise.In summary,the X-band dual-polarization phased-array radar offers more detailed detection information,shorter detection time interval,and higher detection spatial accuracy.It presents a promising new method for forest fire detection,providing crucial guidance for on-site rescue operations,particularly for small-scale fire events. 展开更多
关键词 forest fire monitoring phased-array radar SATELLITE
在线阅读 下载PDF
Fine-Scale Spatiotemporal Characteristics of Warm-Season Severe Convection in 2021 Revealed from X-Band Phased-Array Radar Network Observations in Xiamen,China
4
作者 ZHANG Yu-qing HUANG Yi-peng +3 位作者 HUANG Xin ZHENG Hui SU Zhi-zhong HUANG Qi-nan 《Journal of Tropical Meteorology》 2025年第5期530-544,共15页
In September 2020,a pioneering observational network of three X-band phased-array radars(XPARs)was established in Xiamen,a subtropical coastal and densely populated city in southeastern China.Statistically,this study ... In September 2020,a pioneering observational network of three X-band phased-array radars(XPARs)was established in Xiamen,a subtropical coastal and densely populated city in southeastern China.Statistically,this study demonstrated that the XPAR network outperforms single S-band radar in revealing the warm-season convective storms in Xiamen in a fine-scale manner.The findings revealed that convective activity in Xiamen is most frequent in the central and northern mountainous regions,with lower frequency observed in the southern coastal areas.The diurnal pattern of convection occurrence exhibited a unimodal distribution,with a peak in the afternoon.The frequent occurrence of convective storms correlates well in both time and space with the active terrain uplift that occurs when the prevailing winds encounter mountainous areas.Notably,September stands apart with a bimodal diurnal pattern,featuring a prominent afternoon peak and a significant secondary peak before midnight.Further examination of dense rain gauge data in Xiamen indicates that high-frequency areas of short-duration heavy rainfall largely coincide with regions of active convective storms,except for a unique rainfall hotspot in southern Xiamen,where moderate convection frequency is accompanied by substantial rainfall.This anomalous rainfall,predominantly nocturnal,appears less influenced by terrain uplift and exhibits higher precipitation efficiency than daytime rainfall.These preliminary findings offer insights into the characteristics of convection occurrence in Xiamen's subtropical coastal environment and hold promise for enhancing the accuracy of convection and precipitation forecasts in similar environments. 展开更多
关键词 X-band phased-array radar convective storms radar climatology terrain uplift
在线阅读 下载PDF
Deep Learning-Based Identification of Cracks Using Ultrasonic Phased-Array Images
5
作者 Lijuan Yang Huan Liu +3 位作者 Desheng Wu Zhibo Yang Xuefeng Chen Shaohua Tian 《Acta Mechanica Solida Sinica》 2025年第5期803-814,共12页
In order to realize the automatic recognition and classification of cracks with different depths,in this study,several deep convolutional neural networks including AlexNet,ResNet,and DenseNet were employed to identify... In order to realize the automatic recognition and classification of cracks with different depths,in this study,several deep convolutional neural networks including AlexNet,ResNet,and DenseNet were employed to identify and classify cracks at different depths and in various materials.An analysis process for the automatic classification of crack damage was presented.The image dataset used for model training was obtained from scanning experiments on aluminum and titanium alloy plates using an ultrasonic phased-array flaw detector.All models were trained and validated with the dataset;the proposed models were compared using classification precision and loss values.The results show that the automatic recognition and classification of crack depth can be realized by using the deep learning algorithm to analyze the ultrasonic phased array images,and the classification precision of DenseNet is the highest.The problem that ultrasonic damage identification relies on manual experience is solved. 展开更多
关键词 Crack damage Deep convolutional neural network Ultrasonic phased-array image Automatic crack recognition
原文传递
抒情诗中作为情感交流对象的个人与群体——以中国古典抒情诗为例
6
作者 谭君强 《南都学坛》 2026年第1期48-57,共10页
在抒情诗中,抒情主体即抒情人与其所面对的对象之间的多重交流构成交流的基础,二者相辅相成,缺一不可。抒情人所面对的抒情对象通常可以区分为如下四类:作为交流对象的个人、作为交流对象的群体、作为交流对象的自然万物以及作为交流对... 在抒情诗中,抒情主体即抒情人与其所面对的对象之间的多重交流构成交流的基础,二者相辅相成,缺一不可。抒情人所面对的抒情对象通常可以区分为如下四类:作为交流对象的个人、作为交流对象的群体、作为交流对象的自然万物以及作为交流对象的抒情人自身。诗人透过抒情人向作为个人的特定对象倾诉情感、相互交流,在中国古典抒情诗中占了相当大的比重。而诗人透过抒情人面向某一特定群体,甚或以诗人所归属的特定民族、国家等为对象而倾诉自身的情感,进行情感上的交流,则往往显露出非同一般的意义。抒情人与作为个人或群体的特定对象进行交流,往往与诗人自身存在着更为密切的关联,更为直接地显露出诗人自身的情感,透露出更多的诗人自我体验。在中国古典抒情诗的创作与欣赏中,此类情感交流的状况值得人们的充分关注。 展开更多
关键词 抒情人 情感交流 个人 群体 中国古典抒情诗
在线阅读 下载PDF
基于预训练模型的目标音频处理研究进展
7
作者 刘琚 马豪 +5 位作者 李晓航 李玉楷 司媛 邢志坤 王芷涵 邵明杰 《数据采集与处理》 北大核心 2026年第2期397-415,共19页
目标音频处理旨在根据用户提供的线索从混合信号中恢复或识别特定目标声源,是人机交互、智慧办公及多媒体取证等领域的关键技术。本文对近年来作者团队基于预训练模型的目标音频处理研究进展进行了概述。首先,回顾了目标说话人语音识别... 目标音频处理旨在根据用户提供的线索从混合信号中恢复或识别特定目标声源,是人机交互、智慧办公及多媒体取证等领域的关键技术。本文对近年来作者团队基于预训练模型的目标音频处理研究进展进行了概述。首先,回顾了目标说话人语音识别、语音提取、目标音频提取及音源分离等方向的研究现状,介绍了Whisper、对比学习语言音频预训练(Contrastive language-audio pretraining, CLAP)等预训练模型及参数高效微调技术。针对目标音频提取和目标说话人识别任务综述了作者团队研究的基于对比学习的多模态查询目标音频提取方法、无需配对数据的语言查询目标音频提取方法、基于多任务学习的目标说话人语音提取方法,以及基于提示微调的目标说话人语音识别方法等。这些方法分别在多模态泛化、标注数据依赖、语义保持与参数效率等方面取得了显著进展。最后,对推理效率提升、多模态深度融合、开放域泛化及通用目标音频处理大模型的构建等未来研究方向进行了展望。 展开更多
关键词 目标音频处理 预训练模型 参数高效微调 目标音频提取 目标说话人语音识别 对比学习
在线阅读 下载PDF
Emotional speaker recognition based on prosody transformation 被引量:1
8
作者 宋鹏 赵力 邹采荣 《Journal of Southeast University(English Edition)》 EI CAS 2011年第4期357-360,共4页
A novel emotional speaker recognition system (ESRS) is proposed to compensate for emotion variability. First, the emotion recognition is adopted as a pre-processing part to classify the neutral and emotional speech.... A novel emotional speaker recognition system (ESRS) is proposed to compensate for emotion variability. First, the emotion recognition is adopted as a pre-processing part to classify the neutral and emotional speech. Then, the recognized emotion speech is adjusted by prosody modification. Different methods including Gaussian normalization, the Gaussian mixture model (GMM) and support vector regression (SVR) are adopted to define the mapping rules of F0s between emotional and neutral speech, and the average linear ratio is used for the duration modification. Finally, the modified emotional speech is employed for the speaker recognition. The experimental results show that the proposed ESRS can significantly improve the performance of emotional speaker recognition, and the identification rate (IR) is higher than that of the traditional recognition system. The emotional speech with F0 and duration modifications is closer to the neutral one. 展开更多
关键词 emotion recognition speaker recognition F0 transformation duration modification
在线阅读 下载PDF
智能音箱振动特性分析与试验研究
9
作者 殷奇 于喆昌 +2 位作者 牛军川 赵方旭 邱文杰 《噪声与振动控制》 北大核心 2026年第1期49-55,共7页
智能音箱作为一种集成语音识别和语音交互功能的音频播放设备,深受广大消费者喜爱。人们在设计音箱时重点关注结构设计,对振动特性重视不够,导致在音箱工作过程中可能会产生振音现象,严重影响音质,而音质的表现和音箱本身的振动特性密... 智能音箱作为一种集成语音识别和语音交互功能的音频播放设备,深受广大消费者喜爱。人们在设计音箱时重点关注结构设计,对振动特性重视不够,导致在音箱工作过程中可能会产生振音现象,严重影响音质,而音质的表现和音箱本身的振动特性密切相关。为提高音箱音质,解决可能存在的振音等业内痛点问题,以某智能音箱为研究对象,使用SolidWorks和HyperMesh等软件对音箱模型进行几何清理、模型简化和网格划分,采用多物理场软件COMSOL研究音箱的模态、谐响应等动力学特性。采用DASP系统对音箱开展模态试验研究,并与COMSOL的模态仿真结果进行对比,并对仿真模型进行校正。给出一类音箱振动特性仿真和试验测试的方法,对音箱的动力学设计和优化具有重要参考意义。 展开更多
关键词 声学 音箱 模态分析 模态试验
在线阅读 下载PDF
双图融合驱动下说话人感知增强的多模态会话情感分析
10
作者 董凯 蔡国永 +1 位作者 邓天生 王顺杰 《计算机工程与应用》 北大核心 2026年第5期218-229,共12页
以往的多模态会话情感分析主要侧重于上下文信息建模,但在说话人性格特征的提取,不同说话人之间交互以及互补信息的传递上具有一定的局限性,同时在跨模态融合中未能充分捕获上下文情感线索。针对上述问题,提出了一种双图融合驱动下说话... 以往的多模态会话情感分析主要侧重于上下文信息建模,但在说话人性格特征的提取,不同说话人之间交互以及互补信息的传递上具有一定的局限性,同时在跨模态融合中未能充分捕获上下文情感线索。针对上述问题,提出了一种双图融合驱动下说话人感知增强的方法。通过跨模态注意力机制分层捕获模态内和模态间的上下文情感线索,设计提示模板结合大语言模型提取说话人的性格特征,构建多维度的说话人感知依赖图,包括同一说话人内部依赖图和不同说话人之间的交互依赖图,并与性格特征融合后,利用图注意力传递话语之间的依赖信息,通过交互模块实现不同感知依赖图之间的信息交换与融合,并引入交互损失以增强图间的敏感度。在两个公开的多模态数据集上进行广泛实验,实验结果充分证明了该方法的有效性。 展开更多
关键词 多模态会话情感分析 说话人感知 大语言模型(LLM) 双图融合
在线阅读 下载PDF
智能音响旋钮延时顶出注塑模优化设计
11
作者 祁钰 张维合 +2 位作者 黄基幸 庄雨乐 李若楠 《现代塑料加工应用》 北大核心 2026年第1期36-40,共5页
针对音响旋钮结构特点和成型过程中存在的问题,对成型模具进行优化设计。模具每腔采用12个斜滑块,向外呈辐射状360°侧向抽芯,解决了塑件整个外圆周面24处倒扣的脱模难题。模具采用杠杆式延时脱模机构,解决了成型塑件刚度差,脱模时... 针对音响旋钮结构特点和成型过程中存在的问题,对成型模具进行优化设计。模具每腔采用12个斜滑块,向外呈辐射状360°侧向抽芯,解决了塑件整个外圆周面24处倒扣的脱模难题。模具采用杠杆式延时脱模机构,解决了成型塑件刚度差,脱模时易变形变白的问题。模具定模采用“推销+弹簧”机构,消除了斜滑块和成型塑件被定模型芯拉出的故障;合模时推销将斜滑块提前推回复位,防止定模型芯和斜滑块在分型面上摩擦磨损而使成型塑件产生飞边的缺陷。模具结构先进实用,投产后运行安全可靠,成型塑件各项指标均达到设计要求。 展开更多
关键词 音响旋钮 注塑模具 360°侧向抽芯 杠杆式延时脱模机构 推销
在线阅读 下载PDF
基于潮涌卷积神经网络的说话人确认
12
作者 陈晨 仪志鑫 +1 位作者 李东源 陈德运 《电子与信息学报》 北大核心 2026年第2期806-817,共12页
近年来,最先进的说话人确认模型大多数以牺牲参数量和计算量的代价来实现感受野的固定获取,然而鉴于语音信号内部蕴含着丰富且多层次的信息,通过高度自主选择的动态感受野来描绘复杂信息是相对未被探索的,更没有直观地解释是什么构成了... 近年来,最先进的说话人确认模型大多数以牺牲参数量和计算量的代价来实现感受野的固定获取,然而鉴于语音信号内部蕴含着丰富且多层次的信息,通过高度自主选择的动态感受野来描绘复杂信息是相对未被探索的,更没有直观地解释是什么构成了关于有效感受野的最佳实践。潮涌现象表现为潮水前端形成陡立水墙并伴随轰鸣声高速推进,受其非线性耦合行为的启发,该文提出潮涌卷积(TR-Conv)“使用潮涌感受野(T-RRF),获得更有效感受野”。首先采用二幂插值操作构建窗口内的主/从感受野,随后分别采用扫描-池化机制聚焦提取窗口外的关键信息、算子机制精细感知窗口内的差异信息,最后融合三重感受野,得到兼具多尺度、动态性、有效性的可变感受野。为全面验证潮涌卷积的表现,该文建立潮涌卷积神经网络(TR-CNN)。另外,针对数据集的错误标签问题,提出动态归一化的非目标(NTDN)损失与具有两个子中心的加性角边距(Sub-Center AAM)损失变体加权融合的总损失,以提升模型性能。实验结果表明,与ECAPA-TDNN(C=512)相比,TR-CNN(C=512, n=1)分别在测试集Vox1-O, Vox1-E, Vox1-H上的等错误率(EER)以及最小检测代价函数(MinDCF)相对降低了4.95%,4.03%和6.03%以及31.55%, 17.14%和17.42%,参数量和乘加累积操作次数相对减少了32.7%,23.5%。进一步,TR-CNN(C=1 024, n=1)的EER/MinDCF分别是0.85%/0.076 2/1.10%/0.104 8/2.05%/0.173 9。本研究代码已开源:https://www.scidb.cn/detail?dataSetId=a232c98b082941c58002958208ef3f43&version=V1&code=j00173。 展开更多
关键词 说话人确认 潮涌卷积 轻量化网络 二幂插值 动态归一化的非目标损失
在线阅读 下载PDF
XBMU-AMDO31:藏语安多方言语音识别数据集
13
作者 谢晨宇 李冠宇 +2 位作者 马立克 孙倩 郭玉豪 《中国科学数据(中英文网络版)》 2026年第1期43-53,共11页
近年来,尽管语音识别技术在高资源语种(如英语、汉语)中取得显著进展,但针对藏语等低资源复杂音系语种的研究进展仍然缓慢。安多藏语作为低资源复杂音系语言,其语音识别面临数据稀缺与可用数据集质量和多样性不足的双重挑战。由于缺乏... 近年来,尽管语音识别技术在高资源语种(如英语、汉语)中取得显著进展,但针对藏语等低资源复杂音系语种的研究进展仍然缓慢。安多藏语作为低资源复杂音系语言,其语音识别面临数据稀缺与可用数据集质量和多样性不足的双重挑战。由于缺乏公开的数据集,相关研究面临着诸多限制。为此,本文构建并介绍了一个开源的藏语安多方言语音识别数据集。语音样本最初采集于中国甘肃省夏河地区,共收录了66位以藏语为母语者共31小时录音以及相应的转录文本,后续经过人工质检与标准化处理,确保了方言纯正性的以及数据的质量和一致性。本语音数据集的所有资源均已开放,目前已在多篇藏语语音识别相关论文或研究中被使用,得到业内专家的一致好评,更证明了数据集的质量。本数据集为藏语安多方言的高质量语音数据提供了重要补充,其复杂音系特性为跨语种迁移学习、小样本语音技术研究提供独特样本支持。 展开更多
关键词 语音识别 安多藏语数据集 多说话人 低资源
在线阅读 下载PDF
XBMU-bo-Lhasa31:藏语拉萨话语音识别数据集
14
作者 马立克 李冠宇 +2 位作者 谢晨宇 孙倩 郭玉豪 《中国科学数据(中英文网络版)》 2026年第1期31-42,共12页
藏语语音识别在藏语教育、新闻传播等领域具有重要应用价值。藏语拉萨话广泛使用于拉萨市及周边地区,由于地域等因素的影响,当前可用的藏语语音数据资源匮乏,高质量标注数据稀缺。为此,本研究构建了一个专业规范的藏语拉萨话语音识别数... 藏语语音识别在藏语教育、新闻传播等领域具有重要应用价值。藏语拉萨话广泛使用于拉萨市及周边地区,由于地域等因素的影响,当前可用的藏语语音数据资源匮乏,高质量标注数据稀缺。为此,本研究构建了一个专业规范的藏语拉萨话语音识别数据集。数据集使用自制录音软件实地录制,采集自51位说话人,总时长31.61小时,包含24,289条语音样本,平均每条时长4.68秒。数据内容主要选自新闻领域文本,确保语言规范性和领域代表性。为保障数据质量,实施了严格的质量控制流程:首先,对原始文本进行分句处理和人工校验;其次,在录音完成后,采用语音端点检测(VAD)技术筛选优质录音样本;最后,对文本中的非发音符号进行规范化处理,以提高语音识别的准确性。本数据集的建立为藏语语音识别研究提供了重要基础资源,对推动藏语语音识别技术发展具有积极意义。 展开更多
关键词 语音识别 藏语拉萨话 多说话人 语音语料库
在线阅读 下载PDF
语音伪造检测的技术进展与挑战综述
15
作者 唐文洁 更太加 魏建国 《现代信息科技》 2026年第3期183-189,共7页
语音作为一种自然、便捷的交互方式,已广泛应用于诸多领域。语音伪造检测(Speech Spoofing Detection)技术已成为保证语音验证和识别系统安全性的关键技术。随着文本到语音(TTS)合成、语音转换(VC)和深度伪造技术(Deepfake)的迅猛发展,... 语音作为一种自然、便捷的交互方式,已广泛应用于诸多领域。语音伪造检测(Speech Spoofing Detection)技术已成为保证语音验证和识别系统安全性的关键技术。随着文本到语音(TTS)合成、语音转换(VC)和深度伪造技术(Deepfake)的迅猛发展,伪造语音的生成质量和复杂性大幅提高,给语音伪造检测带来了严峻挑战。文章系统回顾了语音伪造检测领域的技术进展,涵盖了基于声学特征、深度学习的主流方法。首先,讨论了语音伪造的主要类型,包括重放攻击、TTS生成语音和VC伪造语音。其次,分析了当前主要检测模型及性能指标。最后,探讨了现有方法的局限性,并提出未来研究中亟待解决的关键问题。通过对语音伪造检测技术的全面分析,为该领域的研究提供了新的思路。 展开更多
关键词 自动说话人验证 伪造攻击 语音伪造检测 欺骗对策
在线阅读 下载PDF
新型多媒体交互智能音箱
16
作者 林江山 柯春艳 +1 位作者 赵梦茹 孟小艳 《微型电脑应用》 2026年第1期22-25,29,共5页
为了进一步满足人们对智能音箱功能的多样化需求,提升智能音箱的智能化水平,针对传统智能音箱在多轮对话能力、功能、应用场景单一等方面的不足,提出一款基于人工智能技术、以树莓派为硬件平台的多媒体智能音箱系统。所提出的系统利用Ch... 为了进一步满足人们对智能音箱功能的多样化需求,提升智能音箱的智能化水平,针对传统智能音箱在多轮对话能力、功能、应用场景单一等方面的不足,提出一款基于人工智能技术、以树莓派为硬件平台的多媒体智能音箱系统。所提出的系统利用ChatGPT 3.5语言模型、Transformer和SpeechRecognition技术提供更灵活、更丰富的语音交互服务,同时,使用传感器、信息队列遥测传输(MQTT)协议等物联网技术,通过对输入语音信号的分析、处理,进而执行不同的功能模块。所提出的系统实现了智能对话、智能家居控制、多媒体信息交互等功能。测试结果表明所提出的系统具备出色的性能和功能,不仅可以应用于日常生活和娱乐,还能够帮助提升工作效率。 展开更多
关键词 智能家居 智能音箱 嵌入式系统 物联网 人工智能 多媒体交互
在线阅读 下载PDF
基于多粒度特征融合模型的多说话人声纹识别研究
17
作者 李娅 周斌 胡波 《中南民族大学学报(自然科学版)》 2026年第1期77-85,共9页
声纹识别是一种通过比对语音中的说话人特征来确认身份的技术.其流程包括从不定长的单人语音片段中提取声学特征,再由模型提取说话人特征,最后通过余弦相似度判断是否为同一说话人.多说话人声纹识别则需从包含多位说话人的音频中识别各... 声纹识别是一种通过比对语音中的说话人特征来确认身份的技术.其流程包括从不定长的单人语音片段中提取声学特征,再由模型提取说话人特征,最后通过余弦相似度判断是否为同一说话人.多说话人声纹识别则需从包含多位说话人的音频中识别各自身份,该任务的关键在于提取具判别力的说话人特征.为此提出了多粒度特征融合模型(MGFF-TDNN),在MGFF-TDNN中,首先使用二维深度可分离卷积模块(DSM)作为前端特征提取器,以增强时频域特征的建模.其次,为了实现多粒度特征融合,设计了多粒度融合结构(M-TDNN),采用时延神经网络和音素级特征池化来捕获不同粒度的信息.在VoxCeleb数据集上的实验表明:MGFF-TDNN模型在使用了更少的参数量(4.78M)和计算资源(1.49G的浮点计算量)的情况下,仍表现出良好的性能. 展开更多
关键词 声纹识别 多说话人 多粒度特征融合 深度可分离卷积
在线阅读 下载PDF
In the Age of ‘World Englishes’,Native Speaker Teachers or Non-native Speaker Teachers?
18
作者 吴娟 《海外英语》 2016年第9期226-228,共3页
This paper attempts to argue that in the age of‘World Englishes', it is not necessary to differentiate native speaker teachers from non-native speaker teachers. It is concluded that non-native speaker teachers ca... This paper attempts to argue that in the age of‘World Englishes', it is not necessary to differentiate native speaker teachers from non-native speaker teachers. It is concluded that non-native speaker teachers can be as effective as their native colleagues and they have equal chance to achieve professional success, even though native speaker teachers have great advantages over non-native teachers in some aspects. It is time for employers, as well as ELT professionals to shut their eyes to the glaring differences between native speaker teachers and non-native speaker teachers and optimize such unique resources. 展开更多
关键词 world Englishes NATIVE speaker TEACHER NON-NATIVE speaker TEACHER ENGLISH TEACHER
在线阅读 下载PDF
Native Speaker and L2 User in Language Teaching
19
作者 张可科 《海外英语》 2012年第5X期61-63,共3页
The target of much language teaching and learning is to make students approximate to native speakers.The only rightful speak ers of a language are its native speakers.Contrary to these contemporary views,however,this ... The target of much language teaching and learning is to make students approximate to native speakers.The only rightful speak ers of a language are its native speakers.Contrary to these contemporary views,however,this paper argues that the obligation of the lan guage teacher is to help students to use L2 effectively not to simply imitate native speaker.A successful L2 user who comes from the group of L2 learners can be a model for students.Therefore,non-native teachers with a high degree of language proficiency and good teaching skills can be ideal and qualified language teachers. 展开更多
关键词 LANGUAGE teaching NATIVE speaker L2 USER non-nativ
在线阅读 下载PDF
语音深度伪造溯源技术研究现状及展望
20
作者 张雄伟 张强 +3 位作者 孙蒙 杨吉斌 李毅豪 葛晓义 《数据采集与处理》 北大核心 2026年第2期347-370,共24页
随着生成式人工智能技术的快速发展,语音深度伪造技术日益精进,其生成的语音在听感上已难辨真假,给信息安全、司法取证和社会互信带来严峻挑战。传统的语音伪造检测重点在于解决语音“真/假”的二元分类问题。然而,在复杂的安全对抗与... 随着生成式人工智能技术的快速发展,语音深度伪造技术日益精进,其生成的语音在听感上已难辨真假,给信息安全、司法取证和社会互信带来严峻挑战。传统的语音伪造检测重点在于解决语音“真/假”的二元分类问题。然而,在复杂的安全对抗与取证场景中,仅判定语音的真或假已无法满足追根溯源、厘清责任的需求。本文聚焦“语音伪造溯源”这一前沿课题,系统综述了国内外当前的研究进展。首先,构建了一个层级化的语音伪造溯源任务体系,明确界定了伪造方法溯源、源说话人溯源和模型逆向这3个子任务的内涵。然后,从生成模型的基本原理、语音信号的声学特性等角度,阐述了各子任务可行的核心机理;区分体系架构、训练策略等不同维度,系统地梳理了各子任务的研究现状、主流方法及技术演进路径。最后,总结了当前研究面临的开放世界溯源、复杂信道条件下溯源等关键挑战,展望了面向语音深度伪造反制的主动溯源等未来的发展方向,旨在为构建更完善的语音安全防御体系提供参考。 展开更多
关键词 语音深度伪造 语音伪造方法溯源 源说话人溯源 模型逆向 开放集识别
在线阅读 下载PDF
上一页 1 2 141 下一页 到第
使用帮助 返回顶部