期刊文献+
共找到430篇文章
< 1 2 22 >
每页显示 20 50 100
基于Speech SDK的语音控制应用程序的设计与实现 被引量:40
1
作者 李禹材 左友东 +1 位作者 郑秀清 王玲 《计算机应用》 CSCD 北大核心 2004年第6期114-116,共3页
分析了微软SpeechSDK5.1里语音应用程序接口(SAPI)的结构和工作原理,提出了语音控制应用程序的设计方法,并以"Z+Z智能教学平台的语音识别接口"的设计为例,展示了这类系统的主框架和关键技术。
关键词 语音识别 COM SAPI 语音控制
在线阅读 下载PDF
基于Speech SDK的机器人语音交互系统设计 被引量:8
2
作者 陈景帅 周风余 《北京联合大学学报》 CAS 2010年第1期25-29,共5页
介绍了一种基于Microsoft Speech SDK5.1的机器人语音交互系统,利用Speech SDK5.1提供的应用程序编程接口SAPI进行语音识别,对识别结果在逻辑程序中处理,使用Inter-phonic5.0语音合成技术替代TTS技术来合成语音,实现了AHRR-I接待机器人... 介绍了一种基于Microsoft Speech SDK5.1的机器人语音交互系统,利用Speech SDK5.1提供的应用程序编程接口SAPI进行语音识别,对识别结果在逻辑程序中处理,使用Inter-phonic5.0语音合成技术替代TTS技术来合成语音,实现了AHRR-I接待机器人的语音对话和语音控制。 展开更多
关键词 接待机器人 speech SDK 语音识别 语音控制 SAPI
在线阅读 下载PDF
Speech SDK在语音机器人开发中的应用 被引量:6
3
作者 初琦 《北京工业职业技术学院学报》 2008年第4期32-36,共5页
首先表述了语音识别在机器人控制系统中的作用,然后重点介绍如何开发Source Access Point Iden-tifier语音识别软件系统,并实现对机器人的语音命令控制和简单的人机对话,对设计具有语音识别功能的智能机器人具有参考意义。
关键词 语音机器人 语音识别 SAPI 机器人控制系统 SDK
在线阅读 下载PDF
基于Speech SDK的语音识别技术在三维仿真中的应用 被引量:5
4
作者 林鸣霄 《计算机技术与发展》 2011年第11期160-162,166,共4页
随着三维仿真技术的不断发展,简单的人机交互方式已经不能满足人们对仿真环境真实感和沉浸感的要求。针对于此,提出了将基于Speech SDK5.1的语音识别技术应用到三维仿真平台的构想,分析了Speech SDK5.1的工作原理,着重研究了其语音识别... 随着三维仿真技术的不断发展,简单的人机交互方式已经不能满足人们对仿真环境真实感和沉浸感的要求。针对于此,提出了将基于Speech SDK5.1的语音识别技术应用到三维仿真平台的构想,分析了Speech SDK5.1的工作原理,着重研究了其语音识别接口,对将语音识别应用到三维仿真程序中的可能性和关键技术进行了研究。提出了一种实现动态词汇识别的方法,并通过一个简单的实例展示了实现这类技术的框架和方法,对设计有语音识别功能的三维仿真程序有一定的参考价值。 展开更多
关键词 语音识别 三维仿真 speech SDK COM 语音控制
在线阅读 下载PDF
基于Speech SDK的船舶机械损伤案例查询软件开发
5
作者 刘江 汪士丰 徐善林 《机电设备》 2011年第3期42-44,共3页
在分析Microsoft Speech SDK中英文引擎的基础上,在Visual Basic中实现了船舶机损案例的查询,并通过语音读出.
关键词 speech SDK 语音控制 船舶机损
在线阅读 下载PDF
基于EfficientNetV2-RetNet的端到端中文管制语音识别 被引量:2
6
作者 梁海军 常瀚文 +2 位作者 何一民 赵志伟 孔建国 《电讯技术》 北大核心 2025年第2期254-260,共7页
自动语音识别(Automatic Speech Recognition, ASR)技术在空中交通管制(Air Traffic Control, ATC)领域的应用有望提高通信效率、减少人为错误、提升安全性,并促进航空交通管理系统的创新和改进。然而,由于ATC通信通常涉及敏感信息,获... 自动语音识别(Automatic Speech Recognition, ASR)技术在空中交通管制(Air Traffic Control, ATC)领域的应用有望提高通信效率、减少人为错误、提升安全性,并促进航空交通管理系统的创新和改进。然而,由于ATC通信通常涉及敏感信息,获取大量带有标签的ATC语音数据较为困难,这给构建高准确度的ASR系统带来了巨大挑战。基于Retentive Network(RetNet)和迁移学习设计了一种新的端到端ASR框架EfficientNetV2-RetNet-CTC,用于ATC系统。EfficientNetV2的多层卷积结构有助于对语音信号提取更复杂的特征表示。RetNet使用多尺度保持机制学习序列数据上的全局时间动态,可以非常高效地处理长距离依赖性。连接时序分类不用强制对齐标签且标签可变长。此外,迁移学习通过在源任务上学习的知识来改善在目标任务上的性能,解决了民航领域数据资源稀缺的问题且提高了模型的泛化能力。实验结果表明,所设计的模型优于其他基线,在Aishell语料库上预训练的最低词错误率为7.6%和8.7%,在ATC语料库上降至5.6%和6.8%。 展开更多
关键词 空中交通管制 自动语音识别 端到端深度学习 迁移学习
在线阅读 下载PDF
Semantics Interaction Control for Constructing Intelligent Ecology of Internet of Things and Critical Component Research
7
作者 Haijun Zhang Yinghui Chen 《Journal of Computer and Communications》 2018年第11期23-42,共20页
Intelligent equipment is a kind of device that is characterized by intelligent sensor interconnections, big data processing, new types of displays, human-machine interaction and so on for the new generation of informa... Intelligent equipment is a kind of device that is characterized by intelligent sensor interconnections, big data processing, new types of displays, human-machine interaction and so on for the new generation of information technology. For this purpose, in this paper, first, we present a type of novel intelligent deep hybrid neural network algorithm based on a deep bidirectional recurrent neural network integrated with a deep backward propagation neural network. It has realized acoustic analysis, speech recognition and natural language understanding for jointly constituting human-machine voice interactions. Second, we design a voice control motherboard using an embedded chip from the ARM series as the core, and the onboard components include ZigBee, RFID, WIFI, GPRS, a RS232 serial port, USB interfaces and so on. Third, we take advantage of algorithms, software and hardware to make machines “understand” human speech and “think” and “comprehend” human intentions to structure critical components for intelligent vehicles, intelligent offices, intelligent service robots, intelligent industries and so on, which furthers the structure of the intelligent ecology of the Internet of Things. At last, the experimental results denote that the study of the semantics interaction controls based on an embedding has a very good effect, fast speed and high accuracy, consequently realizing the intelligent ecology construction of the Internet of Things. 展开更多
关键词 DEEP Hybrid NEURAL Networks DEEP Bidirectional RECURSIVE NEURAL Network speech Recognition Semantic control Embedded Internet of THINGS INTELLIGENT ECOLOGY Construction
在线阅读 下载PDF
基于语音特征的管制员疲劳识别
8
作者 杨昌其 张雨萱 《科学技术与工程》 北大核心 2025年第29期12732-12738,共7页
空中交通管制员在执行管制任务中全程采用陆空通话标准用语与机组进行交流,通过对管制员陆空通话语音进行疲劳检测,可以有效地评估管制员的疲劳状态,减小飞行安全风险。鉴于管制员疲劳状态难以实时标记且存在主观性的问题,提出了基于无... 空中交通管制员在执行管制任务中全程采用陆空通话标准用语与机组进行交流,通过对管制员陆空通话语音进行疲劳检测,可以有效地评估管制员的疲劳状态,减小飞行安全风险。鉴于管制员疲劳状态难以实时标记且存在主观性的问题,提出了基于无监督学习的管制员疲劳状态识别模型。首先,利用管制员模拟机语音数据探究疲劳状态在语音特征中的呈现情况,通过标准化处理和特征递归消除交叉验证方法(recursive feature elimination cross validation,REFCV)从62维GeMAPS语音特征中筛选出8个具有较强疲劳识别能力的特征,并对比在疲劳状态和正常状态下的特征值大小。其次,利用所筛选特征对管制员疲劳状态进行有监督分类,识别准确率达到82.87%,证明了所筛选特征的疲劳识别能力。最后,将管制语音数据进行聚类,根据特征趋势分析聚类簇分布,重新划分疲劳状态,并对聚类效果进行了验证,得到98.78%的疲劳状态检测准确率。研究成果为后续运用真实工作场景下的管制语音数据进行疲劳状态研究提供了理论基础和实验支撑。 展开更多
关键词 管制员疲劳 语音特征 特征筛选 有监督学习 无监督学习
在线阅读 下载PDF
空中交通管制员疲劳检测方法研究进展
9
作者 杨昌其 张雨萱 《舰船电子工程》 2025年第3期138-143,共6页
空中交通流量的增加使得管制员工作负荷也在逐渐增大,鉴于管制员与飞行安全的紧密联系,对其疲劳状态的准确检测有着至关重要的作用。文章回顾了我国近年来在管制疲劳领域的研究现状,梳理了现阶段常用的疲劳状态检测方法。首先,对主观检... 空中交通流量的增加使得管制员工作负荷也在逐渐增大,鉴于管制员与飞行安全的紧密联系,对其疲劳状态的准确检测有着至关重要的作用。文章回顾了我国近年来在管制疲劳领域的研究现状,梳理了现阶段常用的疲劳状态检测方法。首先,对主观检测方法和客观检测方法进行了阐释和对比,分析得出基于语音的疲劳检测方法更适合用于对管制员工作疲劳的检测;其次,鉴于基于语音的检测方法对管制官疲劳检测的重要性,对管制员基于语音的疲劳检测方法进行了着重介绍,包括不同语音特征的提取方法以及在特征构造和选择方面的研究进展和关键问题,分析了不同识别方法在提升语音识别检测率方面的能力,得出对陆空通话语音的检测能较好地检测管制员疲劳状态,并对语音疲劳识别在航空领域的应用潜力和展望进行了简要介绍;最后展望了管制员疲劳检测方法。为后续对管制员的疲劳状态检测研究提供借鉴和参考。 展开更多
关键词 航空运输管理 管制员疲劳 检测方法 语音分析
在线阅读 下载PDF
功能性构音障碍儿童的喉部轮替运动能力特征研究 被引量:1
10
作者 黄天翊 王晓雨 +2 位作者 赵纹笙 KIM Hakyung 刘恒鑫 《听力学及言语疾病杂志》 北大核心 2025年第4期316-319,共4页
目的探讨功能性构音障碍(functional articulation disorder,FAD)儿童不同语料下的喉部轮替运动能力特征。方法对上海市普通幼儿园4~6岁的FAD儿童23例和典型发育(typical developing,TD)儿童21例,采集五类声学参数:喉部轮替运动(larynge... 目的探讨功能性构音障碍(functional articulation disorder,FAD)儿童不同语料下的喉部轮替运动能力特征。方法对上海市普通幼儿园4~6岁的FAD儿童23例和典型发育(typical developing,TD)儿童21例,采集五类声学参数:喉部轮替运动(laryngeal diadochokinesis,LDDK)(/?a/、/ha/、/?Λ/、/hΛ/)的平均速率和规律性值jitter,口腔轮替运动速率(/pataka/),元音/a/的jitter、shimmer,以及最长声时(MPT)。比较不同语料下两组受试者间的LDDK差异。结果①不同类型儿童比较:FAD儿童的/a/的速率显著低于TD儿童(P<0.05);②不同语料比较:两组儿童中/?a/-/ha/LDDK速率均存在显著差异,TD儿童中/?a/-/?Λ/LDDK速率存在显著差异,FAD儿童中/ha/-/hΛ/LDDK速率存在显著差异;FAD儿童中/ha/-/hΛ/LDDK规律性存在显著差异。结论功能性构音障碍儿童的喉部轮替运动能力较典型发育儿童弱,两组儿童不同语料下的运动能力也不尽相同。 展开更多
关键词 功能性构音障碍 喉部轮替运动 言语运动控制
暂未订购
语音识别技术在智能家居控制系统中的应用 被引量:1
11
作者 李超 《电声技术》 2025年第6期49-51,共3页
概述语音识别技术的原理,分析智能家居控制系统的组成与特点,并讨论语音识别在语音控制、语音反馈、个性化服务中的应用。同时,阐述语音识别技术在智能家居控制系统应用过程中所面临的挑战,并提出相应的优化策略,为语音识别技术在智能... 概述语音识别技术的原理,分析智能家居控制系统的组成与特点,并讨论语音识别在语音控制、语音反馈、个性化服务中的应用。同时,阐述语音识别技术在智能家居控制系统应用过程中所面临的挑战,并提出相应的优化策略,为语音识别技术在智能家居领域中的应用提供理论依据和实践指导。 展开更多
关键词 语音识别 智能家居 控制系统 人机交互
在线阅读 下载PDF
基于单片机的电子物料管理柜系统的设计
12
作者 蓝国财 方渝馨 +3 位作者 闭传琦 李国怿 郑帮旨 李海生 《山西电子技术》 2025年第2期49-52,共4页
在电子信息时代背景下,针对高校关于电子元器件遇到的管理瓶颈设计出一款针对高校的电子元器件智能管理平台开发与应用系统。以兆易创新的GD32F450ZGT6作为核心,结合人机交互系统,利用一个16路PWM信号发生器控制多个舵机进行货柜弹出;... 在电子信息时代背景下,针对高校关于电子元器件遇到的管理瓶颈设计出一款针对高校的电子元器件智能管理平台开发与应用系统。以兆易创新的GD32F450ZGT6作为核心,结合人机交互系统,利用一个16路PWM信号发生器控制多个舵机进行货柜弹出;通过芯片内部FLASH保存货柜里的物料信息实现掉电存储;通过触摸屏、语音识别、手机控制等实现多种人机交互方式。对比其它传统元器件管理方式,本设计更为安全可靠,并具有稳定性更高、实用性更好等优势[1]。 展开更多
关键词 电子物料柜 语音识别 手机控制 电路设计
在线阅读 下载PDF
基于单片机的自然语言交互智能轮椅系统的设计
13
作者 陈春弘 张双双 +2 位作者 杨心愉 周柠 林可 《现代信息科技》 2025年第15期27-31,37,共6页
针对人口老龄化及残障人士的出行问题,结合现代AI技术的发展,提出了一种基于单片机的自然语言交互智能轮椅系统设计方案。该智能轮椅旨在降低老年人和残障人士的出行难度,采用大小双系统设计:大系统通过霍尔摇杆、手机APP和语音识别三... 针对人口老龄化及残障人士的出行问题,结合现代AI技术的发展,提出了一种基于单片机的自然语言交互智能轮椅系统设计方案。该智能轮椅旨在降低老年人和残障人士的出行难度,采用大小双系统设计:大系统通过霍尔摇杆、手机APP和语音识别三种方式实现对轮椅的控制,并可监测体温、心率和血氧;小系统运用物联网技术调用AI,同时将人体数据上传至移动端。该项目将智能轮椅与单片机、AI交互相结合,增设多种适用于老年人和残障人士的功能,以进一步方便其出行。该设计的智能轮椅系统将为老年人和残障人士的生活带来更大便利。 展开更多
关键词 智能轮椅 单片机 人工智能 语音识别 控制系统
在线阅读 下载PDF
GRI-TTS:离散情感控制下的语音合成情感表达优化
14
作者 胡泊 罗辉 《佳木斯大学学报(自然科学版)》 2025年第6期30-33,共4页
近期的文本到语音(TTS)模型能够利用简短的语音提示克隆未见过的说话人,它们借助强大的上下文学习能力模仿语音提示,包括说话人风格、韵律和情感。然而,由于TTS模型手动或随机选择语音提示,现有语音合成模型在多样化风格和韵律变化上存... 近期的文本到语音(TTS)模型能够利用简短的语音提示克隆未见过的说话人,它们借助强大的上下文学习能力模仿语音提示,包括说话人风格、韵律和情感。然而,由于TTS模型手动或随机选择语音提示,现有语音合成模型在多样化风格和韵律变化上存在不足。针对以上问题提出了一种离散情感控制语音合成方法GRI-TTS,在基础模型上引入情感编码器以高效提取情感特征,并设计条件流匹配解码器以精确控制合成语音的情感表达。该方法实现了对语音合成的离散情感控制,有效提升了语音合成的情感多样性和自然度,为语音合成技术在情感表达领域的应用提供了新的思路。 展开更多
关键词 文本到语音 离散情感控制 情感编码器
在线阅读 下载PDF
基于多模态交互的农机智能座舱控制系统设计
15
作者 毛宇杰 陈锦霞 李晨希 《汽车实用技术》 2025年第21期26-30,共5页
针对中小农户智能化农机普及率低、传统交互系统适应性不足的问题,文章开发了面向复杂田间场景的多模态智能交互系统。融合抗噪声语音识别、毫米波雷达手势控制及防眩光触控技术,构建语音主导、手势辅助与触屏微调的协同交互体系,解决... 针对中小农户智能化农机普及率低、传统交互系统适应性不足的问题,文章开发了面向复杂田间场景的多模态智能交互系统。融合抗噪声语音识别、毫米波雷达手势控制及防眩光触控技术,构建语音主导、手势辅助与触屏微调的协同交互体系,解决传统系统操作复杂、误触率高和环境适应性差的问题。文章创新性地引入汽车电子控制器局域网(CAN)总线架构,实现多模态数据高效融合与跨层调度,提升指令传输可靠性。基于模块化分层架构集成多源传感器,通过动态优先级仲裁算法实现交互模式自适应切换。系统在作物倒伏、强噪声等场景中表现出优越的稳定性,显著提升人机协作效率,为中小农业智能化转型提供技术范式。研究成果对推动农机交互标准化及智能装备普惠化具有重要实践价值。 展开更多
关键词 多模态交互 智能农机 语音识别 手势控制
在线阅读 下载PDF
基于多特征检测的啸叫抑制方法
16
作者 周跃兵 徐焕芬 +1 位作者 赵曜 陈俊彬 《电声技术》 2025年第10期49-56,共8页
啸叫干扰是语音通信系统中普遍存在的问题,常由扬声器与传声器之间的声反馈引发,严重影响语音质量与系统稳定性。针对传统方法在频率漂移、多频啸叫及实时性能方面的局限,提出一种融合多维特征检测与动态Notch滤波控制的啸叫抑制方法。... 啸叫干扰是语音通信系统中普遍存在的问题,常由扬声器与传声器之间的声反馈引发,严重影响语音质量与系统稳定性。针对传统方法在频率漂移、多频啸叫及实时性能方面的局限,提出一种融合多维特征检测与动态Notch滤波控制的啸叫抑制方法。该方法利用均方根(Root Mean Square,RMS)能量趋势、频谱峰值结构、谐波分布及频率稳定性等多特征构建复合检测模型,能够有效区分啸叫、人声与短时冲击信号。在频率定位方面,设计频谱插值细化算法,提高了中心频率估计精度。在滤波控制方面,引入动态响应与自动释放机制,实现Notch滤波器的自适应调节。实验结果表明,该方法在多种典型啸叫场景下均表现出良好的抑制性能与语音保真度,具有较强的实时性与工程可用性。 展开更多
关键词 啸叫抑制 频谱细化 动态滤波控制 多维特征检测 语音信号处理
在线阅读 下载PDF
基于英文语音识别的无人机检测水稻研究
17
作者 李梦莹 《北方水稻》 2025年第1期38-43,共6页
随着无人机技术的广泛应用,水稻检测领域的实际需求不断提高,因此研究引入英文语音识别模块,来建立先进的无人机控制结构和检测技术。首先分析无人机的检测设备和航行控制方法,结合配套设备对其检测技术提供较好的基础。其次对英文语音... 随着无人机技术的广泛应用,水稻检测领域的实际需求不断提高,因此研究引入英文语音识别模块,来建立先进的无人机控制结构和检测技术。首先分析无人机的检测设备和航行控制方法,结合配套设备对其检测技术提供较好的基础。其次对英文语音识别处理技术进行分析,以嵌入无人机控制系统从而实现英文语音控制无人机作业。最后对英文语音识别的无人机进行水稻检测,得出环境噪声为40 dB时,英文指令识别的精度为93.5%,识别效率为38 ms。水稻病害程度和生理参数的相关高达0.81,综合以上结果表明基于英文语音识别的无人机在水稻检测的先进性,并为国际田间作业提供技术参考。 展开更多
关键词 英文语音识别 无人机 航行控制 水稻检测 病害程度
在线阅读 下载PDF
基于Scratch的高能效人工智能语言教学系统构建
18
作者 祝带君 张伟明 《自动化与仪器仪表》 2025年第2期266-269,274,共5页
针对传统中文语言教学方法存在智能化水平低,导致教学效果不佳的问题,提出构建一个基于Scratch的高能效人工智能语言教学系统。首先,采用树莓派3b+控制模块作为系统硬件主控芯片;然后利用Scratch编程平台和对应插件设计一个语音智能点灯... 针对传统中文语言教学方法存在智能化水平低,导致教学效果不佳的问题,提出构建一个基于Scratch的高能效人工智能语言教学系统。首先,采用树莓派3b+控制模块作为系统硬件主控芯片;然后利用Scratch编程平台和对应插件设计一个语音智能点灯;最后在语音识别模块中构建一个基于GMM-HMM的声学模型,通过其实现各种语音命令的准确识别。实验结果表明,本系统对两段中文语音文段识别的词错误率WER仅为15.06%,传统的Bi LSTM-CTC的词错误率WER取值为36.71%,本系统高出了21.65%。由此说明,本系统对中文语音文段的识别精度更高,满足中文语言教学智能化需求,中文语言教学效果和趣味性显著提升。 展开更多
关键词 Scratch编程 STM32控制 GMM-HMM 教学系统 语音识别
原文传递
汽车语控智能电器系统 被引量:6
19
作者 张新丰 林凯 +2 位作者 刘旺 杨殿阁 连小珉 《汽车工程》 EI CSCD 北大核心 2007年第7期601-605,共5页
提出一种语音控制汽车智能电器系统的总体结构框架,包括语音识别和驾驶员意图识别的运算平台及汽车智能电器系统。在车载环境下,利用规范模式和有限状态机理论对驾驶员的自然语言进行分析,达到意图识别和语音控制的目的。引入抗干扰设... 提出一种语音控制汽车智能电器系统的总体结构框架,包括语音识别和驾驶员意图识别的运算平台及汽车智能电器系统。在车载环境下,利用规范模式和有限状态机理论对驾驶员的自然语言进行分析,达到意图识别和语音控制的目的。引入抗干扰设计方法后系统对驾驶员意图识别的正确率有明显提高。最后通过试验系统验证了利用驾驶员语言进行汽车电器控制的可行性。 展开更多
关键词 语音控制 自动语音识别 驾驶员意图识别 智能电器系统
在线阅读 下载PDF
语音识别技术在机器人控制中的应用 被引量:10
20
作者 王雪松 田西兰 王炜强 《仪器仪表学报》 EI CAS CSCD 北大核心 2006年第z1期768-770,共3页
研究语音识别技术在机器人控制系统中的应用及实现。分析以线性预测倒谱系数为特征矢量的模板匹配法语音识别原理,并利用VC++6.0和微软语音开发包Speech SDK设计出语音识别接口,提高了语音程序的开发效率,实现了对AS-R型移动机器人的语... 研究语音识别技术在机器人控制系统中的应用及实现。分析以线性预测倒谱系数为特征矢量的模板匹配法语音识别原理,并利用VC++6.0和微软语音开发包Speech SDK设计出语音识别接口,提高了语音程序的开发效率,实现了对AS-R型移动机器人的语音控制。 展开更多
关键词 语音识别 模板匹配 机器人控制 speech SDK
在线阅读 下载PDF
上一页 1 2 22 下一页 到第
使用帮助 返回顶部