期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
Vari-gram language model based on word clustering
1
作者 袁里驰 《Journal of Central South University》 SCIE EI CAS 2012年第4期1057-1062,共6页
Category-based statistic language model is an important method to solve the problem of sparse data.But there are two bottlenecks:1) The problem of word clustering.It is hard to find a suitable clustering method with g... Category-based statistic language model is an important method to solve the problem of sparse data.But there are two bottlenecks:1) The problem of word clustering.It is hard to find a suitable clustering method with good performance and less computation.2) Class-based method always loses the prediction ability to adapt the text in different domains.In order to solve above problems,a definition of word similarity by utilizing mutual information was presented.Based on word similarity,the definition of word set similarity was given.Experiments show that word clustering algorithm based on similarity is better than conventional greedy clustering method in speed and performance,and the perplexity is reduced from 283 to 218.At the same time,an absolute weighted difference method was presented and was used to construct vari-gram language model which has good prediction ability.The perplexity of vari-gram model is reduced from 234.65 to 219.14 on Chinese corpora,and is reduced from 195.56 to 184.25 on English corpora compared with category-based model. 展开更多
关键词 word similarity word clustering statistical language model vari-gram language model
在线阅读 下载PDF
一种新颖的词聚类算法和可变长统计语言模型 被引量:17
2
作者 陈浪舟 黄泰翼 《计算机学报》 EI CSCD 北大核心 1999年第9期942-948,共7页
基于类的统计语言模型是解决统计模型数据稀疏问题的重要方法.但该方法的两个主要瓶颈在于:(1)词的聚类.目前我们很难找到一种比较成熟且运算量适中、收敛效果好的聚类算法.(2)基于类的模型为增强对不同领域语料的适应能力往... 基于类的统计语言模型是解决统计模型数据稀疏问题的重要方法.但该方法的两个主要瓶颈在于:(1)词的聚类.目前我们很难找到一种比较成熟且运算量适中、收敛效果好的聚类算法.(2)基于类的模型为增强对不同领域语料的适应能力往往牺牲了一部分预测能力.该文的工作就是围绕这两个瓶颈问题展开的.在词的聚类方面,作者基于自然语言词与词之间的相似度,提出了一种词的分层聚类算法.实验证明,该算法在算法复杂度和聚类效果上比传统的基于贪婪原则的统计聚类算法都有明显的改进.在提高预测能力方面,提出了一种新的基于类的可变长模型(Vari-gram )的生成方法,用此方法生成的基于类的Vari-gram 模型预测能力远高于通常的基于类的n 元模型. 展开更多
关键词 聚类 统计语言模型 可变长模型 自然语言处理
在线阅读 下载PDF
基于相似度的词聚类算法和可变长语言模型 被引量:7
3
作者 袁里驰 《小型微型计算机系统》 CSCD 北大核心 2009年第5期912-915,共4页
基于类的统计语言模型是解决统计模型数据稀疏问题的重要方法.传统的统计聚类方法基于含婪原则,常以语料的似然函数或困惑度(perplexity)作为评价标准.这种传统的聚类方法的主要缺点是聚类速度慢,初值对结果影响大,易陷入局部最优.本文... 基于类的统计语言模型是解决统计模型数据稀疏问题的重要方法.传统的统计聚类方法基于含婪原则,常以语料的似然函数或困惑度(perplexity)作为评价标准.这种传统的聚类方法的主要缺点是聚类速度慢,初值对结果影响大,易陷入局部最优.本文利用互信息定义一种词相似度,基于相似度,提出一种自下而上的分层聚类算法.实验证明,该算法在计算复杂度和聚类效果上比传统的基于贪婪原则的统计聚类算法都有明显的改进.在提高预测能力方面,提出一种新的基于类的可变长语言模型(Vari-gram)的生成方法. 展开更多
关键词 互信息 词相似度 聚类算法 可变长语言模型
在线阅读 下载PDF
基于时变高阶矩波动模型的VaR与ES度量 被引量:26
4
作者 王鹏 《管理科学学报》 CSSCI 北大核心 2013年第2期33-45,94,共14页
金融波动性建模经历了从常数高阶矩到时变高阶矩的发展历程.文章扩展了现有的针对时变高阶矩波动模型风险测度效果的研究:首先,以沪深300指数和其它世界股市若干重要指数为例,通过采用"从简单模型到复杂模型"的估计步骤,实现... 金融波动性建模经历了从常数高阶矩到时变高阶矩的发展历程.文章扩展了现有的针对时变高阶矩波动模型风险测度效果的研究:首先,以沪深300指数和其它世界股市若干重要指数为例,通过采用"从简单模型到复杂模型"的估计步骤,实现对时变高阶矩波动模型的估计,进而运用Gram-Charlier扩展分布获得对VaR(value-at-risk)和ES(excepted shortfall)两种不同风险测度的计算值;然后,分别利用非条件覆盖检验(unconditional coverage test)和基于自举法(Bootstrap)的后验分析方法,实证对比了时变高阶矩和常数高阶矩两类模型的适用范围和精确程度.研究结果表明:就所考察的若干指数样本而言,时变高阶矩模型不仅能够较好地刻画金融价格波动的整体动力学特征,并且总体来讲,在市场风险测度准确性方面也要优于常数高阶矩波动模型. 展开更多
关键词 时变高阶矩 VAR ES Gram—Charlier扩展分布 后验分析
在线阅读 下载PDF
多元条件高阶矩波动性建模 被引量:24
5
作者 许启发 张世英 《系统工程学报》 CSCD 北大核心 2007年第1期1-8,33,共9页
类似于二阶矩风险(方差风险)的时变性,高阶矩风险也具有时变性.同时,为讨论多个市场或多个金融资产对应高阶矩风险之间的关系,需要建立多元条件高阶矩波动模型.提出了多元GARCHSK模型并给出其向量表达,用独立成分分解技术来解决多元GARC... 类似于二阶矩风险(方差风险)的时变性,高阶矩风险也具有时变性.同时,为讨论多个市场或多个金融资产对应高阶矩风险之间的关系,需要建立多元条件高阶矩波动模型.提出了多元GARCHSK模型并给出其向量表达,用独立成分分解技术来解决多元GARCHSK建模中的“维数灾难”问题,给出多元条件高阶矩波动率的估计方法.最后,利用该模型对我国股市4个主要股指的高阶矩风险进行了动态描述. 展开更多
关键词 高阶矩 多元GARCHSK模型 Gram-Charlier展开 独立成分分解 时变风险
在线阅读 下载PDF
冶金企业内部铁路进路控制优化策略研究 被引量:1
6
作者 张昱 徐洪泽 +1 位作者 陈建强 张鹿宁 《计算机工程与应用》 CSCD 北大核心 2015年第17期250-254,共5页
与传统国家干线铁路相比,冶金企业内部铁路具有路网布局面状分布、多种物资需要运输、运输路径不唯一且对运输时效要求高的特点。针对这些特点,研究了冶金企业内部铁路多列车进路的实时协同优化问题,提出了进路控制优化策略。该策略包... 与传统国家干线铁路相比,冶金企业内部铁路具有路网布局面状分布、多种物资需要运输、运输路径不唯一且对运输时效要求高的特点。针对这些特点,研究了冶金企业内部铁路多列车进路的实时协同优化问题,提出了进路控制优化策略。该策略包含构建时变的铁路路网拓扑结构,提出运输时间最小和运输实时性最好为进路控制评价函数,在动态规划最优决策的基础上实现了多车进路的协同实时优化控制。同时,在自主研制的钢厂计算机联锁系统中对该进路控制优化策略予以构建,运行示例表明,它能直接在冶金企业现有的内部铁路中得以应用并能自动地实现多列车进路的实时协同优化控制,保证物资的高效运输。 展开更多
关键词 冶金企业内部铁路 进路控制 时变路网拓扑结构 动态规划 实时优化 多车协同
在线阅读 下载PDF
高阶矩波动性建模及应用 被引量:35
7
作者 许启发 《数量经济技术经济研究》 CSSCI 北大核心 2006年第12期135-145,共11页
为度量高阶矩风险的动态特征、考察时变高阶矩风险对金融投资决策的影响,本文提出了一个新的高阶矩波动模型NAGARCHSK-M模型。讨论了该模型的包容性,给出了关于高阶矩波动性建模的一整套建模技术,基于正态密度的Gram-Charlier展开给出... 为度量高阶矩风险的动态特征、考察时变高阶矩风险对金融投资决策的影响,本文提出了一个新的高阶矩波动模型NAGARCHSK-M模型。讨论了该模型的包容性,给出了关于高阶矩波动性建模的一整套建模技术,基于正态密度的Gram-Charlier展开给出了模型的参数估计方法。利用该模型对我国股市的高阶矩风险进行了动态描述,并讨论了时变方差风险、时变偏度风险和时变峰度风险对资产收益的影响。 展开更多
关键词 高阶矩 NAGARCHSK-M模型 Gram-Charlier展开 时变风险
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部