期刊文献+
共找到243篇文章
< 1 2 13 >
每页显示 20 50 100
Blind recognition of polar code parameters based on log-likelihood ratio
1
作者 ZHONG Zhaogen XIE Cunxiang JIN Kun 《Journal of Systems Engineering and Electronics》 2025年第3期642-658,共17页
The syndrome a posteriori probability of the log-likelihood ratio of intercepted codewords is used to develop an algorithm that recognizes the polar code length and generator matrix of the underlying polar code.Based ... The syndrome a posteriori probability of the log-likelihood ratio of intercepted codewords is used to develop an algorithm that recognizes the polar code length and generator matrix of the underlying polar code.Based on the encoding structure,three theorems are proved,two related to the relationship between the length and rate of the polar code,and one related to the relationship between frozen-bit positions,information-bit positions,and codewords.With these three theorems,polar codes can be quickly reconstruced.In addition,to detect the dual vectors of codewords,the statistical characteristics of the log-likelihood ratio are analyzed,and then the information-and frozen-bit positions are distinguished based on the minimumerror decision criterion.The bit rate is obtained.The correctness of the theorems and effectiveness of the proposed algorithm are validated through simulations.The proposed algorithm exhibits robustness to noise and a reasonable computational complexity. 展开更多
关键词 code length frozen-bit position information-bit position log-likelihood ratio polar code
在线阅读 下载PDF
融合Log-Likelihood与TextRank的关键词抽取研究 被引量:2
2
作者 徐晓霖 《软件导刊》 2018年第3期87-89,共3页
为了解决TextRank算法的初始值赋权问题,提高关键词抽取准确率,引入Log-Likelihood算法。通过与参考语料库词频进行对比,为词条的初始权重赋值,将不需要外部语料的TextRank和需要外部语料的Log-Likelihood进行融合、计算。实验结果表明... 为了解决TextRank算法的初始值赋权问题,提高关键词抽取准确率,引入Log-Likelihood算法。通过与参考语料库词频进行对比,为词条的初始权重赋值,将不需要外部语料的TextRank和需要外部语料的Log-Likelihood进行融合、计算。实验结果表明,融合后的TextRank-LL算法优于TextRank算法。 展开更多
关键词 抽取 TextRank算法 log-likelihood算法 TextRank-LL算法 图模型
在线阅读 下载PDF
Speaker Verification Based on Log-Likelihood Score Normalization
3
作者 Wei Cao Chunyan Liang Shuxin Cao 《Journal of Computer and Communications》 2020年第11期80-87,共8页
Due to differences in the distribution of scores for different trials, the performance of a speaker verification system will be seriously diminished if raw scores are directly used for detection with a unified thresho... Due to differences in the distribution of scores for different trials, the performance of a speaker verification system will be seriously diminished if raw scores are directly used for detection with a unified threshold value. As such, the scores must be normalized. To tackle the shortcomings of score normalization methods, we propose a speaker verification system based on log-likelihood normalization (LLN). Without a priori knowledge, LLN increases the separation between scores of target and non-target speaker models, so as to improve score aliasing of “same-speaker” and “different-speaker” trials corresponding to the same test speech, enabling better discrimination and decision capability. The experiment shows that LLN is an effective method of scoring normalization. 展开更多
关键词 Speaker Verification Score Normalization log-likelihood Normalization Zero Normalization Test Normalization
在线阅读 下载PDF
Weight sequential log-likelihood ratio detect algorithm with malicious users removing 被引量:4
4
作者 ZHAO Jun-hui LI Fei YANG Tao 《The Journal of China Universities of Posts and Telecommunications》 EI CSCD 2013年第2期60-65,共6页
Due to the openness of the cognitive radio network, spectrum sensing data falsification (SSDF) can attack the spectrum sensing easily, while there is no effective algorithm proposed in current research work, so this... Due to the openness of the cognitive radio network, spectrum sensing data falsification (SSDF) can attack the spectrum sensing easily, while there is no effective algorithm proposed in current research work, so this paper introduces the malicious users removing to the weight sequential probability radio test (WSPRT). The terminals' weight is weighted by the accuracy of their spectrum sensing information, which can also be used to detect the malicious user. If one terminal owns a low weight, it can be treated as malicious user, and should be removed from the aggregation center. Simulation results show that the improved WSPRT can achieve higher performance compared with the other two conventional sequential detection methods under different number of malicious users. 展开更多
关键词 cognitive radio cooperative spectrum sensing data falsification attack weight sequential log-likelihood ratio detect
原文传递
基于Log-Median方法的协方差矩阵估计方法及应用
5
作者 吴雪柔 赵寿为 《统计与决策》 北大核心 2026年第3期59-65,共7页
在数据分析和统计建模研究中,协方差矩阵估计的精确性至关重要。然而,传统的估计方法在面对数据模型的异常值干扰或分布偏斜时,估计结果往往不够精确。为此,文章提出了一种新的协方差矩阵估计方法——Log-Median方法。该方法首先构建协... 在数据分析和统计建模研究中,协方差矩阵估计的精确性至关重要。然而,传统的估计方法在面对数据模型的异常值干扰或分布偏斜时,估计结果往往不够精确。为此,文章提出了一种新的协方差矩阵估计方法——Log-Median方法。该方法首先构建协方差矩阵的负对数似然函数;其次,结合线性回归模型对特征值中位数进行估计;最后,通过引入惩罚项将协方差矩阵估计中的异常特征值正则化至特征值中位数,实现了对协方差矩阵的稳健估计。6个数据模型的仿真模拟以及针对股票数据和分类数据的实证分析结果均表明,Log-Median方法在各种数据环境下均表现出优越的性能,提高了协方差矩阵估计结果的准确性和稳健性。 展开更多
关键词 协方差矩阵估计 负对数似然函数 特征值中位数 惩罚项
原文传递
南京江北新区内涝风险评估与管控策略研究
6
作者 叶根苗 卢婉莹 曹悦然 《山西建筑》 2026年第5期94-99,共6页
为应对南京江北新区日益严峻的城市内涝形势,提升城市生命线安全韧性,对江北新区177.1 km^(2)范围内的城市内涝安全风险进行了系统评估。构建了包含“可能性-后果性”两大维度并引入动态修正系数的评估模型。采用层次分析法(AHP)确定了... 为应对南京江北新区日益严峻的城市内涝形势,提升城市生命线安全韧性,对江北新区177.1 km^(2)范围内的城市内涝安全风险进行了系统评估。构建了包含“可能性-后果性”两大维度并引入动态修正系数的评估模型。采用层次分析法(AHP)确定了各级评估指标的权重,并结合地理信息系统(GIS)空间分析技术,对54个评估单元进行了精细化评价。结果表明,江北新区内涝风险在空间上呈现出核心区与老旧建成区风险等级相对较高的特征,共识别出7个较大风险(Ⅲ级)评估单元。根据评估结果,从工程措施、管理机制、应急响应和智慧化建设等方面提出了针对性的管控策略。该研究为江北新区制定科学的内涝防治规划和“一点一策”的精准治理方案提供了决策支持,对保障城市安全运行具有重要意义。 展开更多
关键词 南京江北新区 城市内涝 风险评估 可能性-后果性模型
在线阅读 下载PDF
地震动预测模型评价研究——以2023年2月6日土耳其地震为例 被引量:1
7
作者 张博涵 王宏伟 +1 位作者 任叶飞 温瑞智 《震灾防御技术》 北大核心 2025年第1期77-85,共9页
地震动预测模型(GMM)是利用强震动记录拟合的具有一定物理意义的函数关系式,可表征强震动参数随震级、距离、场地等因素变化规律,是预估强震动参数的有效工具。以2023年2月6日土耳其连续发生的M_(W)7.8、M_(W)7.5地震为例,选用断层距200... 地震动预测模型(GMM)是利用强震动记录拟合的具有一定物理意义的函数关系式,可表征强震动参数随震级、距离、场地等因素变化规律,是预估强震动参数的有效工具。以2023年2月6日土耳其连续发生的M_(W)7.8、M_(W)7.5地震为例,选用断层距200 km以内的自由场强震动记录,对比观测值与9个GMM预测值的差异,应用似然函数法和对数似然函数法对GMM进行选择、排序和加权,得到适用于该地区大震的加权预测模型,并对该预测模型的适用性进行验证。研究结果表明,适用于土耳其地区或者包括土耳其的更大区域地震的GMM预测效果较好,验证了GMM具有区域性差异;似然函数法和对数似然函数法对于GMM的选择与排序结果具有一致性;加权预测模型较好地预测了PGA随距离的衰减规律,并且对2次地震短周期反应谱的预测精确性更高;加权预测模型显著降低了2次地震事件间残差的离散性,预测结果更加稳定,说明加权预测模型提供了整体最优的预测结果,预测模型加权方案合理有效。 展开更多
关键词 地震动预测模型 土耳其地震 似然函数法 对数似然函数法
在线阅读 下载PDF
面向极化编码慢跳频的干扰状态迭代估计及译码算法
8
作者 高露琴 吴晓富 +1 位作者 张索非 胡海峰 《电讯技术》 北大核心 2025年第1期103-110,共8页
考虑将循环冗余校验级联极化(Cyclic Redundancy Check Assisted Polar,CA-Polar)码应用于受部分频带干扰的慢跳频通信场景,针对每跳干扰状态未知的挑战,提出了一种基于CA-Polar码软输出解码的迭代干扰状态估计方法。该方法基于广义似然... 考虑将循环冗余校验级联极化(Cyclic Redundancy Check Assisted Polar,CA-Polar)码应用于受部分频带干扰的慢跳频通信场景,针对每跳干扰状态未知的挑战,提出了一种基于CA-Polar码软输出解码的迭代干扰状态估计方法。该方法基于广义似然比(Generalize Ratio Test,GRT)来启动部分频带干扰下的极化解码,然后通过每次迭代译码的可靠度信息来不断提高每一跳干扰状态估计的准确性,基于干扰状态估计更新接收信号的对数似然比(Log-Likelihood Ratio,LLR)并用于CA-Polar码的新一轮迭代译码。仿真结果表明,采用(1024,256+CRC-16)CA-Polar码在块错误率(Block Error Rate,BLER)为1×10^(-4)时,所提出的迭代处理相比于无迭代处理的性能有效提升近2.4 dB;相比于1/2码率的(648,324)LDPC码,同等码率的(512,256+CRC-8)CA-Polar码在相同跳频抗干扰场景下以及BLER为1×10^(-4)时性能增益近0.2 dB。 展开更多
关键词 极化码 慢跳频 脉冲噪声 软输出译码 对数似然比计算
在线阅读 下载PDF
求解多模概率分布Gamma混合模型的半EM算法
9
作者 陈佳琪 何玉林 +1 位作者 成英超 黄哲学 《计算机应用》 北大核心 2025年第7期2153-2161,共9页
期望最大化(EM)算法在混合模型参数估计中发挥着重要作用,然而现有的EM算法在求解Gamma混合模型(GaMM)参数时存在局限性,主要体现在因近似计算导致的低质量参数估计,以及由于大量数值计算造成的计算效率低下问题。为了克服这些局限,并... 期望最大化(EM)算法在混合模型参数估计中发挥着重要作用,然而现有的EM算法在求解Gamma混合模型(GaMM)参数时存在局限性,主要体现在因近似计算导致的低质量参数估计,以及由于大量数值计算造成的计算效率低下问题。为了克服这些局限,并充分利用数据的多模性质,提出一种半EM(Semi-EM)算法求解用于估计多模概率分布的GaMM。首先,通过聚类探测数据的空间分布特性,以初始化GaMM参数,进而更准确地刻画数据的多模性;其次,在EM算法框架的基础上,对于缺乏封闭更新表达式而导致的参数更新困难问题,采用自定义的启发式策略对GaMM形状参数进行更新,使它们朝着最大化对数似然值的方向逐步调整,同时以封闭形式更新其他参数。经过一系列具有说服力的实验,验证了Semi-EM算法的可行性、合理性和有效性。实验结果表明,Semi-EM算法在精确估计多模概率分布方面优于对比的4种算法,具有更低的误差指标以及更高的对数似然值,表明该算法能提供更准确的模型参数估计,从而更精确地刻画数据的多模性质。 展开更多
关键词 多模概率密度函数 Gamma混合模型 期望最大化算法 聚类 对数似然函数
在线阅读 下载PDF
基于特征融合和流模型的无监督设备异常声音检测 被引量:1
10
作者 王亚威 张巧灵 《电子科技》 2025年第11期87-95,共9页
流模型可以学习复杂的数据分布并实现精确的似然估计,在无监督异常声音检测(Anomaly Sound Detection,ASD)中具有良好的应用前景。针对现有基于流模型的异常声检测方法仅提取声音信号的单一特征,无法充分利用信号有效信息的问题,文中提... 流模型可以学习复杂的数据分布并实现精确的似然估计,在无监督异常声音检测(Anomaly Sound Detection,ASD)中具有良好的应用前景。针对现有基于流模型的异常声检测方法仅提取声音信号的单一特征,无法充分利用信号有效信息的问题,文中提出一种基于特征融合和流模型的无监督异常声音检测方法。与传统方法相比,所提方法除了使用log-Mel谱图特征,还融合了基于一维卷积神经网络TgramNet提取的时域谱图特征,以实现二者信息的互补。采用基于流的非线性独立分量估计(Nonlinear Independent Components Estimation,NICE)模型学习融合特征的数据分布,并最终以负对数似然作为异常分数评估目标声音状态。文中使用DCASE2020 TASK 2提供的异常声音检测数据集对模型性能进行评估,结果表明所提方法的AUC(Area Under the Receiver Operating Characteristic Curve)和pAUC(partial AUC)分别达到85.09%和75.27%,较多种无监督方法具有显著提升。 展开更多
关键词 异常声音检测 深度学习 无监督 特征提取 特征融合 非线性独立分量估计 流模型 负对数似然
在线阅读 下载PDF
基于局部纹理统计模型的纹理图像检索 被引量:1
11
作者 张春雨 蔡蕾 +1 位作者 李斌 王琪 《公路交通科技》 CAS CSCD 北大核心 2008年第11期114-118,共5页
提出了局部纹理统计模型与改进的Log-likelihood统计相结合的纹理图像检索方法。首先设计了3种不同角度分辨率和空间分辨率的"Uniform"模式的局部二值模式,并且用其来提取图像特征,然后建立图像局部二值模式和局部方差的联合... 提出了局部纹理统计模型与改进的Log-likelihood统计相结合的纹理图像检索方法。首先设计了3种不同角度分辨率和空间分辨率的"Uniform"模式的局部二值模式,并且用其来提取图像特征,然后建立图像局部二值模式和局部方差的联合统计模型,最后用改进的Log-likelihood统计进行图像检索。提出的基于局部纹理统计模型的纹理图像检索算法具有旋转不变性,克服了LBP算法对旋转比较敏感的缺点。通过对Brodatz图像库中50类600幅纹理图像进行仿真试验,新算法能得到89.71%的平均查准率,与基于Gabor小波+WMV组合算法相比,新提出算法的查准率提高了19.05%。 展开更多
关键词 智能运输系统 纹理图像检索 局部纹理统计模型 局部二值模式 log-likelihood统计 GABOR小波变换
在线阅读 下载PDF
一种利用软判决的信道编码识别新算法 被引量:67
12
作者 于沛东 李静 彭华 《电子学报》 EI CAS CSCD 北大核心 2013年第2期301-306,共6页
现有的信道编码识别方法通常利用解调输出的硬判决序列来进行,其容错能力有待提高.本文针对低信噪比的接收信号,提出了一种利用软判决的编码识别新算法.该算法基于含错方程模型,以方程成立的概率作为衡量解向量性能的量度,从而求解方程... 现有的信道编码识别方法通常利用解调输出的硬判决序列来进行,其容错能力有待提高.本文针对低信噪比的接收信号,提出了一种利用软判决的编码识别新算法.该算法基于含错方程模型,以方程成立的概率作为衡量解向量性能的量度,从而求解方程,完成识别.对数似然比(LLR)代数的使用使得算法具有简单的形式.仿真实验表明,与基于Walsh-Hadamard变换的传统算法相比,新算法提高了识别性能,且信噪比越低,性能提高越显著. 展开更多
关键词 信道编码识别 软判决 低信噪比 对数似然比(LLR) Walsh-Hadamard变换
在线阅读 下载PDF
鲁棒的基于改进Mean-shift的目标跟踪 被引量:25
13
作者 薛陈 朱明 陈爱华 《光学精密工程》 EI CAS CSCD 北大核心 2010年第1期234-239,共6页
为了克服传统Mean-shift算法在跟踪运动目标时由于背景像素造成的定位偏差和由于遮挡造成的跟踪失效,提出了相应的改进措施。其一,根据初始帧目标和背景在颜色分布上的差异,建立对数似然图(log-likelihood image),筛选出目标中与背景可... 为了克服传统Mean-shift算法在跟踪运动目标时由于背景像素造成的定位偏差和由于遮挡造成的跟踪失效,提出了相应的改进措施。其一,根据初始帧目标和背景在颜色分布上的差异,建立对数似然图(log-likelihood image),筛选出目标中与背景可区分性好的颜色特征建立目标模型,并以同样的方法在后续帧建立候选模型,从而有效地减小背景像素的影响。另外,将候选区域划分为若干重叠的子块,分别利用Mean-shift算法对各个子块进行迭代,以与目标区域相应子块最为匹配的子块的所在位置对整个目标重新定位,由此很好地实现了目标部分遮挡情况下的稳定跟踪。当目标被严重遮挡时,则采用简单的线性预测,估计下一帧目标可能出现的位置。实验结果表明:提出的改进算法可以准确地进行目标跟踪,对部分遮挡和严重遮挡都有较强的鲁棒性。 展开更多
关键词 目标跟踪 MEAN-SHIFT 对数似然图 遮挡
在线阅读 下载PDF
肺部孤立性占位CT灌注与常规和计算机辅助诊断分析 被引量:21
14
作者 顾艳 周胜利 +1 位作者 袁刚 黄连庆 《临床放射学杂志》 CSCD 北大核心 2013年第7期963-967,共5页
目的探讨应用计算机辅助诊断(CAD)、常规形态学诊断和CT灌注对鉴别肺部孤立性占位良恶性的诊断价值。方法选择同时行CT平扫和CT灌注,并经临床和手术病理证实的肺部孤立性占位100例,首先将形态学征象进行分类统计分析,运用CAD中的最大似... 目的探讨应用计算机辅助诊断(CAD)、常规形态学诊断和CT灌注对鉴别肺部孤立性占位良恶性的诊断价值。方法选择同时行CT平扫和CT灌注,并经临床和手术病理证实的肺部孤立性占位100例,首先将形态学征象进行分类统计分析,运用CAD中的最大似然判别法,将其各种征象转化为计分值,以分值的大小来判定肺结节所属的类型;然后分析良恶性占位CT灌注参数,评价灌注参数的诊断试验效能,并将CAD、常规形态学诊断和CT灌注的诊断正确率进行比较。结果 CAD对肺内孤立性占位的诊断正确率(总符合率)为80%,高于常规形态学诊断正确率(77%),但两组间差异无统计学意义(P=0.606);最能提示为恶性肿瘤的征象依次为空泡征、深分叶征、胸膜凹陷征、棘突征、血管集束征和毛刺征。最能提示为良性占位的征象为钙化。CT灌注对肺内孤立性占位的诊断正确率达91%,明显高于CAD和常规形态学诊断,并具有统计学意义(P值分别为0.027和0.007)。结论 CAD对肺内孤立性占位的鉴别诊断正确率与常规形态学诊断法相当,可用于指导日常阅片工作,并可以弥补低年资医师经验的不足;CT肺灌注成像技术能准确地反映肿块内部血管特征,稳定性好,较CAD正确率更高。 展开更多
关键词 肺癌 肺部孤立性占位 计算机辅助诊断 最大似然法 体层摄影术 X线计算机
原文传递
非高斯噪声下基于U-粒子滤波器和似然比的非线性系统故障诊断 被引量:7
15
作者 葛哲学 杨拥民 +1 位作者 胡政 陈仲生 《机械工程学报》 EI CAS CSCD 北大核心 2007年第10期27-31,共5页
针对普通粒子滤波器在非线性系统随机系统故障诊断中的'退化'现象和估计精度的不足,进而影响诊断准确率的问题,提出应用U-粒子滤波器(Unscented particle filter,UPF)进行改进的方法。在建立正常/异常UPF滤波器模型的基础上,推... 针对普通粒子滤波器在非线性系统随机系统故障诊断中的'退化'现象和估计精度的不足,进而影响诊断准确率的问题,提出应用U-粒子滤波器(Unscented particle filter,UPF)进行改进的方法。在建立正常/异常UPF滤波器模型的基础上,推导基于UPF的似然概率密度函数和似然比(Log likelihood ratio,LLR)计算方法,构造故障的检测律和诊断律,并给出完整的故障诊断算法,不仅能准确预报故障发生的时刻,而且可以诊断出故障的类型。最后在某直升机非线性舵回路上进行了试验验证,结果证明了该方法的有效性和优越性。 展开更多
关键词 U-粒子滤波器 似然比 故障诊断 非线性 非高斯
在线阅读 下载PDF
基于最小二乘代价函数的卷积码盲识别方法 被引量:14
16
作者 于沛东 彭华 +1 位作者 巩克现 陈泽亮 《电子学报》 EI CAS CSCD 北大核心 2018年第7期1545-1552,共8页
卷积码的盲识别是级联码、Turbo码等高性能编码盲识别的基础,这要求卷积码盲识别方法具有较高的抗噪能力.使用接收解调的软判决信息是提高抗噪能力的关键.本文首先通过理论分析,从概率分布的角度解释现有软判决方法抗噪能力不足的原因,... 卷积码的盲识别是级联码、Turbo码等高性能编码盲识别的基础,这要求卷积码盲识别方法具有较高的抗噪能力.使用接收解调的软判决信息是提高抗噪能力的关键.本文首先通过理论分析,从概率分布的角度解释现有软判决方法抗噪能力不足的原因,即汉明重量较小的候选解向量会严重削弱现有方法的识别正确概率.然后,提出一种基于最小二乘代价函数的解决方案,理论证明它能够有效减轻汉明重量对识别性能的影响.最后,通过仿真实验,对理论分析的结论进行验证.理论和实验表明,所提的新方法能将卷积码盲识别的抗噪能力提升约1d B. 展开更多
关键词 编码盲识别 卷积码 Walsh-Hadamard变换 对数似然比(LLR) 最小二乘
在线阅读 下载PDF
对数似然图像分割的快速主动轮廓跟踪算法 被引量:7
17
作者 杨华 陈善静 +1 位作者 曾凯 张红 《强激光与粒子束》 EI CAS CSCD 北大核心 2012年第2期321-326,共6页
针对跟踪目标尺度变化问题,提出了基于灰度对数似然图像分割的快速主动轮廓跟踪算法。改进的主动轮廓跟踪算法将根据以目标与背景的颜色差异而建立的对数似然图对图像进行阈值分割和数学形态学处理,再将Kalman滤波器结合到主动轮廓跟踪... 针对跟踪目标尺度变化问题,提出了基于灰度对数似然图像分割的快速主动轮廓跟踪算法。改进的主动轮廓跟踪算法将根据以目标与背景的颜色差异而建立的对数似然图对图像进行阈值分割和数学形态学处理,再将Kalman滤波器结合到主动轮廓跟踪算法进行目标跟踪。改进的主动轮廓跟踪算法对目标分割准确,轮廓特征显著,跟踪效果稳定,算法能很好地适应跟踪目标尺度变化。通过Kalman滤波器对目标位置点的预测减少了主动轮廓跟踪算法收敛的迭代次数,使算法的运算效率提高了33%左右。 展开更多
关键词 对数似然图 KALMAN滤波 主动轮廓跟踪 目标跟踪
在线阅读 下载PDF
一种基于折线逼近的对数似然比简化算法 被引量:12
18
作者 闫涛 茹乐 杜兴民 《电子与信息学报》 EI CSCD 北大核心 2008年第8期1832-1835,共4页
针对16QAM信号的对数似然比计算,该文提出一种新颖的折线逼近简化算法,采用分段的折线逼近16QAM信号的对数似然比曲线,进而使用简单的线性运算替代原标准LLR算法中复杂的非线性运算,仿真结果表明,该算法可以理想地逼近标准LLR算法的计... 针对16QAM信号的对数似然比计算,该文提出一种新颖的折线逼近简化算法,采用分段的折线逼近16QAM信号的对数似然比曲线,进而使用简单的线性运算替代原标准LLR算法中复杂的非线性运算,仿真结果表明,该算法可以理想地逼近标准LLR算法的计算结果,在BITCM系统中应用不会带来系统的性能折损。 展开更多
关键词 16QAM 对数似然比算法 折线逼近 BITCM
在线阅读 下载PDF
面向机器辅助翻译的汉语语块自动抽取研究 被引量:12
19
作者 姜柄圭 张秦龙 +1 位作者 谌贻荣 常宝宝 《中文信息学报》 CSCD 北大核心 2007年第1期9-16,共8页
本文提出了一种统计和规则相结合的语块抽取方法。本文使用Nagao串频统计算法进行基于词语的串频统计,进一步分别利用统计方法、语块边界过滤规则对2-gram到10-gram语块进行过滤,得到候选语块,取得了令人满意的结果。通过实验发现,在统... 本文提出了一种统计和规则相结合的语块抽取方法。本文使用Nagao串频统计算法进行基于词语的串频统计,进一步分别利用统计方法、语块边界过滤规则对2-gram到10-gram语块进行过滤,得到候选语块,取得了令人满意的结果。通过实验发现,在统计方法中互信息和信息熵相结合的方法较单一的互信息方法好;在语块边界规则过滤方法中语块左右边界规则和停用词对语块抽取的结果有较大影响。实验结果表明统计和过滤规则相结合的方法要优于纯粹的统计方法。应用本文方法,再辅以人工校对,可以方便地获取重复出现的多词语块。在机器辅助翻译系统中,使用现有的语块抽取方法抽取重复的语言单位,就可以方便地建设翻译记忆库,提高翻译的工作效率。 展开更多
关键词 人工智能 机器翻译 语块抽取 串频统计 内部结合 紧密度 信息熵 语块组合规则
在线阅读 下载PDF
大规模语料库中自动搭配获取的统计方法研究 被引量:4
20
作者 姚建民 屈蕴茜 +1 位作者 朱巧明 张晶 《计算机工程与设计》 CSCD 北大核心 2007年第9期2154-2155,2180,共3页
搭配在语言学习、辞典编撰或自然语言处理的应用中有重要价值,搭配的自动获取是自然语言计算的基本研究领域之一。利用对数似然度、卡平方和互信息作为关联强度测度,从Penn Treebank语料库中自动获取搭配候选,以比较3种测度的不同特性... 搭配在语言学习、辞典编撰或自然语言处理的应用中有重要价值,搭配的自动获取是自然语言计算的基本研究领域之一。利用对数似然度、卡平方和互信息作为关联强度测度,从Penn Treebank语料库中自动获取搭配候选,以比较3种测度的不同特性。实验结果表明由于3种测度遵从不同的分布假设和倾向,抽取的搭配具有不同的分布特征。 展开更多
关键词 搭配 语料库 对数似然度 卡平方 互信息
在线阅读 下载PDF
上一页 1 2 13 下一页 到第
使用帮助 返回顶部