面对网络中日益增多的数字作品以及人们版权意识的增强,确认数字作品版权归属非常重要,对于数字作品原创性检测问题,文本匹配技术能够很好地解决这一问题。文本匹配技术通过算法来判断句子之间的语义是否相近。最近几年,深度学习迅速发...面对网络中日益增多的数字作品以及人们版权意识的增强,确认数字作品版权归属非常重要,对于数字作品原创性检测问题,文本匹配技术能够很好地解决这一问题。文本匹配技术通过算法来判断句子之间的语义是否相近。最近几年,深度学习迅速发展,解决文本匹配任务的方法也得到了很好的发展。在已有的基于核的文档排序神经模型(a kernel based neural model for document ranking, KNRM)上进一步地研究和创新,提出融合KNRM和轻量级梯度提升机(light gradient boosting machine, LightGBM)算法的文本匹配模型,在交互矩阵转化的直方图上采用kernel-pooling的方式来提取相关局部特征信息,引入K个不同大小的核函数,来捕捉不同细粒度的相关匹配信号,获取高斯核特征,将LightGBM算法作为分类器,进行分类处理工作,预测最后的匹配结果。通过多个数据集验证模型效果,实验表明,融合模型KNRM-LightGBM在准确率方面优于原模型KNRM,能够达到更好的文本匹配效果。展开更多
分析基于内容的音乐信息检索(music information retrieval,MIR),其关键在于特征提取.传统的单特征向量表示方法存在局限性:难以选定用于提取特征的片段或时间窗;只选取音乐片段会丢失一些重要的信息.为了消除局限性,引入多特征向量的...分析基于内容的音乐信息检索(music information retrieval,MIR),其关键在于特征提取.传统的单特征向量表示方法存在局限性:难以选定用于提取特征的片段或时间窗;只选取音乐片段会丢失一些重要的信息.为了消除局限性,引入多特征向量的特征表示方法,在获取音乐的多个声学特征向量的同时,也可以完整地表示该音乐曲目.为了更加准确地计算由多特征向量表示的2个音乐曲目之间的相似度,引入金字塔匹配核技术(pyramid match kernel,PMK)计算不同长度的多特征向量之间的相似度.实验结果表明,PMK技术的引入可以提高MIR的性能.展开更多
文摘面对网络中日益增多的数字作品以及人们版权意识的增强,确认数字作品版权归属非常重要,对于数字作品原创性检测问题,文本匹配技术能够很好地解决这一问题。文本匹配技术通过算法来判断句子之间的语义是否相近。最近几年,深度学习迅速发展,解决文本匹配任务的方法也得到了很好的发展。在已有的基于核的文档排序神经模型(a kernel based neural model for document ranking, KNRM)上进一步地研究和创新,提出融合KNRM和轻量级梯度提升机(light gradient boosting machine, LightGBM)算法的文本匹配模型,在交互矩阵转化的直方图上采用kernel-pooling的方式来提取相关局部特征信息,引入K个不同大小的核函数,来捕捉不同细粒度的相关匹配信号,获取高斯核特征,将LightGBM算法作为分类器,进行分类处理工作,预测最后的匹配结果。通过多个数据集验证模型效果,实验表明,融合模型KNRM-LightGBM在准确率方面优于原模型KNRM,能够达到更好的文本匹配效果。
文摘分析基于内容的音乐信息检索(music information retrieval,MIR),其关键在于特征提取.传统的单特征向量表示方法存在局限性:难以选定用于提取特征的片段或时间窗;只选取音乐片段会丢失一些重要的信息.为了消除局限性,引入多特征向量的特征表示方法,在获取音乐的多个声学特征向量的同时,也可以完整地表示该音乐曲目.为了更加准确地计算由多特征向量表示的2个音乐曲目之间的相似度,引入金字塔匹配核技术(pyramid match kernel,PMK)计算不同长度的多特征向量之间的相似度.实验结果表明,PMK技术的引入可以提高MIR的性能.