语言学界对连词“and”关联构成假拟祈使句现象(如“Come closer and I'll shoot.”)争议颇大,然而鲜有研究采用真实语料、跨越句子对该现象进行探讨。本文基于系统功能语言学的语境观、功能观和系统论,选取enTenTen18语料库中动词...语言学界对连词“and”关联构成假拟祈使句现象(如“Come closer and I'll shoot.”)争议颇大,然而鲜有研究采用真实语料、跨越句子对该现象进行探讨。本文基于系统功能语言学的语境观、功能观和系统论,选取enTenTen18语料库中动词短语-and-陈述句联为语料,从语篇语义视角出发,探讨假拟祈使句在不同语篇语境下的语义解读及其语篇合谋功能。研究发现:情景语境和上下文语境为假拟祈使句的语义分化提供了资源配置;在语篇元功能的促成作用及其与人际元功能的合力作用下,说话人受语篇意图和语境变化的驱动选择不同的假拟祈使句来组构语篇;假拟祈使句在自然语篇中具有获得首位突显、与if条件句等形式同义置换、引出新话题的作用,能为人际语义潜势多样化体现提供语法资源。展开更多
针对当下层级文本分类模型尚未充分利用层级实例的标签信息以及缺乏对类别分布不平衡的处理这两方面问题,本文提出一种面向标签共现和长尾分布的层级文本分类方法(hierarchical text classification for label cooccurrence and long-ta...针对当下层级文本分类模型尚未充分利用层级实例的标签信息以及缺乏对类别分布不平衡的处理这两方面问题,本文提出一种面向标签共现和长尾分布的层级文本分类方法(hierarchical text classification for label cooccurrence and long-tail distribution,LC-LTD),对基于共享标签的文本全局语义和面向长尾分布的平衡损失函数进行研究.首先,设计一种基于共享标签的对比学习目标,使具有更多共享标签的文本表示在特征空间中的语义距离更近,引导模型生成具有判别性的语义表征;其次,引入分布平衡损失函数替换二进制交叉熵损失,缓解层级分类固有的长尾分布问题,提高模型的泛化能力.在WOS、BGC两个公开数据集上将LC-LTD与当前多个主流模型进行比较,结果表明所提方法具有更好的分类性能,更适合处理层级文本分类任务.展开更多
文摘语言学界对连词“and”关联构成假拟祈使句现象(如“Come closer and I'll shoot.”)争议颇大,然而鲜有研究采用真实语料、跨越句子对该现象进行探讨。本文基于系统功能语言学的语境观、功能观和系统论,选取enTenTen18语料库中动词短语-and-陈述句联为语料,从语篇语义视角出发,探讨假拟祈使句在不同语篇语境下的语义解读及其语篇合谋功能。研究发现:情景语境和上下文语境为假拟祈使句的语义分化提供了资源配置;在语篇元功能的促成作用及其与人际元功能的合力作用下,说话人受语篇意图和语境变化的驱动选择不同的假拟祈使句来组构语篇;假拟祈使句在自然语篇中具有获得首位突显、与if条件句等形式同义置换、引出新话题的作用,能为人际语义潜势多样化体现提供语法资源。
文摘针对当下层级文本分类模型尚未充分利用层级实例的标签信息以及缺乏对类别分布不平衡的处理这两方面问题,本文提出一种面向标签共现和长尾分布的层级文本分类方法(hierarchical text classification for label cooccurrence and long-tail distribution,LC-LTD),对基于共享标签的文本全局语义和面向长尾分布的平衡损失函数进行研究.首先,设计一种基于共享标签的对比学习目标,使具有更多共享标签的文本表示在特征空间中的语义距离更近,引导模型生成具有判别性的语义表征;其次,引入分布平衡损失函数替换二进制交叉熵损失,缓解层级分类固有的长尾分布问题,提高模型的泛化能力.在WOS、BGC两个公开数据集上将LC-LTD与当前多个主流模型进行比较,结果表明所提方法具有更好的分类性能,更适合处理层级文本分类任务.