期刊文献+
共找到61篇文章
< 1 2 4 >
每页显示 20 50 100
基于多源文本数据和特征增强树模型的上市公司欺诈预测研究
1
作者 李刚 仇朝朝 +2 位作者 张志鹏 秦思萌 薛星楠 《中国管理科学》 北大核心 2025年第11期29-40,共12页
本文基于上市公司年报、省级政府工作报告和央行货币政策报告等多源文本数据,通过提取文本相似度、文本语调、文本可读性等在内的多维度文本指标,结合上市公司财务数据等非文本指标,采用特征增强树模型(Augboost)对上市公司欺诈进行预... 本文基于上市公司年报、省级政府工作报告和央行货币政策报告等多源文本数据,通过提取文本相似度、文本语调、文本可读性等在内的多维度文本指标,结合上市公司财务数据等非文本指标,采用特征增强树模型(Augboost)对上市公司欺诈进行预测。基于2001—2020年我国A股制造业上市公司的实证结果表明:(1)多源文本指标提供了额外的信息增量。(2)不同类型的文本所带来的信息增量不同:相较于上市公司年报和省级政府工作报告文本,央行货币政策文本提供的信息增量最为显著。(3)相较于逻辑回归等常见算法,本文所采用的特征增强树能够更准确地预测上市公司是否存在欺诈行为。 展开更多
关键词 多源文本 Augboost模型 欺诈预测 上市公司 文本分析
原文传递
ESG信息披露质量对ESG评分的影响——基于机器学习与文本分析的证据 被引量:1
2
作者 陈旻 邱梓洛 《南昌师范学院学报》 2025年第3期124-132,共9页
在经济高质量发展与“双碳”目标推进的背景下,ESG理念备受关注,企业ESG信息披露质量的重要性日益凸显。聚焦中国香港H股上市公司,基于信息不对称、信号传递和可持续发展理论,运用机器学习和文本分析方法,探究ESG信息披露质量对ESG评分... 在经济高质量发展与“双碳”目标推进的背景下,ESG理念备受关注,企业ESG信息披露质量的重要性日益凸显。聚焦中国香港H股上市公司,基于信息不对称、信号传递和可持续发展理论,运用机器学习和文本分析方法,探究ESG信息披露质量对ESG评分的影响。研究发现,ESG信息披露内容多样性与ESG评分呈“倒U型”关系,适度的多样性有助于提升评分,过度则产生负面影响;披露内容一致性与评分正相关。异质性检验表明,非重污染行业的“倒U型”影响更显著,重污染行业一致性的促进作用更大;非内地企业多样性影响显著,内地企业一致性作用更突出。研究结论为政府制定政策和企业优化披露策略提供了参考。 展开更多
关键词 ESG信息披露 LDA主题聚类 ESG评分 港股上市公司 文本分析
在线阅读 下载PDF
美国对华出口管制、政府补贴与企业全要素生产率
3
作者 陈芳 邱斌 户华玉 《长安大学学报(社会科学版)》 2025年第2期32-47,共16页
为应对美国出口管制对中国企业发展质量造成的不利冲击,借助双固定效应回归模型,以对华实体清单作为出口管制代表,利用2017—2022年中国A股上市公司数据,实证研究美国出口管制对中国企业全要素生产率产生的影响、作用机制以及政府补贴... 为应对美国出口管制对中国企业发展质量造成的不利冲击,借助双固定效应回归模型,以对华实体清单作为出口管制代表,利用2017—2022年中国A股上市公司数据,实证研究美国出口管制对中国企业全要素生产率产生的影响、作用机制以及政府补贴在其中发挥的作用。研究认为,美国出口管制通过加剧企业财务困境和强化企业管理者短视,抑制了中国企业全要素生产率提升,并对国有、低政府补贴强度和高新技术行业的企业冲击更为显著;政府补贴有效缓解了美国出口管制对中国企业全要素生产率造成的负面影响,并对中小型、非多元化经营和具有海外经历高管的企业补助效果更好;将政府补贴类型细分后发现研发补贴的调节效果优于非研发补贴;美国出口管制对中国企业全要素生产率的影响在不同时期存在显著差异;长期来看,美国出口管制对中国企业全要素生产率造成的负面影响在不断减弱。研究表明,应重视政府补贴的合理使用、提升企业管理综合水平、推动企业自主创新能力持续提升。 展开更多
关键词 国际经济与贸易 出口管制 文本挖掘 全要素生产率(TFP) 实体清单 政府补贴
在线阅读 下载PDF
基于自然语言处理(NLP)的生态环境准入清单政策内容分析 被引量:3
4
作者 魏泽洋 汪自书 +3 位作者 宫曼莉 谢丹 杨洋 刘毅 《环境工程技术学报》 北大核心 2025年第1期1-10,共10页
生态环境准入清单是生态环境分区管控制度的核心抓手,通过空间布局约束、污染排放管控、环境风险防控和资源能源利用效率控制等维度实现生态环境源头预防。生态环境准入清单存在政策文本庞大、管控措施多样、表达构成复杂特点,识别准入... 生态环境准入清单是生态环境分区管控制度的核心抓手,通过空间布局约束、污染排放管控、环境风险防控和资源能源利用效率控制等维度实现生态环境源头预防。生态环境准入清单存在政策文本庞大、管控措施多样、表达构成复杂特点,识别准入清单管控的对象、方式与力度是支撑生态环境分区管控政策实施的重要基础。本研究基于自然语言机器无监督学习技术对生态环境准入清单进行政策词汇模式挖掘并对政策文本设定多维定量化标签,应用自然语言深度学习模型对生态环境准入清单管控措施进行文本分类评估。河北省是我国产业门类最齐全、资源环境问题最复杂的省份之一,其生态环境准入管控具有典型性和代表性。以河北省生态环境准入清单的产业管控措施为例,识别了10类政策关键词特征、64项主要政策关键词,对全清单中对应关键词所在的语句覆盖率达95%;构造了24个管控措施-行业的分类标签,应用并比较了BERT、RoBERTa和ALBERT深度学习模型对政策文本的分类识别效果,预测精度、召回率和F1得分最高分别可达到0.95、0.79和0.86,训练模型可较好地识别准入清单政策内容。结果显示河北省准入清单在管控措施明确化、具体化、定量化方面仍存在不足,产业精细化管控、考核指标型以及时限型内容有待补充和细化。本研究提出的方法具有较好的适用前景,建议在此基础上结合前沿人工智能方法,进一步提高模型自动处理效率、动态分析以及提供精细化政策调整建议的能力。 展开更多
关键词 生态环境分区管控 生态环境准入清单 政策文本 自然语言处理(NLP)
在线阅读 下载PDF
一种全新的全文索引模型——后继数组模型 被引量:11
5
作者 刘学文 陶晓鹏 +1 位作者 于玉 胡运发 《软件学报》 EI CSCD 北大核心 2002年第1期150-158,共9页
提出了一种新的全文索引模型——后继数组模型,它结合了目前多个主流全文检索模型(倒排表模型、Pat数组模型等)的优点,提高了空间效率和时间效率,并得到了理论和实验的证明.
关键词 全文索引模型 后继数组模型 文本数据库 数据模型
在线阅读 下载PDF
面向网络的全文检索中索引文件的组织 被引量:12
6
作者 颜维龙 盖杰 +1 位作者 武港山 袁春风 《计算机应用研究》 CSCD 北大核心 2002年第11期124-126,146,共4页
为了提高网络中全文检索的效率 ,需要对Web页面中内容进行分析、建立全文索引 ,并对索引的结构进行高效率的组织。讨论了索引的组织结构及其实现方法 ,并分析了不同的组织方法的性能。
关键词 全文检索 字表 正排表 倒排表 索引
在线阅读 下载PDF
Josephus问题的算法设计与应用研究 被引量:9
7
作者 陈海山 钱锋 +1 位作者 田英 雷鸣 《计算机工程与应用》 CSCD 北大核心 2007年第1期61-64,共4页
Josephus问题是组合数学的发展源头之一。关于Josephus问题的描述形式甚多。文章通过实验和分析,总结了一个通用性的描述形式,并给出了基于循环链表的算法设计。算法的数据源从文本文件中获取,增强了算法的实用性;根据数据元素值的递增... Josephus问题是组合数学的发展源头之一。关于Josephus问题的描述形式甚多。文章通过实验和分析,总结了一个通用性的描述形式,并给出了基于循环链表的算法设计。算法的数据源从文本文件中获取,增强了算法的实用性;根据数据元素值的递增顺序建立循环链表,能够有效地分类数据,使Josephus数据序列均匀分布且不重复。文章还给出了Josephus问题的若干个应用实例,包括将Josephus问题应用于通用试题库的组卷算法和找出一组数据中某个指定范围的数据序列等。 展开更多
关键词 Josephus问题 算法设计 动态循环链表 文本文件
在线阅读 下载PDF
美国出口管制科学仪器技术分类研究 被引量:18
8
作者 陈芳 王学昭 +2 位作者 刘细文 王燕鹏 吴鸣 《世界科技研究与发展》 CSCD 2022年第3期287-298,共12页
在中美贸易冲突的背景下,美国为首的发达国家以立法形式限制关键核心技术向我国出口,美国出台的《商业管制清单》等文件包含了大量对技术、设备和产品的出口限制,涉及重要的科学仪器及其相关的零部件。本文以美国“两用”物品的商业管... 在中美贸易冲突的背景下,美国为首的发达国家以立法形式限制关键核心技术向我国出口,美国出台的《商业管制清单》等文件包含了大量对技术、设备和产品的出口限制,涉及重要的科学仪器及其相关的零部件。本文以美国“两用”物品的商业管制清单(The Commerce Control List,CCL)为分析对象,以中国科学仪器分类为标准,将CCL中的内容与国内科学仪器的分类进行对比。通过对CCL的计量分析,揭示发现中国科学仪器领域相关技术受美国管制的形势非常严峻,有42.08%的清单条款涉及对科学仪器的管制。在十二个科学仪器的分类中,分析仪器、工艺实验设备、电子测量仪器等是受管制范围较广的领域,激光器、核仪器是传统受到管制的领域,医学诊断仪器、大气探测仪器等受管制范围较小。在分析的基础上为我国科学仪器的发展提出了分类应对、坚定走自主研发道路等建议。 展开更多
关键词 出口管制 商业管制清单 科学仪器 文本挖掘 自然语言处理
在线阅读 下载PDF
基于语义列表的中文文本聚类算法 被引量:1
9
作者 马素琴 施化吉 李星毅 《计算机应用研究》 CSCD 北大核心 2010年第5期1697-1699,1707,共4页
针对大多数基于向量空间模型的中文文本聚类算法存在高维稀疏、忽略词语之间的语义联系、缺少聚簇描述等问题,提出基于语义列表的中文文本聚类算法CTCAUSL(Chinese text clustering algorithm using semantic list)。该算法采用语义列... 针对大多数基于向量空间模型的中文文本聚类算法存在高维稀疏、忽略词语之间的语义联系、缺少聚簇描述等问题,提出基于语义列表的中文文本聚类算法CTCAUSL(Chinese text clustering algorithm using semantic list)。该算法采用语义列表表示文本,一个文本的语义列表中的词是该文本中出现的词,从而降低了数据维数,且不存在稀疏问题;同时利用词语间的相似度计算解决了同义词近义词的问题;最后用语义列表对聚簇进行描述,增加了聚类结果的可读性。实验结果表明,CTCAUSL算法在处理大量文本数据方面具有较好的性能,并能明显提高中文文本聚类的准确性。 展开更多
关键词 文本聚类 文本表示 语义列表 相似度计算 聚簇表示
在线阅读 下载PDF
基于改进倒排表和集合的最频繁项集挖掘算法 被引量:1
10
作者 陈小玉 杨艳燕 +1 位作者 刘克成 朱颢东 《计算机应用研究》 CSCD 北大核心 2012年第6期2135-2137,共3页
最频繁项集挖掘是文本关联规则挖掘中研究的重点和难点,它决定了文本关联规则挖掘算法的性能。针对当前在最频繁项集挖掘方面的不足,将集合论引入倒排表以对其进行改进,然后以此为基础提出了几个命题和推论,并结合最小支持度阈值动态调... 最频繁项集挖掘是文本关联规则挖掘中研究的重点和难点,它决定了文本关联规则挖掘算法的性能。针对当前在最频繁项集挖掘方面的不足,将集合论引入倒排表以对其进行改进,然后以此为基础提出了几个命题和推论,并结合最小支持度阈值动态调整策略,提出了一个基于改进的倒排表和集合理论的最频繁项集挖掘算法,最后对所提算法进行验证。实验结果表明,所提算法的规则有效率和时间性能比常用的两个最频繁项集挖掘算法,即NApriori和IntvMatrix算法都好。 展开更多
关键词 最频繁项集 文本关联规则 倒排表 集合理论
在线阅读 下载PDF
学术英语中的半技术性词汇 被引量:11
11
作者 陈琦 高云 《外语教学》 CSSCI 北大核心 2010年第6期42-46,共5页
半技术性词汇在学术英语中占有不可忽视的地位。在学术性英语文字中,这些词汇频繁出现,具有较高的行文覆盖率,而且在文章中承担重要的语篇及修辞功能,同时又由于其抽象性和灵活性而不易被学习者掌握。对于以科研为目的的英语学习者和使... 半技术性词汇在学术英语中占有不可忽视的地位。在学术性英语文字中,这些词汇频繁出现,具有较高的行文覆盖率,而且在文章中承担重要的语篇及修辞功能,同时又由于其抽象性和灵活性而不易被学习者掌握。对于以科研为目的的英语学习者和使用者来说,了解和掌握该类词汇对提高学术英语写作能力具有重要意义。国外对半技术性词汇已有系统深入的研究,但在国内此类词汇尚未得到充分重视。本文对半技术性词汇的分类、定义、功能和特点进行简述,并介绍一些中西方有关半技术性词汇的研究报道,以期引起国内语言研究者和教育者的兴趣和重视。 展开更多
关键词 半技术性词汇 学术词表 词频 覆盖率 修辞功能
原文传递
望山楚简遣册所记“彤■”新释 被引量:4
12
作者 范常喜 凡国栋(校) 《江汉考古》 CSSCI 北大核心 2018年第2期115-117,122,共4页
望山楚简遣册所记"彤■"中的"■"当改释作"幵",读作"旜"或"旃"。简文"彤幵(旜/旃)"意思是红色的旃旗。
关键词 望山楚简 遣册 彤幵(旜/旃)
原文传递
上市公司碳减排行动指数研究 被引量:13
13
作者 廖华 付莹 黄巍巍 《北京理工大学学报(社会科学版)》 CSSCI 北大核心 2022年第2期13-20,共8页
便捷追踪上市公司碳减排行动的努力程度和成效,揭示碳减排在企业经营决策中的地位,利用文本挖掘方法对2001—2020年44502份公司年报分析,从结构优化、节能增效、固碳工程和管理保障四个维度对企业碳减排行动开展定量评估,并构建上市公... 便捷追踪上市公司碳减排行动的努力程度和成效,揭示碳减排在企业经营决策中的地位,利用文本挖掘方法对2001—2020年44502份公司年报分析,从结构优化、节能增效、固碳工程和管理保障四个维度对企业碳减排行动开展定量评估,并构建上市公司碳减排行动指数。发现过去20年中国上市公司碳减排行动力度持续上升,且与国家减排政策紧密相关。节能增效行动最早开展,管理保障行动在2020年有爆发式增长。发电行业和终端高耗能行业企业碳减排行动积极,国有企业在减排行动中发挥着引领作用。从行业内部看,发展规模大、经营状况良好的企业把碳减排放在更加优先的位置。减排行动指数揭示了企业对国家政策和时代潮流的响应速度、力度和方式,可为有关部门进一步完善企业减排激励和约束机制提供参考。 展开更多
关键词 碳减排行动 碳中和 碳达峰 上市公司 文本挖掘 碳指数
在线阅读 下载PDF
基于关键词的文本内容过滤算法的改进 被引量:4
14
作者 何苗 全宇 《微计算机应用》 2007年第8期841-845,共5页
讨论了常规关键词过滤算法的实现方法和实际应用中的缺陷,详细描述了改进的基于单链表存储结构的关键词过滤算法及动态更新关键词列表的实现过程。最后,对改进前后的关键词过滤算法进行对比。
关键词 过滤 单链表 文本
在线阅读 下载PDF
跨语言信息检索技术探析 被引量:5
15
作者 麦淑平 《中华医学图书情报杂志》 CAS 2008年第4期49-51,共3页
介绍了跨语言信息检索产生的背景和概念,阐述其类型、系统模型和几种主要的跨语言信息检索方法,并对影响跨语言信息检索效果的因素提出了一些解决的方法。
关键词 跨语言信息检索 匹配策略 受控词表 自由文本
在线阅读 下载PDF
中文文本倾向性分类技术比较研究 被引量:14
16
作者 朱杰 刘功申 陈卓 《信息安全与通信保密》 2010年第4期56-58,共3页
随着近几年互联网的发展,网络评论数量正日益增加。对这些网络评论进行挖掘和分析,识别出其中的情感倾向,可以给用户、企业、政府提供重要的决策支持。采用机器学习方法中的朴素贝叶斯和支持向量机分类模型,根据不同的停用词表、特征选... 随着近几年互联网的发展,网络评论数量正日益增加。对这些网络评论进行挖掘和分析,识别出其中的情感倾向,可以给用户、企业、政府提供重要的决策支持。采用机器学习方法中的朴素贝叶斯和支持向量机分类模型,根据不同的停用词表、特征选择方法、特征加权方法的组合,对中文文本倾向性分类进行了研究。结论表明,采用保留情感信息相关词性的停用词表,以文档频率为特征选择方法,并应用基于绝对词频的支持向量机分类模型,能取得较好的分类效果。 展开更多
关键词 中文文本倾向性分类 停用词表 特征选择 特征加权 朴素贝叶斯 支持向量机
原文传递
可持续发展背景下企业水安全评价指标体系构建与应用 被引量:5
17
作者 新夫 于会淼 生然 《水利经济》 北大核心 2024年第6期84-90,共7页
基于可持续发展理念,从水安全目标、生产耗水全过程和环境保护三个层面对应总体安全、生产安全和生态安全三大主题分析了企业水安全评价指标体系构建逻辑,并采用文本分析法构建了企业水安全评价指标体系。通过上市公司年度社会责任报告... 基于可持续发展理念,从水安全目标、生产耗水全过程和环境保护三个层面对应总体安全、生产安全和生态安全三大主题分析了企业水安全评价指标体系构建逻辑,并采用文本分析法构建了企业水安全评价指标体系。通过上市公司年度社会责任报告中出现的水安全关键词词频计算了企业水安全评价指标综合得分,并对企业水安全意识进行了评价,结果表明,时间趋势上,2008-2021年我国上市公司水安全意识呈增强趋势,且不同省份、不同行业的企业水安全意识均具有一定程度的异质性。 展开更多
关键词 企业水安全 可持续发展 文本分析法 熵值法 上市公司
在线阅读 下载PDF
浅议农机企业合同管理现状及对策 被引量:3
18
作者 任明 《中国农机化》 2006年第4期31-33,共3页
介绍农机企业合同管理的重要性,然后从基础管理、流程管理、人才三个方面论述农机企业合同管理的发展与不足:在基础管理方面存在合同集中归口管理力度不够、合同管理制度不完善、文本不够规范等问题;在流程管理方面存在重签订轻履行、... 介绍农机企业合同管理的重要性,然后从基础管理、流程管理、人才三个方面论述农机企业合同管理的发展与不足:在基础管理方面存在合同集中归口管理力度不够、合同管理制度不完善、文本不够规范等问题;在流程管理方面存在重签订轻履行、市场调查不够等问题;人才表现出紧缺的局面。最后提出若干促进合同管理工作的对策与建议:树立全员风险意识,形成风险防范体系;加强合同管理的归口管理和全过程动态管理;推进合同管理信息化进程,实现合同管理方式的转变等。 展开更多
关键词 合同管理 合同文本 合同台帐 流程管理
在线阅读 下载PDF
批量制作座牌方法探究 被引量:2
19
作者 李敬海 《电子制作》 2013年第7X期88-88,73,共2页
在举办大型会议或培训班时,为便于管理,常需制作参加人员的座牌。如果只是按照一般方法来制作,工作量大还容易出错。本文则突破思维定式,巧妙地利用Word软件的文本框和页面设置,通过邮件合并功能,实现了座牌的批量制作。
关键词 座牌 文字方向 名单转换 邮件合并 批量制作
在线阅读 下载PDF
基于CNN-LSTM的社交媒体大数据评论文本情感元自动识别方法 被引量:3
20
作者 刘丹 《微型电脑应用》 2024年第4期195-197,201,共4页
为了准确识别社交媒体评论文本情感,助力公众负面情绪引导,提出了基于CNN-LSTM的社交媒体大数据评论文本情感元自动识别方法。通过社交媒体大数据分类,并通过具有字典功能的Token将评论文本转换成数字列表。结合词嵌入技术得到向量列表... 为了准确识别社交媒体评论文本情感,助力公众负面情绪引导,提出了基于CNN-LSTM的社交媒体大数据评论文本情感元自动识别方法。通过社交媒体大数据分类,并通过具有字典功能的Token将评论文本转换成数字列表。结合词嵌入技术得到向量列表,完成社交媒体大数据向量转换的预处理。将预处理获取的向量列表输入CNN网络,得到评论文本情感元最终局部特征值。将该值传至LSTM,通过遗忘门、输入门、输出门调节,获取评论文本情感元特征表征结果,经Softmax分类器分类后,实现情感元自动识别。实验结果表明,该方法能有效完成实验数据预处理,用文字和标签的形式标记正面、负面情感元,并准确识别情感元,间接反映社会问题,应用性较强。 展开更多
关键词 社交媒体数据 评论文本 情感元 向量列表 CNN-LSTM 自动识别
在线阅读 下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部