[目的/意义]在人工智能技术及应用快速发展与深刻变革背景下,机器学习领域不断出现新的研究主题和方法,深度学习和强化学习技术持续发展。因此,有必要探索不同领域机器学习研究主题演化过程,并识别出热点与新兴主题。[方法/过程]本文以...[目的/意义]在人工智能技术及应用快速发展与深刻变革背景下,机器学习领域不断出现新的研究主题和方法,深度学习和强化学习技术持续发展。因此,有必要探索不同领域机器学习研究主题演化过程,并识别出热点与新兴主题。[方法/过程]本文以图书情报领域中2011—2022年Web of Science数据库中的机器学习研究论文为例,融合LDA和Word2vec方法进行主题建模和主题演化分析,引入主题强度、主题影响力、主题关注度与主题新颖性指标识别热点主题与新兴热点主题。[结果/结论]研究结果表明,(1)Word2vec语义处理能力与LDA主题演化能力的结合能够更加准确地识别研究主题,直观展示研究主题的分阶段演化规律;(2)图书情报领域的机器学习研究主题主要分为自然语言处理与文本分析、数据挖掘与分析、信息与知识服务三大类范畴。各类主题之间的关联性较强,且具有主题关联演化特征;(3)设计的主题强度、主题影响力和主题关注度指标及综合指标能够较好地识别出2011—2014年、2015—2018年和2019—2022年3个不同周期阶段的热点主题。展开更多
文本的语义表示是自然语言处理和机器学习领域的研究难点,针对目前文本表示中的语义缺失问题,基于LDA主题模型和Word2vec模型,提出一种新的文本语义增强方法Sem2vec(semantic to vector)模型。该模型利用LDA主题模型获得单词的主题分布...文本的语义表示是自然语言处理和机器学习领域的研究难点,针对目前文本表示中的语义缺失问题,基于LDA主题模型和Word2vec模型,提出一种新的文本语义增强方法Sem2vec(semantic to vector)模型。该模型利用LDA主题模型获得单词的主题分布,计算单词与其上下文词的主题相似度,作为主题语义信息融入到词向量中,代替one-hot向量输入至Sem2vec模型,在最大化对数似然目标函数约束下,训练Sem2vec模型的最优参数,最终输出增强的语义词向量表示,并进一步得到文本的语义增强表示。在不同数据集上的实验结果表明,相比其他经典模型,Sem2vec模型的语义词向量之间的语义相似度计算更为准确。另外,根据Sem2vec模型得到的文本语义向量,在多种文本分类算法上的分类结果,较其他经典模型可以提升0.58%~3.5%,同时也提升了时间性能。展开更多
感知风险对技术采纳行为具有显著影响,探究中国公众对城市空中交通(Urban Air Mobility,UAM)的感知风险有助于推动UAM市场化进程。采用扎根理论挖掘在线评论数据,提取UAM感知风险因素,构建UAM感知风险理论框架;借助可视化软件Ucinet和Ne...感知风险对技术采纳行为具有显著影响,探究中国公众对城市空中交通(Urban Air Mobility,UAM)的感知风险有助于推动UAM市场化进程。采用扎根理论挖掘在线评论数据,提取UAM感知风险因素,构建UAM感知风险理论框架;借助可视化软件Ucinet和Netdraw开展UAM感知风险语义网络分析,探究UAM感知风险因素的重要度排序。结果表明:中国情境下公众UAM感知风险包括六个风险类型、19个风险因素;六类感知风险的重要度排序由高至低依次是感知社会风险、感知侵权风险、感知环境风险、感知绩效风险、感知技术风险和感知政策风险;其中,身体损伤、公共安全、信息泄露、自然环境、服务性能、人居环境、政策制定、设施环境、机体结构、飞行性能等10个风险因素处于语义网络中的核心区域,是更为关键的UAM感知风险因素。展开更多
文摘[目的/意义]在人工智能技术及应用快速发展与深刻变革背景下,机器学习领域不断出现新的研究主题和方法,深度学习和强化学习技术持续发展。因此,有必要探索不同领域机器学习研究主题演化过程,并识别出热点与新兴主题。[方法/过程]本文以图书情报领域中2011—2022年Web of Science数据库中的机器学习研究论文为例,融合LDA和Word2vec方法进行主题建模和主题演化分析,引入主题强度、主题影响力、主题关注度与主题新颖性指标识别热点主题与新兴热点主题。[结果/结论]研究结果表明,(1)Word2vec语义处理能力与LDA主题演化能力的结合能够更加准确地识别研究主题,直观展示研究主题的分阶段演化规律;(2)图书情报领域的机器学习研究主题主要分为自然语言处理与文本分析、数据挖掘与分析、信息与知识服务三大类范畴。各类主题之间的关联性较强,且具有主题关联演化特征;(3)设计的主题强度、主题影响力和主题关注度指标及综合指标能够较好地识别出2011—2014年、2015—2018年和2019—2022年3个不同周期阶段的热点主题。
文摘文本的语义表示是自然语言处理和机器学习领域的研究难点,针对目前文本表示中的语义缺失问题,基于LDA主题模型和Word2vec模型,提出一种新的文本语义增强方法Sem2vec(semantic to vector)模型。该模型利用LDA主题模型获得单词的主题分布,计算单词与其上下文词的主题相似度,作为主题语义信息融入到词向量中,代替one-hot向量输入至Sem2vec模型,在最大化对数似然目标函数约束下,训练Sem2vec模型的最优参数,最终输出增强的语义词向量表示,并进一步得到文本的语义增强表示。在不同数据集上的实验结果表明,相比其他经典模型,Sem2vec模型的语义词向量之间的语义相似度计算更为准确。另外,根据Sem2vec模型得到的文本语义向量,在多种文本分类算法上的分类结果,较其他经典模型可以提升0.58%~3.5%,同时也提升了时间性能。
文摘感知风险对技术采纳行为具有显著影响,探究中国公众对城市空中交通(Urban Air Mobility,UAM)的感知风险有助于推动UAM市场化进程。采用扎根理论挖掘在线评论数据,提取UAM感知风险因素,构建UAM感知风险理论框架;借助可视化软件Ucinet和Netdraw开展UAM感知风险语义网络分析,探究UAM感知风险因素的重要度排序。结果表明:中国情境下公众UAM感知风险包括六个风险类型、19个风险因素;六类感知风险的重要度排序由高至低依次是感知社会风险、感知侵权风险、感知环境风险、感知绩效风险、感知技术风险和感知政策风险;其中,身体损伤、公共安全、信息泄露、自然环境、服务性能、人居环境、政策制定、设施环境、机体结构、飞行性能等10个风险因素处于语义网络中的核心区域,是更为关键的UAM感知风险因素。