本文以河北省民宿的地理位置坐标数据以及携程网上的河北省民宿评论数据为研究对象,分别从地理空间和情感满意度两个角度对民宿进行研究。首先,利用最邻近分析、核密度分析等多种空间分析方法对民宿的空间分布特征进行探讨,得出河北省...本文以河北省民宿的地理位置坐标数据以及携程网上的河北省民宿评论数据为研究对象,分别从地理空间和情感满意度两个角度对民宿进行研究。首先,利用最邻近分析、核密度分析等多种空间分析方法对民宿的空间分布特征进行探讨,得出河北省民宿的分布特征。接着,利用LDA-LSTM模型对民宿评论文本数据进行分析,将LDA主题提取模型、Word2Vec词向量化以及Pagerank算法进行结合,实现对民宿主题词的二次挖掘。最后,结合LSTM神经网络模型,计算每个主题的满意度,并对影响住户满意度的因素进行具体分析。This article takes the geographic coordinates of homestays in Hebei Province and the review data of homestays in Hebei Province on Ctrip as the research objects, and studies homestays from two perspectives: geographic space and emotional satisfaction. Firstly, various spatial analysis methods such as nearest neighbor analysis and kernel density analysis are used to explore the spatial distribution characteristics of homestays, and the distribution characteristics of homestays in Hebei Province are obtained. Next, the LDA-LSTM model is used to analyze the text data of homestay comments. The LDA topic extraction model, Word2Vec word vectorization, and Pagerank algorithm are combined to achieve secondary mining of homestay topic words. Finally, the LSTM neural network model is combined to calculate the satisfaction of each topic and analyze the factors that affect household satisfaction.展开更多
[目的/意义]如何挖掘海量学术论文中的研究主题,梳理研究主题的演化脉络和关联关系,预测主题前沿热点,对掌握科技竞争先机至关重要。[方法/过程]针对当前主题关联和预测研究中存在的不足,提出基于隐含狄利克雷(Latent Dirichlet allocat...[目的/意义]如何挖掘海量学术论文中的研究主题,梳理研究主题的演化脉络和关联关系,预测主题前沿热点,对掌握科技竞争先机至关重要。[方法/过程]针对当前主题关联和预测研究中存在的不足,提出基于隐含狄利克雷(Latent Dirichlet allocation,LDA)和长短期记忆(Long Short Term Memory,LSTM)模型的研究关联与预测方法,首先基于生命周期理论划分多时序窗口,并利用LDA主题模型挖掘学术文献中的隐性研究主题,分析主题间的关联关系;基于主题预测指标的时间序列特征,运用LSTM模型对主题研究的发展趋势和研究热点进行预测,并结合基金立项和论文发表情况对预测结果进行定性修正。[结果/结论]案例分析结果表明,本文方法可以准确挖掘研究主题,分析主题关联关系,对研究主题研究走势和热点的预测具有实用价值。展开更多
文摘本文以河北省民宿的地理位置坐标数据以及携程网上的河北省民宿评论数据为研究对象,分别从地理空间和情感满意度两个角度对民宿进行研究。首先,利用最邻近分析、核密度分析等多种空间分析方法对民宿的空间分布特征进行探讨,得出河北省民宿的分布特征。接着,利用LDA-LSTM模型对民宿评论文本数据进行分析,将LDA主题提取模型、Word2Vec词向量化以及Pagerank算法进行结合,实现对民宿主题词的二次挖掘。最后,结合LSTM神经网络模型,计算每个主题的满意度,并对影响住户满意度的因素进行具体分析。This article takes the geographic coordinates of homestays in Hebei Province and the review data of homestays in Hebei Province on Ctrip as the research objects, and studies homestays from two perspectives: geographic space and emotional satisfaction. Firstly, various spatial analysis methods such as nearest neighbor analysis and kernel density analysis are used to explore the spatial distribution characteristics of homestays, and the distribution characteristics of homestays in Hebei Province are obtained. Next, the LDA-LSTM model is used to analyze the text data of homestay comments. The LDA topic extraction model, Word2Vec word vectorization, and Pagerank algorithm are combined to achieve secondary mining of homestay topic words. Finally, the LSTM neural network model is combined to calculate the satisfaction of each topic and analyze the factors that affect household satisfaction.
文摘[目的/意义]如何挖掘海量学术论文中的研究主题,梳理研究主题的演化脉络和关联关系,预测主题前沿热点,对掌握科技竞争先机至关重要。[方法/过程]针对当前主题关联和预测研究中存在的不足,提出基于隐含狄利克雷(Latent Dirichlet allocation,LDA)和长短期记忆(Long Short Term Memory,LSTM)模型的研究关联与预测方法,首先基于生命周期理论划分多时序窗口,并利用LDA主题模型挖掘学术文献中的隐性研究主题,分析主题间的关联关系;基于主题预测指标的时间序列特征,运用LSTM模型对主题研究的发展趋势和研究热点进行预测,并结合基金立项和论文发表情况对预测结果进行定性修正。[结果/结论]案例分析结果表明,本文方法可以准确挖掘研究主题,分析主题关联关系,对研究主题研究走势和热点的预测具有实用价值。