摘要
【目的】对在线健康社区用户进行精准画像并准确预测其在社区中的参与情况,有助于社区管理者早期识别流失用户,并做出个性化挽留措施。【方法】构建多维度用户画像标签体系,采用统计分析、社会网络分析、自然语言处理技术、LDA主题聚类实现指标计算与可视化;将用户画像标签数据作为用户流失预测的模型输入,构建了基于滑动窗口的用户流失实时预测模型。【结果】以华夏中医论坛的真实数据进行实证研究,为9 918个用户生成了多维度画像标签,构建并比较多种机器学习算法对用户流失的预测效果,结果显示Gradient Boosting算法效果最佳,F1值达到88.77%。【局限】未在更多在线健康社区中应用,用户数据量较少。【结论】本研究提出了一种依据用户在线交互行为特征实现多维度用户画像标签计算的方法,并验证了用户画像在用户流失预测中的应用可行性。
[Objective] This paper tries to predict user behaviors in online health community based on user persona technology, aiming to identify and keep the potential churners. [Methods] We constructed a multidimensional label system for user persona with the help of statistical analysis, social network analysis, natural language processing and LDA topic clustering. Then, we used the decision tree and ensemble learning models to predict the potential churners. [Results] We examined our new model with the Huaxia Traditional Chinese Medicine Forum and its F1 value reached 88.77%. [Limitations] More research is needed to examine our algorithm with other online health communities. [Conclusions] User persona technology could help us predict potential user churns.
作者
王若佳
严承希
郭凤英
王继民
Wang Ruojia;Yan Chengxi;Guo Fengying;Wang Jimin(School of Management,Beijing University of Chinese Medicine,Beijing 100029,China;School of Information Resource Management,Renmin University of China,Beijing 100872,China;Department of Information Management,Peking University,Beijing 100871,China)
出处
《数据分析与知识发现》
CSSCI
CSCD
北大核心
2022年第2期80-92,共13页
Data Analysis and Knowledge Discovery
基金
北京中医药大学新教师启动基金项目(项目编号:2021-JYB-XJSJJ-038)的研究成果之一。
关键词
在线健康社区
用户画像
用户流失预测
机器学习
Online Health Communities
User Persona
Churner Prediction
Machine Learning