摘要
中药数据的不规范,使预处理成为数据挖掘系统中的一个重要过程。该文开发中药特性信息数据挖掘系统,介绍系统结构与挖掘流程,分析中药数据的特征,对数据进行预处理,包括过滤噪声数据、中医药术语规范化、缺损数据处理、剂量单位规范化、作用度规一化、功效量化等。
The description of Traditional Chinese Medicine(TCM) information is not uniform, so data preprocessing is a key process in data mining system. This paper develops data mining system for TCM prescription information, introduces the system architecture and the mining process are described, analyzes the characteristic of data in TCM, and preprocess data such as filtering noisy data, jargon of TCM uniform, absent data processing, measurement units of dose uniform, measurement of effect for medicine, quantity of effect and so on.
出处
《计算机工程》
CAS
CSCD
北大核心
2008年第21期284-284,F0003,共2页
Computer Engineering
基金
国家自然科学基金资助项目(60763012)
广东省自然科学基金资助项目(07006474)
广东省科技攻关基金资助项目(20078010200044)
广东商学院博士启动基金资助项目(07BS52002)
关键词
数据挖掘
中药
方剂
数据预处理
data mining
Traditional Chinese Medicine(TCM)
prescription
data preprocessing