针对传统数据治理效能低、难适应动态需求问题,开展元数据驱动下数据分类与治理技术研究。构建多源异构元数据采集框架,统一数据格式和语义。采用双向长短期记忆-条件随机场(Bi-directional Long ShortTerm Memory-Conditional Random F...针对传统数据治理效能低、难适应动态需求问题,开展元数据驱动下数据分类与治理技术研究。构建多源异构元数据采集框架,统一数据格式和语义。采用双向长短期记忆-条件随机场(Bi-directional Long ShortTerm Memory-Conditional Random Field,BiLSTM-CRF)模型识别敏感实体,结合算法实现数据分级分类。构建数据血缘图谱定位关键节点。实验表明,所提技术的敏感实体识别准确率超过95%,治理覆盖度超过98%,执行延迟仅5.98 ms,较传统技术提升3~4倍,验证了其自动化、高效性、准确性。展开更多
文摘针对传统数据治理效能低、难适应动态需求问题,开展元数据驱动下数据分类与治理技术研究。构建多源异构元数据采集框架,统一数据格式和语义。采用双向长短期记忆-条件随机场(Bi-directional Long ShortTerm Memory-Conditional Random Field,BiLSTM-CRF)模型识别敏感实体,结合算法实现数据分级分类。构建数据血缘图谱定位关键节点。实验表明,所提技术的敏感实体识别准确率超过95%,治理覆盖度超过98%,执行延迟仅5.98 ms,较传统技术提升3~4倍,验证了其自动化、高效性、准确性。