期刊文献+
共找到6,712篇文章
< 1 2 250 >
每页显示 20 50 100
基于二型模糊集数字特征的聚类方法及其应用
1
作者 李志伟 张荣宇 杨昔阳 《厦门大学学报(自然科学版)》 北大核心 2026年第2期340-348,共9页
[目的]针对模糊聚类任务中模糊化参数难以预设以及二型模糊集在解模糊阶段计算量大的问题,本文旨在提供一种高效且稳健的二型模糊聚类方法,以兼顾计算速度与聚类准确性.[方法]提出一种基于数字特征的二型模糊聚类模型(characteristic ba... [目的]针对模糊聚类任务中模糊化参数难以预设以及二型模糊集在解模糊阶段计算量大的问题,本文旨在提供一种高效且稳健的二型模糊聚类方法,以兼顾计算速度与聚类准确性.[方法]提出一种基于数字特征的二型模糊聚类模型(characteristic based type 2 FCM,CBT2FCM).该方法在目标函数中同时引入样本与簇中心的距离以及二型模糊集的数字特征,实现类簇中心与二型模糊隶属度的联合优化.算法在迭代过程中仅需更新数字特征,无需执行Karnik-Mendel解模糊过程,从而显著降低计算复杂度并提升抗噪性能.[结果]本文方法基本不受噪声影响:在公开数据集WDBC上,无监督的情况下,本文方法的聚类准确率达72.84%;在IMDb电影评论数据集上,当噪声率从0.1增加到1时,本文的聚类准确率从71.67%增加到72.05%,高于次优方法FCM的69.65%,运行时间从2.18 s增加到3.63 s,仅次于最优方法FCM的2.37 s,展现出良好的稳定性与计算效率.[结论]在公开数据集及电影分类数据集上的实验结果表明,该方法在聚类准确率、噪声容忍度及运行时间方面均优于传统聚类算法,具有通用性与有效性. 展开更多
关键词 二型模糊聚类 数字特征 模糊聚类 电影类簇
在线阅读 下载PDF
区域产业链与人才链深度融合的微专业群组群逻辑与课程体系重构研究——以舟山高职国际海洋商贸与服务微专业群为例
2
作者 高芳 杨丽丽 《新疆职业教育研究》 2026年第1期32-37,共6页
在全球价值链重构与“双循环”战略背景下,区域海洋经济高质量发展对复合型、国际化商贸人才提出迫切需求。当前高职商贸类专业普遍存在与产业链脱节、外语与技能割裂、校企协同浅表化等问题,难以支撑外向型海洋产业集群发展。本文以舟... 在全球价值链重构与“双循环”战略背景下,区域海洋经济高质量发展对复合型、国际化商贸人才提出迫切需求。当前高职商贸类专业普遍存在与产业链脱节、外语与技能割裂、校企协同浅表化等问题,难以支撑外向型海洋产业集群发展。本文以舟山群岛新区为研究对象,立足其海洋油气、船舶海工、港航物流等特色产业链,提出“技能难度权重优先”的组群逻辑,设计“外语+产业+商务”深度融合的复合型课程体系,建立基于岗位能力动态评估的弹性学时配置机制。通过“6+N”微专业架构(如石化国际贸易、海工装备出口、海洋食品跨境电商等),实现人才培养从“学科分段”向“链式整合”转型。研究表明,微专业群作为柔性载体,可有效弥合人才链与产业链的结构性错配,为高职教育服务国家海洋战略提供可复制、可推广的“舟山模式”。 展开更多
关键词 微专业群 组群逻辑 课程体系重构 舟山高职 国际海洋商贸与服务
在线阅读 下载PDF
基于广义Frechet距离的区间值函数型聚类方法
3
作者 何启志 曹腾腾 杜文豪 《统计与决策》 北大核心 2026年第2期31-38,共8页
区间值函数型聚类是一种揭示区间值函数型数据内在结构的统计分析方法。现有的区间值函数型聚类方法通常以函数曲线之间的绝对距离作为相似性度量,忽视了函数曲线的形状特征和结构信息,容易受到数据维度和异常值的影响,导致聚类效果不... 区间值函数型聚类是一种揭示区间值函数型数据内在结构的统计分析方法。现有的区间值函数型聚类方法通常以函数曲线之间的绝对距离作为相似性度量,忽视了函数曲线的形状特征和结构信息,容易受到数据维度和异常值的影响,导致聚类效果不佳。为弥补上述不足,文章提出了一种新的区间值函数型聚类方法。该方法基于广义Frechet距离度量函数曲线之间的相似性,并通过区间形式来表达距离信息,更好地捕捉了函数曲线的变化趋势;同时,引入锦标赛算法以提高聚类效率。在实证研究中,基于该方法对中国城市气温数据进行聚类分析,并与基于函数型曼哈顿距离和区间值函数欧氏距离的聚类结果进行对比。实证结果表明,所提出的新方法在区间值函数型聚类任务中更具优势。 展开更多
关键词 函数型数据 区间值函数型聚类 广义Frechet距离 聚类分析
原文传递
原发性肺腺癌组织中巨噬细胞CD68^(+)、CD163^(+)的表达与临床病理学特征及预后相关性研究
4
作者 侯秋雨 季晓琳 +5 位作者 罗强 张晨策 齐胜男 逄格硕 刘方波 魏亮 《现代检验医学杂志》 2026年第1期64-69,共6页
目的探究原发性肺腺癌中巨噬细胞分化簇(CD)68^(+)和CD163^(+)的表达与临床病理学特征及预后相关性。方法回顾性收集2018年1月至2019年6月在青岛市第八人民医院胸外科接受外科手术和辅助化疗的106例原发性肺腺癌患者的病理组织及癌旁组... 目的探究原发性肺腺癌中巨噬细胞分化簇(CD)68^(+)和CD163^(+)的表达与临床病理学特征及预后相关性。方法回顾性收集2018年1月至2019年6月在青岛市第八人民医院胸外科接受外科手术和辅助化疗的106例原发性肺腺癌患者的病理组织及癌旁组织标本,利用免疫组化法检测并比较肺腺癌组织和癌旁组织中CD68^(+)和CD163^(+)表达水平。计算高倍镜下肺腺癌组织和癌旁组织、癌巢和癌巢旁间质的CD68^(+)和CD163^(+)巨噬细胞密度,并依据中位密度区分癌巢/癌巢旁间质CD68^(+)/CD163^(+)高/低密度。随访原发性肺腺癌患者并统计生存期,采用Kaplan-Meier分析癌巢、癌巢旁间质中CD68^(+)和CD163^(+)巨噬细胞密度对原发性肺腺癌患者生存的影响。结果CD68^(+)和CD163^(+)在肺腺癌组织中阳性表达所占比例均高于癌旁组织(χ^(2)=15.881、13.904,均P<0.05)。肺腺癌组织中CD68^(+)和CD163^(+)巨噬细胞密度高于癌旁组织(χ^(2)=44.143、40.070,均P<0.05)。癌巢、癌巢旁间质CD68^(+)高密度组中III~Ⅳ期肺腺癌、T3肿瘤大小、N2~N3期淋巴结所占比例高于CD68^(+)低密度组(χ^(2)=6.788~10.604,均P<0.05)。癌巢、癌巢旁间质CD163^(+)高密度组中III~Ⅳ期肺腺癌、T3肿瘤大小、N2~N3期淋巴结所占比例高于CD163^(+)低密度组(χ^(2)=7.556~17.743,均P<0.05)。癌巢CD68^(+)高密度组的生存率59.32%(35/59)低于癌巢CD68^(+)低密度组的生存率82.98%(39/47)(χ^(2)=7.332,P<0.05);癌巢旁间质CD68^(+)高密度组的生存率56.36%(31/55)低于癌巢旁间质CD68^(+)低密度组的生存率84.31%(43/51)(χ^(2)=9.518,P<0.05)。癌巢CD163^(+)高密度组的生存率58.93%(33/56)低于癌巢CD163^(+)低密度组的生存率82.00%(41/50)(χ^(2)=7.137,P<0.05);癌巢旁间质CD163^(+)高密度组的生存率55.56%(30/54)低于癌巢旁间质CD163^(+)低密度组的生存率84.62%(44/52)(χ^(2)=12.487,P<0.05)。结论原发性肺腺癌组织中巨噬细胞CD68^(+)和CD163^(+)的密度较高,癌巢、癌巢旁间质CD68^(+)和CD163^(+)高密度与肺腺癌进展和浸润以及较低的生存率有关。 展开更多
关键词 原发性肺腺癌 巨噬细胞 CD68^(+) CD163^(+) 病理特征
暂未订购
基于K-means聚类的烟叶物理特性分型方法
5
作者 许强 苏雪苗 +7 位作者 苗晨琳 张艺帆 杨月 陈超 黄恩华 吴昊 张玉海 胡宗玉 《浙江农业科学》 2026年第3期608-616,共9页
为明确不同加工属性类型烟叶的典型产地、物理特性指标及其数据分布区间,探究不同加工属性类型烟叶的物理特性,本研究选取来自云南省、河南省等18个省份72个地级市31个品种的烟叶样品,分析了其黏附力、剪切强度、穿透强度、叶梗结合力... 为明确不同加工属性类型烟叶的典型产地、物理特性指标及其数据分布区间,探究不同加工属性类型烟叶的物理特性,本研究选取来自云南省、河南省等18个省份72个地级市31个品种的烟叶样品,分析了其黏附力、剪切强度、穿透强度、叶梗结合力、支脉结合力、拉力和伸长率等物理特性指标,采用K-means聚类和高斯混合模型算法进行分析,并建立加工属性分型方法。结果表明,采用正常系数评价指标可提高模型聚类效果,采用K-means模型的烟叶物理特性聚类效果要优于高斯混合模型,当以0.35作为正常系数的阈值时,可将烟叶样品物理指标按典型产地分为3类。本研究为确定不同加工属性类型烟叶的物理特性提供了一定的参考依据。 展开更多
关键词 烟叶 物理特性 聚类模型 K-means聚类模型 高斯混合模型
在线阅读 下载PDF
基于自适应分层共享近邻的密度峰值聚类算法
6
作者 杜睿山 芦博瑞 +2 位作者 孟令东 江南 张云柏 《吉林大学学报(理学版)》 北大核心 2026年第2期359-369,共11页
针对传统密度峰值聚类算法未考虑类簇间密度差异、需预先设定类簇数量以及单一分配策略方面的不足,提出一种基于自适应分层共享近邻的密度峰值聚类算法.首先,通过自适应共享近邻与分层次增加权重的方式计算样本间相似度,重新定义局部密... 针对传统密度峰值聚类算法未考虑类簇间密度差异、需预先设定类簇数量以及单一分配策略方面的不足,提出一种基于自适应分层共享近邻的密度峰值聚类算法.首先,通过自适应共享近邻与分层次增加权重的方式计算样本间相似度,重新定义局部密度和相对距离;其次,引入二阶导数识别拐点,并基于拐点信息计算加权三角形面积以自动选取聚类中心;最后,结合相似度矩阵与相对距离进行二次分配以降低链式反应的影响.在9个人工数据集和9个UCI真实数据集上的实验结果表明,该算法在聚类性能上普遍优于密度峰值聚类算法及其改进算法,展现出更高的准确性和鲁棒性,适用于复杂分布数据的聚类分析. 展开更多
关键词 密度峰值聚类 分层共享近邻 局部密度 聚类中心 分配策略
在线阅读 下载PDF
数字产业集群政策如何影响就业?
7
作者 庞瑞芝 郑思源 白雪洁 《经济与管理研究》 北大核心 2026年第3期130-143,共14页
在新发展格局与现代产业体系建设背景下,数字产业集群政策对推动产业与就业协同、探索就业友好型发展路径具有重要的理论价值与实践意义。本文选取2000—2023年中国上市公司数据与地级及以上城市数据,运用多期双重差分方法实证检验数字... 在新发展格局与现代产业体系建设背景下,数字产业集群政策对推动产业与就业协同、探索就业友好型发展路径具有重要的理论价值与实践意义。本文选取2000—2023年中国上市公司数据与地级及以上城市数据,运用多期双重差分方法实证检验数字产业集群政策对企业就业水平的影响及其作用机制。研究结果显示,数字产业集群政策能够促进企业就业水平提升,并主要通过生产规模扩张效应、集群外溢效应与融资约束缓解效应实现。异质性分析发现,数字产业集群政策对企业就业水平的提升效应在数字基础设施较完善的地区、竞争程度较高的行业,以及东部和中部地区更为明显。本文的研究结论为“十五五”时期深化数字产业集群建设、推动高质量充分就业提供了经验证据与政策启示。 展开更多
关键词 数字产业集群政策 就业水平 生产规模扩张 集群外溢 融资约束
在线阅读 下载PDF
数字产业集群创新系统脆弱性评价
8
作者 李荣 陈荣松 《技术与创新管理》 2026年第1期10-23,共14页
创新型产业集群、软件产业基地、特色产业基地推动数字产业集群实数融合,通过分析数字产业集群主导的创新型产业集群试点政策对产业基地全要素生产率影响程度,选取“驱动力—压力—状态—影响—响应”模型,构建数字产业集群创新系统评... 创新型产业集群、软件产业基地、特色产业基地推动数字产业集群实数融合,通过分析数字产业集群主导的创新型产业集群试点政策对产业基地全要素生产率影响程度,选取“驱动力—压力—状态—影响—响应”模型,构建数字产业集群创新系统评价指标体系,实证分析数字产业集群创新脆弱性及空间分布特征。结果表明:集群试点政策促进了产业基地全要素生产率提升;数字产业集群创新脆弱性整体呈“橄榄型”分布,由沿海向内陆逐步增强;多数省份数字产业集群创新协调性与经济发展水平相关,创新状态系统障碍度偏高,人才资源和技术创新是主要制约因素;创新脆弱性呈现空间自相关性,局部空间自相关呈现高—高、低—低集聚特征。从实数融合、科产融合、集群融合3方面,提出改善数字产业集群创新脆弱性的政策建议。 展开更多
关键词 数字产业集群 创新脆弱性 创新型产业集群 软件产业基地 特色产业基地
在线阅读 下载PDF
港内水域船舶轨迹聚类的相似性距离筛选方法
9
作者 张杰 王建兴 +1 位作者 梁栋 梅斌 《上海海事大学学报》 北大核心 2026年第1期48-57,共10页
针对港内水域船舶交通密集且轨迹复杂度高所导致的聚类算法参数敏感、聚类结果不全面的问题,提出一种相似性距离筛选方法。该方法利用经纬度、对地航速、航向和艏向等数据,构建多种相似性距离。采用带有噪声的基于密度的空间聚类(densit... 针对港内水域船舶交通密集且轨迹复杂度高所导致的聚类算法参数敏感、聚类结果不全面的问题,提出一种相似性距离筛选方法。该方法利用经纬度、对地航速、航向和艏向等数据,构建多种相似性距离。采用带有噪声的基于密度的空间聚类(density-based spatial clustering of applications with noise,DBSCAN)算法获取每种相似性距离的聚类结果。计算每种聚类结果的轮廓系数、戴维森堡丁指数和聚类簇数等3项指标,分析DBSCAN超参数变化下这3项指标的稳定性,筛选出稳定性高的相似性距离。采用筛选出的稳定相似性距离进行轨迹聚类,分析并筛选出最优相似性距离。实验验证了筛选方法的有效性,表明基于经纬度的豪斯多夫(Hausdorff)距离与基于航向的动态时间规整(dynamic time warping,DTW)距离组合的聚类结果最佳,能更全面地完成港内船舶轨迹聚类,并识别典型交通流。本文研究成果能为港口交通流识别和特征数据挖掘提供有效方法,为船舶轨迹聚类相似性距离选择提供指导。 展开更多
关键词 船舶轨迹聚类 相似性距离 带有噪声的基于密度的空间聚类(DBSCAN) 豪斯多夫(Hausdorff)距离 动态时间规整
在线阅读 下载PDF
概念嵌入增强的可解释图像聚类
10
作者 王翔 刘华锋 +3 位作者 景丽萍 于剑 郭龙腾 杨雅君 《计算机学报》 北大核心 2026年第4期742-759,共18页
作为无监督学习领域的基础性任务,聚类分析在众多数据场景中具有核心应用价值。当其与深度神经网络及大语言模型集成时,所形成的深度聚类技术展现出解析高维图像数据复杂结构的强大能力。然而,现有深度聚类方法通常采用隐式方式耦合数... 作为无监督学习领域的基础性任务,聚类分析在众多数据场景中具有核心应用价值。当其与深度神经网络及大语言模型集成时,所形成的深度聚类技术展现出解析高维图像数据复杂结构的强大能力。然而,现有深度聚类方法通常采用隐式方式耦合数据的全部特征维度,以捕获非线性流形结构。这种“黑箱”特性导致模型决策难以被直观解析,进而限制了其在城市规划、医疗诊断等高风险敏感领域的应用。为应对上述挑战,本文提出一种概念嵌入增强的可解释图像聚类框架,通过跨模态语义转换机制提升聚类结果的可解释性。具体而言,本文创新地构建了一个数据自适应的文本概念生成器,能够在无监督标签缺失的条件下,自动挖掘数据集中潜在的高层语义概念;同时,设计了概念表征对齐模块和聚类决策修正模块,使模型在保持聚类性能的基础上,能够输出符合人类认知的语义解释。在六个基准图像数据集上的实验表明,所提方法不仅在聚类准确性方面表现优越,同时也显著提升了聚类结果的可解释性。 展开更多
关键词 可解释聚类 图像聚类 概念瓶颈模型 自监督学习 最大编码率约束
在线阅读 下载PDF
基于改进ISODATA算法的变电站负荷特性聚类
11
作者 蒋达飞 艾洪克 +3 位作者 孟巧 董彪 翁一帆 张谦 《中国电力》 北大核心 2026年第3期125-133,共9页
新型电力系统高压配电网面临规模化、多元化负荷接入的挑战。变电站负荷聚类是精准识别用户用电规律、优化电网资源配置的核心手段,其分析结果可直接支撑电网规划、需求侧管理及新能源消纳策略制定。因此亟须通过变电站负荷曲线聚类分析... 新型电力系统高压配电网面临规模化、多元化负荷接入的挑战。变电站负荷聚类是精准识别用户用电规律、优化电网资源配置的核心手段,其分析结果可直接支撑电网规划、需求侧管理及新能源消纳策略制定。因此亟须通过变电站负荷曲线聚类分析,精准解析差异化负荷模式及其动态演化规律,为智能配电网运行决策提供数据支撑。针对迭代式自组织数据分析算法(iterative self organizing data analysis techniques algorithm,ISODATA)存在收敛速度慢和难以捕捉数据高维特征的局限,尤其是负荷数据的动态特性捕捉不足的问题,分别通过优化初始聚类中心选取策略与引入核函数映射机制,以提升算法对变电站负荷曲线高维特征的解析能力。在完成缺失值填补与数据标准化预处理后,本算法首先基于最大距离准则优化初始聚类中心选取,最大化初始中心间异质性以提升聚类稳定性;其次,引入核函数映射机制,映射负荷曲线至高维空间聚类,实现高维特征的显式解耦与聚类分析。仿真结果表明,在特征提取能力方面,改进算法生成的主成分分析(principal component analysis,PCA)特征空间中变电站四季负荷特征呈现显著差异性,能更好地获取负荷高维特征;在算法性能方面,改进算法使执行时间减少32.8%,聚类评价指标戴维斯-布尔丁指数(davies-bouldin index,DBI)降低了29.1%,邓恩指数(dunn index,DI)提高了42.9%,验证了所提算法的有效性和优越性。 展开更多
关键词 变电站 负荷聚类 聚类效果指标
在线阅读 下载PDF
基于动态资源分配的C-V2X拥塞控制策略
12
作者 陈潭 江晓明 +1 位作者 丛滢淇 江宇杰 《现代电子技术》 北大核心 2026年第7期7-11,18,共6页
蜂窝车联网(C-V2X)技术作为下一代智能交通系统的重要组成部分,提升了车辆间的通信效率和安全性。然而,现有的消息访问机制在高密度条件下容易产生冲突并导致传输失效。鉴于此,文中提出一种D-SPS的信道资源分配策略,专注于高密度情况下... 蜂窝车联网(C-V2X)技术作为下一代智能交通系统的重要组成部分,提升了车辆间的通信效率和安全性。然而,现有的消息访问机制在高密度条件下容易产生冲突并导致传输失效。鉴于此,文中提出一种D-SPS的信道资源分配策略,专注于高密度情况下的拥塞控制。该策略根据车道路段进行带状分簇,并依据集群内节点密度进行通信资源的动态分配,在一定程度上缓解了各车道节点密度在特定时间段分布不均匀导致的拥塞问题。另外,在上述策略的基础上,进一步完善车道簇头选举策略,以降低选举开销,提高集群稳定性。建模计算和数值比较结果表明,所提出的优化策略能够较为有效地降低当前Mode 2机制的信道拥塞,并且在高密度数据交互场景下,对安全信标的传输时效性和高比特率信息的包投递率性能有着较为不错的提升。 展开更多
关键词 车联网 C-V2X Mode 2 拥塞控制 分簇 簇头选举 安全服务
在线阅读 下载PDF
城市群建设对城市创新的影响效应——来自11个国家级城市群规划的证据
13
作者 孙涛 王特 《经济与管理评论》 北大核心 2026年第1期41-53,共13页
城市群的发展对于推进全国统一大市场建设和构建协同高效的区域创新格局具有重要意义。将11个国家级城市群规划视为一项准自然实验,采用双重差分法实证评估城市群建设对城市创新的影响。结果显示,城市群规划显著提升了城市创新水平,该... 城市群的发展对于推进全国统一大市场建设和构建协同高效的区域创新格局具有重要意义。将11个国家级城市群规划视为一项准自然实验,采用双重差分法实证评估城市群建设对城市创新的影响。结果显示,城市群规划显著提升了城市创新水平,该结论在多种稳健性检验后依然成立。异质性分析结果表明,城市群规划主要提升了城市的实质性创新水平,而且该效应在多中心和中心城市集中度处于中低水平的城市群中更为凸显。机制检验发现,城市群规划显著促进了城市群区域的市场整合,并通过优化资本和人才要素配置、强化知识溢出以及激发市场竞争来促进城市创新。因此,积极推进城市群规划建设对于破解市场分割难题和充分挖掘大市场优势,从而助力城市创新长效提升具有重要意义。 展开更多
关键词 城市群建设 城市创新 市场分割 国家级城市群规划
在线阅读 下载PDF
综合医院全科门诊乏力患者特征分析
14
作者 蔡东平 任文 任菁菁 《中国全科医学》 北大核心 2026年第10期1334-1339,共6页
背景 在国内综合性医院全科医学科因未分化疾病(如乏力等)就诊的患者占很大的比例,但针对乏力就诊患者的人群特征和病因等尚缺少相关的研究。目的 分析乏力患者的症状特征,为全科医生如何接诊乏力患者和对乏力做出解释提供参考。方法 选... 背景 在国内综合性医院全科医学科因未分化疾病(如乏力等)就诊的患者占很大的比例,但针对乏力就诊患者的人群特征和病因等尚缺少相关的研究。目的 分析乏力患者的症状特征,为全科医生如何接诊乏力患者和对乏力做出解释提供参考。方法 选取2022年6月—2023年6月在浙江大学医学院附属第一医院(庆春院区)全科医学科门诊就诊的患者为研究对象。通过门诊电子病历系统获取乏力患者的基本情况,包括性别、年龄、就诊日期、主诉、现病史、既往史。分析其合并症状特点,进行人群聚类分析和病因分析。结果 共660例患者纳入分析,新型冠状病毒感染(以下简称新冠)前与新冠后乏力患者性别、年龄、乏力是否为第一就诊原因、辅助检查依从性比较,差异无统计学意义(P>0.05);新冠前与新冠后乏力患者其他科室就诊情况比较,差异有统计学意义(P<0.001)。新冠前与新冠后的乏力患者睡眠障碍、情绪问题、打鼾比例比较,差异有统计学意义(P<0.05)。新冠前与新冠后,无论男女乏力患者,合并症状均集中在睡眠障碍、体质量下降、头晕、胸闷、心悸和情绪问题。根据合并的症状群,聚类分析结果提示乏力患者可分为6种群体,对应内分泌系统疾病、精神系统疾病、消化系统疾病、心血管系统疾病、血液系统疾病、神经系统疾病导致的症状群。新冠前与新冠后乏力患者病因分布中的糖尿病、精神系统疾病、生理性原因的占比比较,差异有统计学意义(P<0.05)。结论 乏力患者常合并有其他症状,全科医生接诊乏力患者,应促使患者提高依从性,完善相关检查,尽可能明确病因。新冠有诱导甲状腺、胰腺自身免疫损伤的风险,对于没有查出原因的乏力患者,需谨慎使用“长新冠”来解释。 展开更多
关键词 全科医学 乏力 未分化疾病 聚类分析 症状群
暂未订购
基于样本互补锚点图的缺失多视图聚类算法
15
作者 刘小兰 徐宇鸿 《华南理工大学学报(自然科学版)》 北大核心 2026年第2期16-24,共9页
随着多视图数据在现实场景中得到广泛应用,如何处理缺失视图下的聚类问题已成为机器学习领域的重要挑战。传统锚点图聚类算法依赖完整实例构建锚点图,这导致其在高缺失率下因锚点不足难以表征数据结构,在低缺失率时又无法发挥锚点的优... 随着多视图数据在现实场景中得到广泛应用,如何处理缺失视图下的聚类问题已成为机器学习领域的重要挑战。传统锚点图聚类算法依赖完整实例构建锚点图,这导致其在高缺失率下因锚点不足难以表征数据结构,在低缺失率时又无法发挥锚点的优势。针对传统锚点图聚类算法中存在的锚点选择受限、权重分配僵化和计算复杂度高的问题,该文提出了一种基于样本互补锚点图的缺失多视图聚类算法(IMVC-SAC)。该算法首先设计跨视图锚点互补机制,通过在共有样本与视图特有样本中自适应选取锚点,以解决高缺失率下数据结构表征不足的问题;然后建立缺失模式感知的权重模型,依据样本的缺失模式与程度调整视图对相似矩阵的贡献度;最后利用双随机非负矩阵可分解特性,将谱聚类的时间复杂度从样本规模的立方阶复杂度优化至线性阶复杂度。在5个公开数据集上的实验结果表明,该算法的聚类性能优于目前主流算法,尤其在高缺失率下仍能保持较好的聚类效果,验证了其鲁棒性与有效性。 展开更多
关键词 缺失多视图聚类 锚点图 样本互补 相似矩阵融合 谱聚类
在线阅读 下载PDF
ICBV:一种基于BERT变分自编码的半监督意图聚类方法
16
作者 赵锦栎 勾智楠 高凯 《计算机工程与科学》 北大核心 2026年第2期277-285,共9页
意图聚类在自然语言处理中具有重要价值,面对有限的标记数据时,现有方法往往难以捕捉到离散文本表示中复杂的语义信息,并且未标记数据常常包含噪声,直接为其赋予伪标签可能会对模型的训练造成负面影响,因此如何有效利用未标记数据并减... 意图聚类在自然语言处理中具有重要价值,面对有限的标记数据时,现有方法往往难以捕捉到离散文本表示中复杂的语义信息,并且未标记数据常常包含噪声,直接为其赋予伪标签可能会对模型的训练造成负面影响,因此如何有效利用未标记数据并减少噪声成为关键问题。为了解决这一问题,提出了一种名为ICBV的半监督聚类方法。该方法结合少量有标签数据和基于BERT编码的变分自编码器进行预训练表示学习,并随后在训练阶段采用质心引导策略。ICBV能够对输入文本进行编码并计算潜在变量,从而捕捉数据的潜在空间表示。ICBV相较传统聚类方法,还利用了深度学习的特性,以便更有效地捕捉数据的复杂结构和非线性关系。在BANKING77数据集上的不同已知类比率设置下的实验中,准确率相对最新基线方法有所提高,验证了VAE编码获得潜在变量表示的有效性和聚类方法的鲁棒性。该方法为自然语言处理领域中意图聚类中的标记数据不足和噪声问题提供了一种解决方案。 展开更多
关键词 半监督聚类 意图聚类 变分自编码器(VAE)
在线阅读 下载PDF
基于最小生成树与统计特征的层次聚类算法
17
作者 刘子康 周长杰 姚卫 《河北科技大学学报》 北大核心 2026年第1期49-59,共11页
针对Chameleon算法在参数敏感性、噪声鲁棒性及计算效率上的不足,提出一种基于最小生成树与统计特征的层次聚类算法(statistical-MST integrated hierarchical clustering algorithm,SHCA)。采用最小生成树构建稀疏图,消除人工参数干预... 针对Chameleon算法在参数敏感性、噪声鲁棒性及计算效率上的不足,提出一种基于最小生成树与统计特征的层次聚类算法(statistical-MST integrated hierarchical clustering algorithm,SHCA)。采用最小生成树构建稀疏图,消除人工参数干预,利用最小生成树的全局最优性避免跨簇伪连接;设计动态统计合并策略,结合局部距离阈值过滤噪声,并通过簇间连通性检验,迭代合并子簇,确保簇内紧密性与簇间分离性;在20个人工数据集与10个真实数据集上进行对比实验。结果表明:SHCA的聚类性能优于对比算法;针对部分数据集表现下降的情况,分析发现流形重叠是主要影响因素。SHCA有效提升了聚类精度与结果稳定性,为后续大规模、复杂流形数据的聚类研究提供了参考。 展开更多
关键词 人工智能理论 聚类 层次聚类算法 最小生成树 动态统计合并策略
在线阅读 下载PDF
利用形状保持采样的任意形状聚类方法
18
作者 周泉 薛亮 +1 位作者 黄浩 应时 《小型微型计算机系统》 北大核心 2026年第3期522-530,共9页
任意形状聚类旨在快速、准确地分析识别出数据集中具有任意分布形状的数据簇.大多数现有方法具有二次方以上的时间复杂度.为降低计算代价,部分方法通过下采样来减少待分析的数据量,但采样结果常不能保持原始的数据分布形状,进而影响最... 任意形状聚类旨在快速、准确地分析识别出数据集中具有任意分布形状的数据簇.大多数现有方法具有二次方以上的时间复杂度.为降低计算代价,部分方法通过下采样来减少待分析的数据量,但采样结果常不能保持原始的数据分布形状,进而影响最终聚类结果.本文提出一种利用形状保持采样的任意形状聚类方法.首先,在原始数据集上进行下采样,使采样点均匀连续地分布于原始的数据分布内,从而保持原始的数据分布形状;然后,基于采样点选取代表点并调整各代表点位置,使其与近邻的同质代表点靠拢,提升邻近代表点属于同一聚类的概率;最后,基于类间最小距离对代表点进行凝聚聚类,将邻近代表点逐渐合并到同一聚类中.实验结果表明,本文方法在聚类结果准确性、运行效率上均优于现有代表性方法. 展开更多
关键词 任意形状聚类 形状保持采样 凝聚聚类
在线阅读 下载PDF
核心图构造驱动的大规模高光谱图像高效聚类方法
19
作者 冯晓凤 杨易扬 +1 位作者 杨戈平 巩志国 《计算机工程与应用》 北大核心 2026年第6期279-292,共14页
大规模高光谱图像(hyperspectral image,HSI)聚类因其像素数量庞大、光谱波段丰富,面临计算复杂度和可扩展性上的重大挑战。为解决这一问题,提出了一种核心图(core graph,CG)构建方法,通过选择一组核心点代表原始高光谱图像的像素,构建... 大规模高光谱图像(hyperspectral image,HSI)聚类因其像素数量庞大、光谱波段丰富,面临计算复杂度和可扩展性上的重大挑战。为解决这一问题,提出了一种核心图(core graph,CG)构建方法,通过选择一组核心点代表原始高光谱图像的像素,构建核心图以有效捕捉原始高光谱图像数据的全局和局部空间结构,同时显著降低非线性流形学习的复杂性,从而减少内存需求并提升计算效率。该方法具有算法无关性,能够灵活嵌入不同的聚类框架中。结合谱聚类(spectral clustering,SC)和密度峰值聚类(density peak clustering,DPC),分别提出了核心图驱动的谱聚类算法(core graph-based spectral clustering,CGSC)和核心图驱动的密度峰值聚类算法(core graph-based density peak clustering,CGDPC)。实验结果表明,核心图驱动的聚类算法在多个HSI数据集上展现了卓越的计算效率和聚类性能,适用于大规模高光谱图像的聚类任务。 展开更多
关键词 核心图 大规模 高光谱图像 谱聚类 密度峰值聚类
在线阅读 下载PDF
阈值约束的加权K均值聚类自动速度拾取方法
20
作者 谢俊法 刘文卿 +3 位作者 盛萍 吴杰 伍敦仕 黄紫晨 《石油地球物理勘探》 北大核心 2026年第1期86-97,共12页
常规K均值聚类方法需要预先给定聚类个数及初始值,拾取结果是能量团的几何中心且受初始值的影响较大。为此,文章提出了阈值约束的加权K均值聚类自动速度拾取方法,采用一个可变化的速度点阈值产生多个长度合理的矩形,通过矩形及先验速度... 常规K均值聚类方法需要预先给定聚类个数及初始值,拾取结果是能量团的几何中心且受初始值的影响较大。为此,文章提出了阈值约束的加权K均值聚类自动速度拾取方法,采用一个可变化的速度点阈值产生多个长度合理的矩形,通过矩形及先验速度获得聚类中心的数量、初始时间和初始速度;同时利用先验速度限定速度拾取范围,设定常数阈值及自适应阈值,剔除振幅较小的速度点,减少参与计算的速度点数,从而提高计算效率。加权K均值聚类算法利用速度点的振幅计算权重,同时通过距离阈值逐步剔除远离中心的点,使聚类中心与能量团中心重合。最后,通过与先验速度的斜率对比来剔除多次波,使结果更准确。模型和实际资料的处理结果表明,文中提出的方法能在保证精度的前提下智能拾取地震速度,具有较高的效率。 展开更多
关键词 速度拾取 聚类中心 加权K均值聚类 先验速度 无监督
在线阅读 下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部