期刊文献+
共找到29篇文章
< 1 2 >
每页显示 20 50 100
Parallel Inference for Real-Time Machine Learning Applications
1
作者 Sultan Al Bayyat Ammar Alomran +3 位作者 Mohsen Alshatti Ahmed Almousa Rayyan Almousa Yasir Alguwaifli 《Journal of Computer and Communications》 2024年第1期139-146,共8页
Hyperparameter tuning is a key step in developing high-performing machine learning models, but searching large hyperparameter spaces requires extensive computation using standard sequential methods. This work analyzes... Hyperparameter tuning is a key step in developing high-performing machine learning models, but searching large hyperparameter spaces requires extensive computation using standard sequential methods. This work analyzes the performance gains from parallel versus sequential hyperparameter optimization. Using scikit-learn’s Randomized SearchCV, this project tuned a Random Forest classifier for fake news detection via randomized grid search. Setting n_jobs to -1 enabled full parallelization across CPU cores. Results show the parallel implementation achieved over 5× faster CPU times and 3× faster total run times compared to sequential tuning. However, test accuracy slightly dropped from 99.26% sequentially to 99.15% with parallelism, indicating a trade-off between evaluation efficiency and model performance. Still, the significant computational gains allow more extensive hyperparameter exploration within reasonable timeframes, outweighing the small accuracy decrease. Further analysis could better quantify this trade-off across different models, tuning techniques, tasks, and hardware. 展开更多
关键词 machine learning Models Computational Efficiency Parallel Computing Systems Random Forest Inference Hyperparameter Tuning Python frameworks (TensorFlow pytorch Scikit-Learn) High-Performance Computing
在线阅读 下载PDF
使用开源代码训练大模型的著作权法评价——以全球首例机器学习诉讼为研究样本 被引量:2
2
作者 张韬略 《知识产权》 北大核心 2025年第3期47-70,共24页
从法解释论视角评价使用开源代码训练大模型行为的著作权法合法性时,应先分析在先许可协议对开源代码使用的约定。尽管大模型开发商可能违反了开源许可协议,且在模型训练或者输出阶段可能存在复制、修改、传播开源代码乃至删除作品来源... 从法解释论视角评价使用开源代码训练大模型行为的著作权法合法性时,应先分析在先许可协议对开源代码使用的约定。尽管大模型开发商可能违反了开源许可协议,且在模型训练或者输出阶段可能存在复制、修改、传播开源代码乃至删除作品来源信息的行为,但训练数据集不公开在多方面限制了著作权侵权认定。司法机关以大模型输出端为规制对象并以合理使用为利益调节器的务实思路,向大模型产业传递了友好信号,刺激了降重技术的开发,并可能进一步降低著作权人提起侵权诉讼的概率和理论正当性。个案分析过程还暴露出我国著作权法在应对大模型训练著作权侵权问题时的优缺点。我国亟需修正合理使用制度以应对大模型开发对数据训练的需求,同时应从立法和技术角度推动训练数据著作权权属信息的透明化,以保护作者著作人身权和电子权利管理信息。 展开更多
关键词 开源代码 大模型 机器学习 著作权侵权 合理使用
在线阅读 下载PDF
面向多障碍物场景的车辆紧急避撞耦合决策与轨迹规划方法
3
作者 关永学 刘森海 +3 位作者 韩勇 徐莉 舒伟斌 樊晨旭 《汽车安全与节能学报》 北大核心 2025年第6期945-954,共10页
为提高车辆在多障碍物高速场景下的紧急避撞能力,解决决策规划因计算复杂而难以实时响应的问题,提出了一种耦合决策与轨迹规划的一体化框架。通过建立多车非合作博弈模型描述动态交互行为,并设计基于威胁评估的顺序决策机制,将高维博弈... 为提高车辆在多障碍物高速场景下的紧急避撞能力,解决决策规划因计算复杂而难以实时响应的问题,提出了一种耦合决策与轨迹规划的一体化框架。通过建立多车非合作博弈模型描述动态交互行为,并设计基于威胁评估的顺序决策机制,将高维博弈问题简化为序列化的单障碍物交互过程;基于深度学习框架PyTorch实现图形处理器(GPU)加速轨迹优化算法,在满足车辆动力学约束的同时生成安全、舒适的避撞轨迹。结果表明该方法在典型高速场景下的决策平均计算时间为20~50 ms,轨迹规划耗时33.1~149.1 ms,优于传统模型预测控制(MPC)方法;规划轨迹横向速度与加速度分别控制在4.0 m/s和4.0 m/s^(2)以内,符合安全性和舒适性要求。对规划轨迹进行跟踪,横向跟踪误差和速度误差最大分别为0.22 m和0.59 m/s,满足高速紧急避撞要求,在CARLA仿真中,所有场景均成功避撞。所提框架能有效平衡决策最优性与实时性,为复杂场景下的车辆主动安全提供可靠解决方案。 展开更多
关键词 汽车主动安全 复杂场景 紧急避撞决策 轨迹规划与跟踪 深度学习框架pytorch
在线阅读 下载PDF
基于机器学习的开源软件项目维护状态识别
4
作者 罗诗雨 李馨蕾 +3 位作者 罗俊韬 王新 张国锋 陈阳 《软件学报》 北大核心 2025年第11期5082-5101,共20页
随着开源软件的广泛普及和迅速发展,对开源软件项目的维护工作成为软件开发周期中的一个关键环节.作为全球范围内代表性的开发者社区, GitHub往往在同一领域有着大量功能相似的软件项目仓库,导致用户在选择合适的项目仓库进行使用或进... 随着开源软件的广泛普及和迅速发展,对开源软件项目的维护工作成为软件开发周期中的一个关键环节.作为全球范围内代表性的开发者社区, GitHub往往在同一领域有着大量功能相似的软件项目仓库,导致用户在选择合适的项目仓库进行使用或进一步开发时面临挑战,因此协助用户准确识别项目仓库的维护状态具有重要的现实意义.然而, GitHub平台并未提供可以直接衡量项目仓库维护状态的信息.提出一个基于机器学习的项目仓库维护状态自动识别方法,设计实现一套基于机器学习的分类模型GitMT,通过有效整合动态时间序列特征和描述性特征,可以实现项目仓库“活跃”与“未维护”状态的准确识别.经过一系列基于大规模真实数据的实验验证, GitMT在项目仓库维护状态的识别任务中AUC值达到了0.964.此外,还构建一个以软件项目仓库维护状态为中心的开源数据集——GitMT Dataset:https://doi.org/10.7910/DVN/OJ2NI3. 展开更多
关键词 维护状态识别 开源软件项目 机器学习 动态时间序列特征
在线阅读 下载PDF
基于多源开放数据的城市非正式住区空间分布及趋势研究
5
作者 朱静怡 陈爽 《热带地理》 北大核心 2025年第12期2265-2280,共16页
了解非正式住区的位置规模、分布规律和未来土地需求对于减少贫困、优化土地利用和促进城市可持续发展具有重要意义。文章以撒哈拉以南非洲城市内罗毕和达累斯萨拉姆为例,基于Google Earth高分辨率影像、OpenStreetMap数据和建筑轮廓数... 了解非正式住区的位置规模、分布规律和未来土地需求对于减少贫困、优化土地利用和促进城市可持续发展具有重要意义。文章以撒哈拉以南非洲城市内罗毕和达累斯萨拉姆为例,基于Google Earth高分辨率影像、OpenStreetMap数据和建筑轮廓数据,利用机器学习分类等方法识别非正式住区,进而探究其空间分布规律和趋势。结果表明:1)在3种机器学习算法中,随机森林算法在非正式住区提取上的总体表现优于逻辑回归和支持向量机,Kappa系数达85%;建筑物特征对分类的总贡献度超过50%,起最关键作用。2)内罗毕和达累斯萨拉姆的非正式住区占城市总面积的比例分别为3.64%和21.69%,2个城市各识别出7个明显的集聚区,人口规模分别为3.47万~31.35万人、2.93万~129.41万人。非正式住区主要分布在缓坡、主要道路和水系沿线地区,且多位于城市中心区5 km以外,但在工业指向性上内罗毕显著高于达累斯萨拉姆。3)内罗毕非正式住区人均建筑面积仅为达累斯萨拉姆的一半,其人口拥挤和房屋紧凑程度更为严重。预计至2050年,2座城市将面临日益严峻的土地资源紧张困境与住区正规化挑战。因此,非正式住区的改造与升级亟待立足长远,采取前瞻性策略加以推进。 展开更多
关键词 城市非正式住区 机器学习 多源开放数据 土地资源 非洲
在线阅读 下载PDF
面向开源视频的深度学习情报分析系统设计与实现
6
作者 鄢靖昀 姜君 曹秀云 《现代电子技术》 北大核心 2025年第12期167-178,共12页
针对传统视频情报分析中信息提取效率低下的问题,设计一种基于深度学习的人机交互式视频情报分析系统,以满足快速提取大量视频关键情报的需求。系统框架围绕数据采集、存储、处理及应用进行分层设计,采用组件化设计实现功能模块的独立运... 针对传统视频情报分析中信息提取效率低下的问题,设计一种基于深度学习的人机交互式视频情报分析系统,以满足快速提取大量视频关键情报的需求。系统框架围绕数据采集、存储、处理及应用进行分层设计,采用组件化设计实现功能模块的独立运行,并集成基于深度学习的自动语音识别、神经机器翻译、光学字符识别以及大模型文本摘要生成等前沿技术,提供端到端的解决方案,实现全面的视频分析功能。功能测试结果显示,所有模块均能按设计要求正常运行。性能测试结果表明,系统在处理大规模视频数据的实时环境中表现稳定、性能优异,高并发情况下响应时间在3 s以内,支持最多2万并发用户。所设计系统不仅能高效提取视频情报,还拥有直观的用户交互界面,可以提供多样化的情报分析应用服务,并满足大规模用户在视频分析场景下的业务需求。 展开更多
关键词 情报分析 开源视频 深度学习 自动语音识别 神经机器翻译 光学字符识别
在线阅读 下载PDF
后人类视域中的机器艺术
7
作者 郑达 焦雪 陈曦 《当代美术家》 2025年第6期15-23,共9页
经由后现代主义思潮的洗礼,“主体”已失去了其先验的、理性的光环。当前以人工智能、生物工程为代表的现代科技则进一步冲击了人对自身的认知以及其在世界上的定位,真实世界与虚拟世界的边界不复存在,人类与后人类共同体景观自然形成... 经由后现代主义思潮的洗礼,“主体”已失去了其先验的、理性的光环。当前以人工智能、生物工程为代表的现代科技则进一步冲击了人对自身的认知以及其在世界上的定位,真实世界与虚拟世界的边界不复存在,人类与后人类共同体景观自然形成。本文从后人类的视角出发,描绘人工智能技术介入艺术创作时所引发的创作形式、审美观念和审美主体的转变,进一步总结和分析“非人类的自主性”艺术的作品特性与创作范式,并提出运用“系统美学”“行为美学”和“机器系统的分类法”三大模型对机器学习艺术实践进行层次分析的具体方法。 展开更多
关键词 跨媒介艺术 后人类 机器艺术 开源技术 传感器 机器学习
在线阅读 下载PDF
面向电力需求分析的多源数据处理算法设计 被引量:1
8
作者 凌荣光 许巍 +2 位作者 严若婧 王妍 梁玉洁 《电子设计工程》 2025年第5期147-151,共5页
针对电力需求端复杂度提高所带来的电力负荷预测精度差的问题,文中基于电力系统数供平台的多源数据提出了一种面向电力需求分析的负荷预测算法,以此辅助提高电网的运行控制水平。该算法利用SVM算法提取输入数据特征,对于SVM算法参数较... 针对电力需求端复杂度提高所带来的电力负荷预测精度差的问题,文中基于电力系统数供平台的多源数据提出了一种面向电力需求分析的负荷预测算法,以此辅助提高电网的运行控制水平。该算法利用SVM算法提取输入数据特征,对于SVM算法参数较为复杂的缺点,通过引入GWO算法对SVM的初始化参数进行优化。利用LightGBM模型在搜索和分割领域的性能优势,对数据特征展开训练并输出负荷预测结果,同时基于Stacking集成学习框架,将所提算法进行融合,从而有效提升了算法的运算效率及预测精度。在实验结果中,所提算法的计算效率较原算法有显著提升,迭代次数减少了近50%,性能参数也在对比算法中处于领先,体现了算法性能的优越性。 展开更多
关键词 多源数据分析 电力负荷预测 支持向量机 灰狼优化算法 LightGBM 集成学习框架
在线阅读 下载PDF
基于机器学习算法的开源情报异常行为检测研究
9
作者 林逸飞 张璐 《湖南警察学院学报》 2025年第4期14-24,共11页
在人工智能与大数据技术深度融合的时代背景下,公安机关在利用开源情报(OSINT)进行异常行为分析时,面临数据源扩张和数据规模激增带来的挑战,传统检测方法已难以有效应对复杂检测任务。对此,应构建多模态开源情报异常检测框架,通过边缘... 在人工智能与大数据技术深度融合的时代背景下,公安机关在利用开源情报(OSINT)进行异常行为分析时,面临数据源扩张和数据规模激增带来的挑战,传统检测方法已难以有效应对复杂检测任务。对此,应构建多模态开源情报异常检测框架,通过边缘计算与云计算协同机制优化数据传输效率,利用自适应采样策略与主动学习机制破解数据标注难题,引入深度学习模型实现图像去噪、音频降噪及文本语义增强的效果,以提升公安部门对异常行为的预警响应与应急处置能力,为维护社会稳定提供关键的技术支撑。 展开更多
关键词 机器学习 开源情报 异常行为检测 多模态数据
在线阅读 下载PDF
联邦学习开源框架综述 被引量:13
10
作者 林伟伟 石方 +3 位作者 曾岚 李董东 许银海 刘波 《计算机研究与发展》 EI CSCD 北大核心 2023年第7期1551-1580,共30页
近年来,联邦学习作为破解数据共享壁垒的有效解决方案被广泛关注,并被逐步应用于医疗、金融和智慧城市等领域.联邦学习框架是联邦学习学术研究和工业应用的基石.虽然Google、OpenMined、微众银行和百度等企业开源了各自的联邦学习框架... 近年来,联邦学习作为破解数据共享壁垒的有效解决方案被广泛关注,并被逐步应用于医疗、金融和智慧城市等领域.联邦学习框架是联邦学习学术研究和工业应用的基石.虽然Google、OpenMined、微众银行和百度等企业开源了各自的联邦学习框架和系统,然而,目前缺少对这些联邦学习开源框架的技术原理、适用场景、存在问题等的深入研究和比较.为此,根据各开源框架在业界的受众程度,选取了目前应用较广和影响较大的联邦学习开源框架进行深入研究.针对不同类型的联邦学习框架,首先分别从系统架构和系统功能2个层次对各框架进行剖析;其次从隐私机制、机器学习算法、计算范式、学习类型、训练架构、通信协议、可视化等多个维度对各框架进行深入对比分析.而且,为了帮助读者更好地选择和使用开源框架实现联邦学习应用,给出了面向2个不同应用场景的联邦学习实验.最后,基于目前框架存在的开放性问题,从隐私安全、激励机制、跨框架交互等方面讨论了未来可能的研究发展方向,旨在为开源框架的开发创新、架构优化、安全改进以及算法优化等提供参考和思路. 展开更多
关键词 联邦学习 开源框架 模型训练 机器学习 大数据
在线阅读 下载PDF
基于MapReduce和Spark的大数据主动学习比较研究 被引量:6
11
作者 翟俊海 齐家兴 +3 位作者 沈矗 宋丹丹 王谟瀚 田石 《计算机工程与科学》 CSCD 北大核心 2019年第10期1715-1722,共8页
在我们以前的工作中,提出了基于MapReduce的大数据主动学习算法。在本文中,将这一算法移植到Spark环境,提出了基于Spark的大数据主动学习算法,并对基于MapReduce和Spark的2种大数据主动学习算法从运行时间、文件数目、同步数目和内存耗... 在我们以前的工作中,提出了基于MapReduce的大数据主动学习算法。在本文中,将这一算法移植到Spark环境,提出了基于Spark的大数据主动学习算法,并对基于MapReduce和Spark的2种大数据主动学习算法从运行时间、文件数目、同步数目和内存耗费4个方面进行了比较研究,得出了一些有价值的结论,这些结论将为相关研究人员提供很好的帮助。 展开更多
关键词 大数据 机器学习 主动学习 样例选择 开源框架
在线阅读 下载PDF
一种Linux安全漏洞修复补丁自动识别方法 被引量:11
12
作者 周鹏 武延军 赵琛 《计算机研究与发展》 EI CSCD 北大核心 2022年第1期197-208,共12页
及时获取并应用安全漏洞修复补丁对保障服务器用户的安全至关重要.但是,学者和机构研究发现开源软件维护者经常悄无声息地修复安全漏洞,比如维护者88%的情况在发布软件新版本时才在发行说明中告知用户修复了安全漏洞,并且只有9%的漏洞... 及时获取并应用安全漏洞修复补丁对保障服务器用户的安全至关重要.但是,学者和机构研究发现开源软件维护者经常悄无声息地修复安全漏洞,比如维护者88%的情况在发布软件新版本时才在发行说明中告知用户修复了安全漏洞,并且只有9%的漏洞修复补丁明确给出对应的CVE(common vulnerabilities and exposures)标号,只有3%的修复会及时主动通知安全监控服务提供者.这导致在很多情况下,安全工程师不能通过补丁的代码和描述信息直接区分漏洞修复、Bug修复、功能性补丁.造成漏洞修复补丁不能被用户及时识别和应用,同时用户从大量的补丁提交中识别漏洞修复补丁代价很高.以代表性Linux内核为例,给出一种自动识别漏洞修复补丁的方法,该方法为补丁的代码和描述部分分别定义特征,构建机器学习模型,训练学习可区分安全漏洞补丁的分类器.实验表明,该方法可以取得91.3%的精确率、92%的准确率、87.53%的召回率,并将误报率降低到5.2%,性能提升明显. 展开更多
关键词 漏洞修复补丁自动识别 安全漏洞修复 LINUX内核 机器学习 开源软件社区
在线阅读 下载PDF
开源生态系统中项目与开发者推荐
13
作者 赵海燕 李娜 +1 位作者 陈庆奎 曹健 《小型微型计算机系统》 CSCD 北大核心 2021年第11期2259-2268,共10页
开源生态系统中的项目与开发者推荐,是促进开源项目快速发展的实际需求,也是软件智能化开发领域的一个研究热点.通过探究开发者加入开源项目的动机、合作偏好、贡献方式,从而提出更为合理的项目及开发者推荐模型,有助于推动开源项目的开... 开源生态系统中的项目与开发者推荐,是促进开源项目快速发展的实际需求,也是软件智能化开发领域的一个研究热点.通过探究开发者加入开源项目的动机、合作偏好、贡献方式,从而提出更为合理的项目及开发者推荐模型,有助于推动开源项目的开展,促进、调节、维持开源社区的发展.本文对开源生态系统中项目及开发者推荐的相关研究进行综述,系统地对开源项目及成员特性、项目与成员关系、项目及开发者推荐方法、数据集以及评价指标等进行了全面总结.最后,对该领域所面临的挑战以及未来的研究方向进行了展望. 展开更多
关键词 项目与开发者推荐 开源项目 机器学习 推荐系统
在线阅读 下载PDF
基于盲源分离和机器学习的光伏并网逆变器故障诊断 被引量:1
14
作者 张磊 《重庆科技学院学报(自然科学版)》 CAS 2024年第3期99-104,共6页
针对光伏并网逆变器单个开关管发生开路故障不易察觉的问题,提出了一种基于盲源分离和机器学习的诊断方法。首先,采用FastICA算法实现单个开关管开路故障的判定;其次,提取旋转电流在时域和频域下的特征值;最后,以旋转电流特征值为输入... 针对光伏并网逆变器单个开关管发生开路故障不易察觉的问题,提出了一种基于盲源分离和机器学习的诊断方法。首先,采用FastICA算法实现单个开关管开路故障的判定;其次,提取旋转电流在时域和频域下的特征值;最后,以旋转电流特征值为输入、逆变器工作状态编码为输出进行机器学习模型训练,并对模型进行交叉验证。仿真实验结果表明,该方法的开路故障诊断准确率较高。 展开更多
关键词 光伏并网逆变器 单管开路故障 盲源分离 机器学习
在线阅读 下载PDF
基于开源框架的移动学习平台构建与应用
15
作者 林月钗 梁淘 《福建工程学院学报》 CAS 2016年第6期547-552,共6页
通过分析比较不同的构建方式,指出了利用Wei PHP开源框架的方便性和可推广性,详细介绍了移动学习平台的构建过程及功能实现,最后以文献检索课为例进行了实际应用体验,为教师探索混合式教学方式提供帮助。
关键词 开源框架 移动学习 微信公众号
在线阅读 下载PDF
基于开源框架的人机交互危险姿态识别系统设计
16
作者 潘萍 彭高丰 潘凌云 《自动化与仪器仪表》 2023年第10期95-98,103,共5页
老年人因年龄增长、身体机能衰退和认知功能减弱而面临不同程度的生活危险。因此,为了及时发现、监测和处理老年人的危险姿势,从而保护老年人的安全和健康。研究提出一种融合端对端思想和卷积神经网络(Port to port convo-lutional neur... 老年人因年龄增长、身体机能衰退和认知功能减弱而面临不同程度的生活危险。因此,为了及时发现、监测和处理老年人的危险姿势,从而保护老年人的安全和健康。研究提出一种融合端对端思想和卷积神经网络(Port to port convo-lutional neural network,PTP-CNN)的老年人危险位姿虚拟模型识别算法,从而做出预防性措施或及时的护理。研究结果表明,该系统在运用PTP-CNN算法时,Epochs的训练次数为15~30之间,MSE评价指标上PTP-CNN模型分别比SW-CNN、AlexNet降低25.33%、5.17%,说明PTP-CNN模型拥有更高的准确性和精确性,可以更好地进行图像识别任务,从而及时发现老年人的危险姿势。 展开更多
关键词 深度学习 开源框架 信息采集 位姿虚拟模型 卷积神经网络 图像识别
原文传递
基于深度学习的热轧带钢头部厚度的命中预测 被引量:21
17
作者 于加学 孙杰 张殿华 《钢铁》 CAS CSCD 北大核心 2021年第9期19-25,共7页
针对热轧带钢头部厚度精度较低的问题,提出了一种基于深度学习的热轧带钢头部厚度的命中预测方法。在精轧过程中,带钢头部张力较小,且通常温度较低;同时轧机工艺参数复杂,精准设定存在困难,轧制带钢头部经常会出现厚度不合格的现象。利... 针对热轧带钢头部厚度精度较低的问题,提出了一种基于深度学习的热轧带钢头部厚度的命中预测方法。在精轧过程中,带钢头部张力较小,且通常温度较低;同时轧机工艺参数复杂,精准设定存在困难,轧制带钢头部经常会出现厚度不合格的现象。利用深度神经网络的非线性拟合能力,设计带钢头部厚度预测模型,给轧机的参数设定提供参考、提高头部厚度命中率、减少钢材浪费。深度神经网络(DNN)包含输入层、隐藏层、输出层,使用TensorFlow开源机器学习框架设计预测模型并用程序实现。调整神经网络各参数,通过研究它们对模型性能的影响,优化预测模型。最后使用多种厚度的带钢测试数据训练并检验头部厚度预测模型,结果显示,分类预测命中准确率在80%以上。 展开更多
关键词 热轧带钢 深度学习 厚度预测 头部厚度命中率 开源机器学习
原文传递
联邦学习综述:概念、技术、应用与挑战 被引量:39
18
作者 梁天恺 曾碧 陈光 《计算机应用》 CSCD 北大核心 2022年第12期3651-3662,共12页
在强调数据确权以及隐私保护的时代背景下,联邦学习作为一种新的机器学习范式,能够在不暴露各方数据的前提下达到解决数据孤岛以及隐私保护问题的目的。目前,基于联邦学习的建模方法已成为主流并且获得了很好的效果,因此对联邦学习的概... 在强调数据确权以及隐私保护的时代背景下,联邦学习作为一种新的机器学习范式,能够在不暴露各方数据的前提下达到解决数据孤岛以及隐私保护问题的目的。目前,基于联邦学习的建模方法已成为主流并且获得了很好的效果,因此对联邦学习的概念、技术、应用和挑战进行总结与分析具有重要的意义。首先,阐述了机器学习的发展历程以及联邦学习出现的必然性,并给出联邦学习的定义与分类;其次,介绍并分析了目前业界认可的三种联邦学习方法:横向联邦学习、纵向联邦学习和联邦迁移学习;然后,针对联邦学习的隐私保护问题,归纳并总结了目前常见的隐私保护技术;此外,还对联邦学习的现有主流开源框架进行了介绍与对比,同时给出了联邦学习的应用场景;最后,展望了联邦学习所面临的挑战和未来的研究方向。 展开更多
关键词 联邦学习 隐私保护 横向联邦学习 纵向联邦学习 联邦迁移学习 开源框架
在线阅读 下载PDF
开源社区众包任务的开发者推荐方法 被引量:5
19
作者 蒋竞 平源 +1 位作者 吴秋迪 张莉 《计算机科学》 CSCD 北大核心 2022年第12期99-108,共10页
Gitcoin是一个基于开源社区GitHub的众包平台。在Gitcoin中,项目团队可以发布开发任务,开发者选择感兴趣的任务并注册,发布者选择合适的开发者完成任务并发放赏金。但是一些任务因缺乏注册者而失败,部分任务未能合格完成,顺利完成的任... Gitcoin是一个基于开源社区GitHub的众包平台。在Gitcoin中,项目团队可以发布开发任务,开发者选择感兴趣的任务并注册,发布者选择合适的开发者完成任务并发放赏金。但是一些任务因缺乏注册者而失败,部分任务未能合格完成,顺利完成的任务也面临开发者注册间隔时间长的问题。因此,需要一种开发者推荐方法,快速为众包任务发现合适的开发人员,缩短开发者注册众包任务的时间,发现潜在合适的开发者并激励其注册,促进众包任务顺利完成。文中提出了一种基于LGBM分类算法的开发者推荐方法DEVRec(Developer Recommendation)。该方法提取任务特征、开发者特征、开发者和任务的关系特征,使用LGBM分类算法进行二分类,计算开发者注册任务的概率,最终得到众包任务的推荐人员列表。为了评估推荐效果,获取Gitcoin的1599个已完成众包任务、343名任务发布者和1605名开发者。实验结果显示,与对比方法Policy Model相比,DEVRec前1位、前3位、前5位和前10位推荐的准确度及MRR指标分别提高了73.11%,119.07%,86.55%,29.24%和62.27%。 展开更多
关键词 开源软件 开发者推荐 众包开发 特征提取 机器学习
在线阅读 下载PDF
利用开源框架构建基于深度神经网络的短文本分类器 被引量:2
20
作者 凡迪 付玉贞 侯彤 《四川图书馆学报》 2018年第1期23-25,共3页
讨论了如何利用免费的开源代码库,快速构建基于深度神经网络的短文本分类器,可依照中文图书标题,将图书分类为文科和理工科两类。结果显示,文本分类器的准确率在测试集上的表现达91.9%。如果对开源社区的力量加以有效利用,能使图书馆行... 讨论了如何利用免费的开源代码库,快速构建基于深度神经网络的短文本分类器,可依照中文图书标题,将图书分类为文科和理工科两类。结果显示,文本分类器的准确率在测试集上的表现达91.9%。如果对开源社区的力量加以有效利用,能使图书馆行业充分受益。 展开更多
关键词 文本分类 深度神经网络 开源库 机器学习 情报学
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部