期刊文献+
共找到2,317篇文章
< 1 2 116 >
每页显示 20 50 100
Optimization of an Artificial Intelligence Database and Camera Installation for Recognition of Risky Passenger Behavior in Railway Vehicles
1
作者 Min-kyeong Kim Yeong Geol Lee +3 位作者 Won-Hee Park Su-hwan Yun Tae-Soon Kwon Duckhee Lee 《Computers, Materials & Continua》 SCIE EI 2025年第1期1277-1293,共17页
Urban railways are vital means of public transportation in Korea.More than 30%of metropolitan residents use the railways,and this proportion is expected to increase.To enhance safety,the government has mandated the in... Urban railways are vital means of public transportation in Korea.More than 30%of metropolitan residents use the railways,and this proportion is expected to increase.To enhance safety,the government has mandated the installation of closed-circuit televisions in all carriages by 2024.However,cameras still monitored humans.To address this limitation,we developed a dataset of risk factors and a smart detection system that enables an immediate response to any abnormal behavior and intensive monitoring thereof.We created an innovative learning dataset that takes into account seven unique risk factors specific to Korean railway passengers.Detailed data collection was conducted across the Shinbundang Line of the Incheon Transportation Corporation,and the Ui-Shinseol Line.We observed several behavioral characteristics and assigned unique annotations to them.We also considered carriage congestion.Recognition performance was evaluated by camera placement and number.Then the camera installation plan was optimized.The dataset will find immediate applications in domestic railway operations.The artificial intelligence algorithms will be verified shortly. 展开更多
关键词 AI railway vehicle risk factor smart detection AI training data
在线阅读 下载PDF
Efficient deep-learning-based surrogate model for reservoir production optimization using transfer learning and multi-fidelity data
2
作者 Jia-Wei Cui Wen-Yue Sun +2 位作者 Hoonyoung Jeong Jun-Rong Liu Wen-Xin Zhou 《Petroleum Science》 2025年第4期1736-1756,共21页
In the realm of subsurface flow simulations,deep-learning-based surrogate models have emerged as a promising alternative to traditional simulation methods,especially in addressing complex optimization problems.However... In the realm of subsurface flow simulations,deep-learning-based surrogate models have emerged as a promising alternative to traditional simulation methods,especially in addressing complex optimization problems.However,a significant challenge lies in the necessity of numerous high-fidelity training simulations to construct these deep-learning models,which limits their application to field-scale problems.To overcome this limitation,we introduce a training procedure that leverages transfer learning with multi-fidelity training data to construct surrogate models efficiently.The procedure begins with the pre-training of the surrogate model using a relatively larger amount of data that can be efficiently generated from upscaled coarse-scale models.Subsequently,the model parameters are finetuned with a much smaller set of high-fidelity simulation data.For the cases considered in this study,this method leads to about a 75%reduction in total computational cost,in comparison with the traditional training approach,without any sacrifice of prediction accuracy.In addition,a dedicated well-control embedding model is introduced to the traditional U-Net architecture to improve the surrogate model's prediction accuracy,which is shown to be particularly effective when dealing with large-scale reservoir models under time-varying well control parameters.Comprehensive results and analyses are presented for the prediction of well rates,pressure and saturation states of a 3D synthetic reservoir system.Finally,the proposed procedure is applied to a field-scale production optimization problem.The trained surrogate model is shown to provide excellent generalization capabilities during the optimization process,in which the final optimized net-present-value is much higher than those from the training data ranges. 展开更多
关键词 Subsurface flow simulation Surrogate model Transfer learning Multi-fidelity training data Production optimization
原文传递
Contribution of the MERISE-Type Conceptual Data Model to the Construction of Monitoring and Evaluation Indicators of the Effectiveness of Training in Relation to the Needs of the Labor Market in the Republic of Congo
3
作者 Roch Corneille Ngoubou Basile Guy Richard Bossoto Régis Babindamana 《Open Journal of Applied Sciences》 2024年第8期2187-2200,共14页
This study proposes the use of the MERISE conceptual data model to create indicators for monitoring and evaluating the effectiveness of vocational training in the Republic of Congo. The importance of MERISE for struct... This study proposes the use of the MERISE conceptual data model to create indicators for monitoring and evaluating the effectiveness of vocational training in the Republic of Congo. The importance of MERISE for structuring and analyzing data is underlined, as it enables the measurement of the adequacy between training and the needs of the labor market. The innovation of the study lies in the adaptation of the MERISE model to the local context, the development of innovative indicators, and the integration of a participatory approach including all relevant stakeholders. Contextual adaptation and local innovation: The study suggests adapting MERISE to the specific context of the Republic of Congo, considering the local particularities of the labor market. Development of innovative indicators and new measurement tools: It proposes creating indicators to assess skills matching and employer satisfaction, which are crucial for evaluating the effectiveness of vocational training. Participatory approach and inclusion of stakeholders: The study emphasizes actively involving training centers, employers, and recruitment agencies in the evaluation process. This participatory approach ensures that the perspectives of all stakeholders are considered, leading to more relevant and practical outcomes. Using the MERISE model allows for: • Rigorous data structuring, organization, and standardization: Clearly defining entities and relationships facilitates data organization and standardization, crucial for effective data analysis. • Facilitation of monitoring, analysis, and relevant indicators: Developing both quantitative and qualitative indicators helps measure the effectiveness of training in relation to the labor market, allowing for a comprehensive evaluation. • Improved communication and common language: By providing a common language for different stakeholders, MERISE enhances communication and collaboration, ensuring that all parties have a shared understanding. The study’s approach and contribution to existing research lie in: • Structured theoretical and practical framework and holistic approach: The study offers a structured framework for data collection and analysis, covering both quantitative and qualitative aspects, thus providing a comprehensive view of the training system. • Reproducible methodology and international comparison: The proposed methodology can be replicated in other contexts, facilitating international comparison and the adoption of best practices. • Extension of knowledge and new perspective: By integrating a participatory approach and developing indicators adapted to local needs, the study extends existing research and offers new perspectives on vocational training evaluation. 展开更多
关键词 MERISE Conceptual data Model (MCD) Monitoring Indicators Evaluation of training Effectiveness training-Employment Adequacy Labor Market Information Systems Analysis Adjustment of training Programs EMPLOYABILITY Professional Skills
在线阅读 下载PDF
Inverse Estimation on Trigger Factors of Simultaneous Slope Failures with Purification of Training Data Sets
4
作者 Hirohito Kojima Ryo Sekine +1 位作者 Tomoya Yoshida Ryo Nozaki 《Journal of Earth Science and Engineering》 2013年第9期594-602,共9页
This paper presents an procedure for purifying training data sets (i.e., past occurrences of slope failures) for inverse estimation on unobserved trigger factors of "different types of simultaneous slope failures"... This paper presents an procedure for purifying training data sets (i.e., past occurrences of slope failures) for inverse estimation on unobserved trigger factors of "different types of simultaneous slope failures". Due to difficulties in pixel-by-pixel observations of trigger factors, as one of the measures, the authors had proposed an inverse analysis algorithm on trigger factors based on SEM (structural equation modeling). Through a measurement equation, the trigger factor is inversely estimated, and a TFI (trigger factor influence) map can be also produced. As a subsequence subject, a purification procedure of training data set should be constructed to improve the accuracy of TFI map which depends on the representativeness of given training data sets of different types of slope failures. The proposed procedure resamples the matched pixels between original groups of past slope failures (i.e., surface slope failures, deep-seated slope failures, landslides) and classified three groups by K-means clustering for all pixels corresponding to those slope failures. For all cases of three types of slope failures, the improvement of success rates with respect to resampled training data sets was confirmed. As a final outcome, the differences between TFI maps produced by using original and resampled training data sets, respectively, are delineated on a DIF map (difference map) which is useful for analyzing trigger factor influence in terms of "risky- and safe-side assessment" sub-areas with respect to "different types of simultaneous slope failures". 展开更多
关键词 Purification of training data simultaneous slope failures inverse analysis of unobserved trigger factor spatial data integration structural equation modeling.
在线阅读 下载PDF
ON THE PERFORMANCE OF DATA-DEPENDENT SUPERIMPOSED TRAINING WITHOUT CYCLIC PREFIX FOR SISO/MIMO SYSTEMS
5
作者 Yuan Weina Wang Ping Fan Pingzhi 《Journal of Electronics(China)》 2010年第1期37-42,共6页
Compared with channel estimation method based on explicit training sequences,bandwidth is saved for those methods using superimposed training sequences,while it is wasted when Cyclic Prefix(CP) is added.In previous wo... Compared with channel estimation method based on explicit training sequences,bandwidth is saved for those methods using superimposed training sequences,while it is wasted when Cyclic Prefix(CP) is added.In previous work of McLernon,the Mean Square Error(MSE) performance of Data-Dependent Superimposed Training(DDST) without CP for Single-Input Single-Output(SISO) system was analyzed under the assumption that the data-dependent sequence matrix was a circulant matrix and not interfered by others.In fact,for the system without CP,the data-dependent sequence matrix is not circulant any more and will be interfered.This paper derives the exact expression of MSE for the system without CP and also gives its extension to Multiple-Input Multiple-Output(MIMO) system without CP. 展开更多
关键词 data-Dependent Superimposed training(DDST) Cyclic Prefix(CP) Multiple-Input-Multiple-Output(MIMO)
在线阅读 下载PDF
人工智能大模型训练数据的风险类型与法律规制 被引量:26
6
作者 黄锫 《政法论丛》 北大核心 2025年第1期23-37,共15页
训练数据对于人工智能大模型的开发具有不可或缺的重要作用。但是基于我国现行的法律制度和大模型的技术原理,会存在训练数据侵权风险、训练数据偏差风险和训练数据泄露风险等三种风险类型。人工智能大模型训练数据的侵权风险主要包括... 训练数据对于人工智能大模型的开发具有不可或缺的重要作用。但是基于我国现行的法律制度和大模型的技术原理,会存在训练数据侵权风险、训练数据偏差风险和训练数据泄露风险等三种风险类型。人工智能大模型训练数据的侵权风险主要包括大模型预训练时使用作品类数据可能会违反《著作权法》的规定、使用个人信息数据可能会违反《个人信息保护法》的规定等两种情形。人工智能大模型训练数据的偏差风险主要包括价值性偏差风险、时效性偏差风险和真实性偏差风险等三种情形。人工智能大模型训练数据的泄露风险主要包括面向开发者的数据泄露风险、面向攻击者的数据泄露风险等两种情形。可以通过调整现行立法来满足人工智能大模型开发者的训练数据需求,通过元规制的方式激励人工智能大模型开发者防范训练数据的偏差风险,以及通过加强法定义务督促人工智能大模型开发者防范训练数据的泄露风险。 展开更多
关键词 生成式人工智能 大模型 训练数据 法律规制
在线阅读 下载PDF
Exploration and Research on the Training Mode of New Engineering Talents Under the Background of Big Data
7
作者 Bing Zhao Jie Yang +1 位作者 Dongxiang Ma Jie Zhu 《国际计算机前沿大会会议论文集》 2018年第2期48-48,共1页
关键词 BIG data NEW ENGINEERING Talents trainING
在线阅读 下载PDF
人工智能大模型训练的著作权困境及其调适路径 被引量:4
8
作者 张涛 《现代法学》 北大核心 2025年第2期189-208,共20页
人工智能大模型训练引发著作权困境,传统作品许可使用机制面临功能失灵,既有“限制与例外”条款亦存在适用难题。当前学界提出的以“非作品性使用”为代表的“根源性”权利限缩模式,以及以“文本与数据挖掘”为代表的“封闭式”权利限... 人工智能大模型训练引发著作权困境,传统作品许可使用机制面临功能失灵,既有“限制与例外”条款亦存在适用难题。当前学界提出的以“非作品性使用”为代表的“根源性”权利限缩模式,以及以“文本与数据挖掘”为代表的“封闭式”权利限制模式,虽在一定程度上能缓解困境,但因其理论局限和制度设计缺陷,难以真正有效平衡各方利益。相较而言,合理使用作为典型的“开放式”权益平衡模式,更具制度灵活性与适应性,可通过多层次评估框架弥补其操作困难与适用不确定性。与此同时,需辅以技术治理工具、训练数据透明度义务和合理补偿机制等创新措施,推动著作权法的渐进改革与完善,保障著作权人的合法权益,促进人工智能技术创新与应用的协调发展。 展开更多
关键词 人工智能 大模型 训练数据 著作权困境 适应性治理
在线阅读 下载PDF
生成式人工智能训练数据风险治理:欧盟经验及其启示 被引量:6
9
作者 徐伟 韦红梅 《现代情报》 北大核心 2025年第5期89-98,共10页
[目的/意义]生成式人工智能模型的性能依赖于训练数据的安全性,而频发的训练数据安全风险已经成为人工智能技术发展的障碍。保障训练数据安全对技术的健康发展具有重要意义。[方法/过程]通过文献、经验和比较分析,揭示了生成式人工智能... [目的/意义]生成式人工智能模型的性能依赖于训练数据的安全性,而频发的训练数据安全风险已经成为人工智能技术发展的障碍。保障训练数据安全对技术的健康发展具有重要意义。[方法/过程]通过文献、经验和比较分析,揭示了生成式人工智能训练数据的安全风险,并在借鉴欧盟治理经验的基础上,结合我国实践提出了应对策略。[结果/结论]研究发现,当前训练数据存在数据来源不透明、标注不规范、内容不安全及泄露风险等问题。欧盟已建立以保障数据来源、标注、内容及泄露防控为核心的监管体系。未来,我国应加强数据来源管理、统一标注标准、完善内容安全规则,强化数据保护技术以确保训练数据安全,推动技术健康发展。 展开更多
关键词 生成式人工智能 训练数据 数据安全 数据风险治理 欧盟经验
在线阅读 下载PDF
生成式人工智能数据“投喂”的著作权侵权行为规制 被引量:9
10
作者 常烨 《科技与法律(中英文)》 2025年第2期31-41,共11页
生成式人工智能在大模型训练中的数据“投喂”引发了内容创作者对自身作品被违法使用的担忧,生成式人工智能面对指控往往诉诸合理使用条款进行抗辩。生成式人工智能的技术特性,使得对于“投喂”未获许可作品行为的规制面临事实查明、归... 生成式人工智能在大模型训练中的数据“投喂”引发了内容创作者对自身作品被违法使用的担忧,生成式人工智能面对指控往往诉诸合理使用条款进行抗辩。生成式人工智能的技术特性,使得对于“投喂”未获许可作品行为的规制面临事实查明、归责、惩戒等多重困境。对于这种涉及新技术、新要素、新产业链的著作权侵权治理而言,必然对新制度有所诉求。因此,应当在生成式人工智能尚在自我探索的这一发展阶段,明确这种著作权侵权的法律适用,从侵权责任认定与举证责任分配、技术性授权的行业自律规范、“机器遗忘”强制性规范等多个维度,构建生成式人工智能输入端对数据“投喂”著作权侵权行为的规制框架。 展开更多
关键词 生成式人工智能 训练数据“投喂” 著作权 侵权
在线阅读 下载PDF
知识冲突:大语言模型教育应用的挑战与应对 被引量:2
11
作者 陈向东 周春红 +1 位作者 刘泽民 张靖沅 《中国电化教育》 北大核心 2025年第3期1-10,共10页
大语言模型在教育应用领域所呈现的知识冲突问题,表现为概念定义、事实陈述和逻辑推理等层面的认知不一致性,这种认知断裂严重制约了其在跨学科探究学习、深度认知任务和个性化教学等场景中的适用性和支持能力。该文系统分析了知识冲突... 大语言模型在教育应用领域所呈现的知识冲突问题,表现为概念定义、事实陈述和逻辑推理等层面的认知不一致性,这种认知断裂严重制约了其在跨学科探究学习、深度认知任务和个性化教学等场景中的适用性和支持能力。该文系统分析了知识冲突的技术成因,包括训练数据中的噪声、参数化知识表示的局限、推理机制的缺陷、模型架构的先天不足以及外部知识的偏差,并探讨了这些因素对大语言模型教育应用的深层影响。针对这一挑战,论文提出了多维度的解决路径:通过数据增强优化知识表示,利用提示强化上下文的连贯,开发量规完善模型评估。同时,研究从社会文化的宏观视角进一步剖析了知识冲突的外部驱动因素,探讨如何在多元异质、动态演进的社会建构语境中,构建开放进取、兼容融通的智能教育应用体系。知识冲突的有效化解不仅可以显著提升大语言模型在教育场景中的应用价值,更将为人工智能在更广泛领域的可持续发展奠定坚实基础。研究旨在为解决这一问题提供理论洞见与实践指引,促进教育人工智能技术的可靠性、适应性和普及性的不断提升。 展开更多
关键词 大语言模型 知识冲突 教育应用 训练数据 社会建构
在线阅读 下载PDF
基于大数据分析的网球运动员训练优化策略 被引量:1
12
作者 练光祥 《体育科学研究》 2025年第3期83-88,共6页
为了探索基于大数据分析的网球运动员训练优化策略,研究通过传感器和高速摄像技术收集了5名国家二级网球运动员的训练与比赛数据,利用Hadoop和Spark框架进行存储与计算,结合数据挖掘算法分析,发现大数据分析显著提升了运动员的技术训练... 为了探索基于大数据分析的网球运动员训练优化策略,研究通过传感器和高速摄像技术收集了5名国家二级网球运动员的训练与比赛数据,利用Hadoop和Spark框架进行存储与计算,结合数据挖掘算法分析,发现大数据分析显著提升了运动员的技术训练效果,包括发球技术、正反手击球稳定性、网前战术等。研究结果显示,ATH002发球技术提升23.4%,ATH004反手技术和心理耐压能力分别提升21.9%和25.7%。同时,精细化训练计划减少了运动伤病。研究构建的数据驱动训练框架包括计划、行动、评估、调整4个环节,验证了大数据分析的有效性。未来研究将优化数据收集与处理,扩大样本量,探索跨学科数据分析模型。 展开更多
关键词 大数据 网球技术训练 训练优化 数据挖掘 个性化训练
在线阅读 下载PDF
生成式人工智能训练数据利用作品的法定许可 被引量:1
13
作者 周辉 金僖艾 《重庆邮电大学学报(社会科学版)》 2025年第2期45-54,64,共11页
DeepSeek等生成式人工智能的开发离不开高质量的训练数据,但利用作品进行训练引发了一系列著作权争议。生成式人工智能高质量发展,迫切需要解决作品取得授权难、授权成本高、利益难平衡、有竞争壁垒等现实问题。合理使用制度虽然具备解... DeepSeek等生成式人工智能的开发离不开高质量的训练数据,但利用作品进行训练引发了一系列著作权争议。生成式人工智能高质量发展,迫切需要解决作品取得授权难、授权成本高、利益难平衡、有竞争壁垒等现实问题。合理使用制度虽然具备解决作品数据授权难、利用成本高的功能,但会牺牲著作权人利益和一定程度的社会公共利益。仅靠合理使用制度,不能完全解决生成式人工智能发展的著作权新问题。建立生成式人工智能训练数据利用作品的法定许可制度,既可以提供作品利用的合法性基础,提高授权效率;也可以预防因支配一定规模作品著作权而排除、限制生成式人工智能竞争的新型垄断;更可以通过合理的许可定价,为著作权人提供必要的对价补偿,实现生成式人工智能创新发展中各相关方利益的更好平衡。生成式人工智能作品训练适用法定许可制度的实施,需要通过人工智能专门立法创设,在与合理使用互补衔接的基础上,科学设定法定许可范围、条件和程序,并配套明确的法定许可定价标准和付酬机制。 展开更多
关键词 生成式人工智能 训练数据 合理使用 法定许可 DeepSeek
在线阅读 下载PDF
新工科背景下基于数据驱动的数学建模课程教学模式改革与实践 被引量:5
14
作者 于冬梅 《高教学刊》 2025年第2期133-136,共4页
该文以数学建模课程为引领,以适应大数据驱动的创新人才培养的社会需求为抓手,从课程育人目标、模块化高阶提升的教学内容体系构建,以赛促学的数学建模科研训练体系构建、多维度教学模式改革等方面探讨数学建模课程教学改革与实践。强... 该文以数学建模课程为引领,以适应大数据驱动的创新人才培养的社会需求为抓手,从课程育人目标、模块化高阶提升的教学内容体系构建,以赛促学的数学建模科研训练体系构建、多维度教学模式改革等方面探讨数学建模课程教学改革与实践。强化数据驱动,提升建模能力,扩充交叉能力,将数学建模思想、数据思维深度融入数学建模教学改革,为数学建模优化创新人才培养模式提供新的途径和方法。 展开更多
关键词 数学建模课程 教学改革 数据驱动 科研训练 创新人才培养 新工科
在线阅读 下载PDF
面向国产超算系统的大模型训练优化方法 被引量:1
15
作者 屈志勇 王晓光 +2 位作者 周纯葆 史源香 乔嘉伟 《数据与计算发展前沿(中英文)》 2025年第2期120-129,共10页
【目的】为了降低国产超算系统上的大模型训练开销,研发一套大模型训练优化方法。【方法】本文基于MPI与UCC形成一套通信后端,将进程组快速构建与低延迟集合通信相结合,在此基础上引入基于压缩的集合通信优化方法。【结果】通过在国产... 【目的】为了降低国产超算系统上的大模型训练开销,研发一套大模型训练优化方法。【方法】本文基于MPI与UCC形成一套通信后端,将进程组快速构建与低延迟集合通信相结合,在此基础上引入基于压缩的集合通信优化方法。【结果】通过在国产超算系统上多种配置下的大模型训练实验,本文提出的优化方法可以有效减少训练开销。【结论】实验结果证明了本文提出的大模型训练优化方法在减少训练开销方面的有效性。 展开更多
关键词 大语言模型 分布式训练 集合通信 数据压缩
在线阅读 下载PDF
教练机飞行员飞行训练质量评估系统
16
作者 尹大伟 《兵工自动化》 北大核心 2025年第9期23-27,共5页
为解决以视频回放为主的评估模式存在人为评判误差大、缺乏定量化依据、训练数据统计分析难以实现等问题,对教练机飞行员飞行训练质量评估系统设计进行研究。基于飞行训练大纲中训练科目的分析解读,以飞参数据为核心研发资源,搭建教练... 为解决以视频回放为主的评估模式存在人为评判误差大、缺乏定量化依据、训练数据统计分析难以实现等问题,对教练机飞行员飞行训练质量评估系统设计进行研究。基于飞行训练大纲中训练科目的分析解读,以飞参数据为核心研发资源,搭建教练机飞行员飞行训练质量评估系统软件的运行架构,开发飞行训练超限告警、飞参数据曲线分析、飞行轨迹3维回放、飞行训练诊断报告,以及阶段训练效果评估等具体功能。结果表明,该设计能为教练机飞行员飞行训练效果检验提供实用有效的辅助工具。 展开更多
关键词 教练机 飞行员 飞参数据 飞行训练质量评估
在线阅读 下载PDF
基于SVM的列车制动预测模型 被引量:1
17
作者 房楠 朱亚男 《时代汽车》 2025年第3期187-189,共3页
列车制动系统是保障列车行车安全和高效运行的关键组成部分,本文提出了一种基于支持向量机(SVM)方法的列车制动预测模型。该模型分析列车制动过程,采用制动实车数据构建适用于SVM的训练数据集,通过优化调节模型参数,利用SVM算法实现了... 列车制动系统是保障列车行车安全和高效运行的关键组成部分,本文提出了一种基于支持向量机(SVM)方法的列车制动预测模型。该模型分析列车制动过程,采用制动实车数据构建适用于SVM的训练数据集,通过优化调节模型参数,利用SVM算法实现了列车制动预测。经线路实车数据验证评估,该模型在3分钟内预测准确度高于97.3%,在列车制动预测中具有可靠的时效性和准确性,能够有效应用于实际列车运行中的制动预测任务。 展开更多
关键词 支持向量机(SVM) 列车制动 运行数据
在线阅读 下载PDF
论生成式人工智能数据训练的合法性基础
18
作者 张建文 孙依梦 《成都理工大学学报(社会科学版)》 2025年第5期24-33,共10页
生成式人工智能训练阶段依靠大量的数据,数据输入是生成式人工智能生成作品的前提和基础,而作为数据输入之前提的数据收集,则主要以网页抓取的方式进行。网页抓取的行为往往涉及个人信息处理,获取数据的合法授权问题成为企业亟须解决的... 生成式人工智能训练阶段依靠大量的数据,数据输入是生成式人工智能生成作品的前提和基础,而作为数据输入之前提的数据收集,则主要以网页抓取的方式进行。网页抓取的行为往往涉及个人信息处理,获取数据的合法授权问题成为企业亟须解决的难题。自然人的个人同意不足以成为大数据时代服务于生成式人工智能数据训练的基本选择,而《个人信息保护法》没有为训练数据来源提供责任豁免。在司法实践中,处理者的正当利益可以作为个人信息处理的合法性基础,为作为数据处理行为的数据训练提供合法性依据。但处理者的“正当利益”判定涉及信息主体的容忍义务,亟待明确其适用的合理边界,平衡个人信息的合理利用与权益保护,形成我国生成式人工智能数据训练的合规路径。 展开更多
关键词 数据训练 合法性基础 个人同意 正当利益 平衡测试
在线阅读 下载PDF
AI模型训练中著作权合理使用解释分析及进路选择
19
作者 吴广海 刘一鸣 《电子知识产权》 2025年第5期64-74,共11页
AI模型的训练以巨量的数据投喂为前置步骤。数据未经许可被纳入训练极易造成对著作权的侵犯。大数据训练本身具备的“营利性”“表达性”与“竞争性”等特点,使其面临合理使用的解释障碍。在人工智能迅速迭代的当下,合理使用原则适用乏... AI模型的训练以巨量的数据投喂为前置步骤。数据未经许可被纳入训练极易造成对著作权的侵犯。大数据训练本身具备的“营利性”“表达性”与“竞争性”等特点,使其面临合理使用的解释障碍。在人工智能迅速迭代的当下,合理使用原则适用乏力,亟待调整。因此,在制度层面,可依解释论对合理使用制度作进一步诠释,对“营利性使用”“表达性使用”“竞争性使用”三大判断标准进行解释分析。为减少“营利性使用”对AI模型训练行为的限制,可将“营利”理解为“直接营利”并引入“转化性使用”。判断“表达性使用”时,可从后端输出内容考虑,将输出内容划分为不同种类并与输入内容进行比较。面对“竞争性使用”的屏障,可将企业数据合规义务前置以缓解“竞争性使用”冲突。在技术层面,尝试探索联邦学习技术、算法解释技术与数字版权管理技术利于配合制度层面的解释。通过制度解释与技术探索,以求对著作权合理使用原则进行扩张,使得AI模型的训练行为得以纳入其中。 展开更多
关键词 数据侵权 著作权合理使用 数据训练 数字技术
在线阅读 下载PDF
大模型数据训练中著作权法“复制”规范的适用性反思
20
作者 张惠彬 何嘉怡 《科技与法律(中英文)》 2025年第5期26-36,共11页
大模型数据训练是否属于著作权法意义上的复制,是当前理论界和实务界争论最激烈的问题之一。这场争论的根源在于,大模型训练行为在本质上与传统的复制行为存在巨大差异,这使得现有的法律框架难以直接适用。但这并不意味着著作权法系统... 大模型数据训练是否属于著作权法意义上的复制,是当前理论界和实务界争论最激烈的问题之一。这场争论的根源在于,大模型训练行为在本质上与传统的复制行为存在巨大差异,这使得现有的法律框架难以直接适用。但这并不意味着著作权法系统性“失灵”,只是因其滞后性而导致复制规范出现了失衡后果:控制权配置失衡、利益分配机制的失效及权利诉求困境。面对技术特性带来的新型作品利用方式,可在民法典的公平原则基础上,构建作品数据财产许可与管理机制、创新获酬机制,更新举证责任倒置规则。在尊重技术创新的同时,重新平衡权利人与人工智能公司之间的利益关系,确保数字时代的公平与正义。 展开更多
关键词 大模型数据训练 复制权 著作权法失灵 公平原则
在线阅读 下载PDF
上一页 1 2 116 下一页 到第
使用帮助 返回顶部