期刊文献+
共找到535篇文章
< 1 2 27 >
每页显示 20 50 100
Application of Full Text Search Engine Based on Lucene
1
作者 Rujia Gao Danying Li +1 位作者 Wanlong Li Yaze Dong 《Advances in Internet of Things》 2012年第4期106-109,共4页
This paper introduces us the full-text search engine based on Lucene and full-text retrieval technology, including indexing and system architecture, compares the full-text search of Lucene with the String search retri... This paper introduces us the full-text search engine based on Lucene and full-text retrieval technology, including indexing and system architecture, compares the full-text search of Lucene with the String search retrieval’s response time, the experimental results show that the full text search of Lucene has faster retrieval speed. 展开更多
关键词 Full text search ENGINE System ARCHITECTURE LUCENE
在线阅读 下载PDF
On Multi-Thread Crawler Optimization for Scalable Text Searching
2
作者 Guang Sun Huanxin Xiang Shuanghu Li 《Journal on Big Data》 2019年第2期89-106,共18页
Web crawlers are an important part of modern search engines.With the development of the times,data has exploded and humans have entered a“big data era”.For example,Wikipedia carries the knowledge from all over the w... Web crawlers are an important part of modern search engines.With the development of the times,data has exploded and humans have entered a“big data era”.For example,Wikipedia carries the knowledge from all over the world,records the realtime news that occurs every day,and provides users with a good database of data,but because of the large amount of data,it puts a lot of pressure on users to search.At present,single-threaded crawling data can no longer meet the requirements of text crawling.In order to improve the performance and program versatility of single-threaded crawlers,a high-speed multi-threaded web crawler is designed to crawl the network hyper-scale text database.Multi-threaded crawling uses multiple threads to process web pages in parallel,combining breadth-first and depth-first algorithms to control web crawling.The practice project is based on the Python language to achieve multi-threaded optimization network hyper-large-scale text database-Wikipedia book crawling method,the project is inspired by the article on the Wikipedia article in the Big Data Digest public number. 展开更多
关键词 MULTI-THREADING text database OPTIMIZATION breadth-first search depth-first search.
在线阅读 下载PDF
Oracle Text技术在复杂结构数据库中的应用 被引量:5
3
作者 蒙辉 陈燕 《计算机技术与发展》 2007年第4期38-40,44,共4页
全文检索技术是智能信息管理的关键技术之一,Oracle Text作为Oracle9i的一个组件,提供了强大的全文检索功能。但Oracle Text全文检索技术只是针对表结构相对固定的数据库,而对表结构以及表数量不断变化的数据库实现全文检索的能力是不... 全文检索技术是智能信息管理的关键技术之一,Oracle Text作为Oracle9i的一个组件,提供了强大的全文检索功能。但Oracle Text全文检索技术只是针对表结构相对固定的数据库,而对表结构以及表数量不断变化的数据库实现全文检索的能力是不足的。文中介绍了Oracle Text全文检索技术的方法和步骤,阐述了其在复杂结构数据库中的具体应用,最后程序实现了所设计的全文检索技术。 展开更多
关键词 ORACLE text 复杂结构数据库 全文检索
在线阅读 下载PDF
基于Microsoft Search Service为图书馆自建数据库创建Web全文检索系统
4
作者 唐光前 《现代图书情报技术》 CSSCI 北大核心 2003年第6期50-52,共3页
分析了基于 Microsoft Search Service为图书馆自建数据库创建 Web全文检索系统的理由、Microsoft SearchService的索引机制和检索机制 ,并运用 ASP.
关键词 Microsoft-search-Service 图书馆 数据库 全文检索系统 索引机制 检索机制 ASP NET
在线阅读 下载PDF
基于Lucene的MYSearch全文搜索引擎
5
作者 刘亚姝 黄岳 《微型机与应用》 2010年第18期86-88,共3页
基于Lucene开源框架设计实现了MYSearch全文搜索引擎。给出了MYSearch实现的基本原理和设计流程,以及实验结果,并针对Lucene在中文分词方面的不足展开了讨论,给出了改进方法。
关键词 全文搜索引擎 Lucence 分词 索引
在线阅读 下载PDF
利用interMedia-Text实现基于Web的大型文档库的全文检索模块 被引量:2
6
作者 夏戈 卜家岐 《计算机应用与软件》 CSCD 北大核心 2004年第1期22-23,102,共3页
随着电子文档的大量使用 ,如何建立高效的文档管理系统成为一个新的研究方向。本文就实现管理系统的一项技术难点 ,即大型文档的全文检索功能 ,提出了一种新的可行方案。其核心选用了最新的数据库技术interMedia -Text 。
关键词 数据库 interMedia-text WEB 大型文档库 全文检索模块 文档管理系统
在线阅读 下载PDF
基于ElasticSearch的医疗数据检索系统的设计与实现 被引量:5
7
作者 汪睿 胡外光 +1 位作者 胡珊珊 周颖 《信息技术》 2024年第4期76-82,共7页
随着医疗技术的发展,医疗业务场景越加复杂,由此产生的医疗数据也越来越多,其来源复杂,结构多变,信息冗余,数据不完整。这些特性使得系统在进行检索时,无法快速、有效、精确地查询数据。为了解决这个问题,设计并实现了基于ElasticSearc... 随着医疗技术的发展,医疗业务场景越加复杂,由此产生的医疗数据也越来越多,其来源复杂,结构多变,信息冗余,数据不完整。这些特性使得系统在进行检索时,无法快速、有效、精确地查询数据。为了解决这个问题,设计并实现了基于ElasticSearch的医疗数据检索系统。该系统将医疗数据进行标准化,填补缺失值,选取合适的分词算法进行分词,将处理后的数据存入ElasticSearch中,同时使用SpringBoot构建系统应用,消耗多个医疗基础业务系统产生的数据,最终形成统一的医疗数据检索系统,给用户提供便捷、精确的查询服务。 展开更多
关键词 lasticsearch 医疗数据 文本分词 全文检索 分布式搜索
在线阅读 下载PDF
面向工程数据检索的ElasticSearch索引优化策略 被引量:10
8
作者 许贤慧 王淑营 曾文驱 《计算机与现代化》 2022年第2期79-84,119,共7页
随着生产制造业的发展,各行业在生产制造的过程中都会产生大量的工程数据,现代工程领域的数据检索需求要求能够通过关键字快速且准确检索出相应的结果,利用ElasticSearch可以实现工程数据的检索,但是其性能方面还有优化的空间。为了解... 随着生产制造业的发展,各行业在生产制造的过程中都会产生大量的工程数据,现代工程领域的数据检索需求要求能够通过关键字快速且准确检索出相应的结果,利用ElasticSearch可以实现工程数据的检索,但是其性能方面还有优化的空间。为了解决这个问题,本文对ElasticSearch的底层原理进行深入研究,在ElasticSearch的索引创建、索引分片以及索引段合并方面进行优化。首先对ElasticSearch的分词器进行修改并配置自定义词典,其次提出基于集群节点性能与索引数据量大小的索引分片策略,最后,根据节点性能对索引段合并的时机进行优化。通过基于地铁工程数据的检索进行实验,实验结果表明,改进的方法确实能够提高ElasticSearch的数据写入与查询性能。 展开更多
关键词 Elasticsearch全文搜索引擎 索引 分片 段合并 性能优化
在线阅读 下载PDF
基于ElasticSearch全文检索的农业地理信息大数据平台设计与实现 被引量:8
9
作者 刘吉 孙俊英 +1 位作者 陈忠超 蔡忠亮 《测绘与空间地理信息》 2021年第6期162-164,共3页
针对目前农业大数据平台地理要素纳入不足、研究尺度受限、搜索功能相对薄弱等问题,本文充分发挥了测绘部门自然地理要素数据精细、农业遥感监测数据精准、野外全景采样数据完整的优势,基于ElasticSearch搜索引擎,利用网络技术、电子地... 针对目前农业大数据平台地理要素纳入不足、研究尺度受限、搜索功能相对薄弱等问题,本文充分发挥了测绘部门自然地理要素数据精细、农业遥感监测数据精准、野外全景采样数据完整的优势,基于ElasticSearch搜索引擎,利用网络技术、电子地图技术与空间数据库技术设计并实现了全文检索的农业地理信息大数据平台,多角度、多维度、多层次精确地展示数据信息内容,为农业大数据的规律寻找、价值挖掘与有效利用提供了有力支撑。 展开更多
关键词 农业大数据 地理信息平台 Elasticsearch 全文检索
在线阅读 下载PDF
一种基于Context Graph主题爬虫系统的算法实现 被引量:1
10
作者 高庆芳 蒲宝卿 包蕾 《兰州文理学院学报(自然科学版)》 2022年第6期41-45,共5页
对搜索引擎的原理结构进行深度剖析,经可行性认定后,将机器学习算法与现有的技术手段进一步融合提升,以Python为开发平台,以Context Graph为开发主题,构建并设计出可实现的目标爬虫系统.通过实际运用检测系统的实用性能,选择国内具有较... 对搜索引擎的原理结构进行深度剖析,经可行性认定后,将机器学习算法与现有的技术手段进一步融合提升,以Python为开发平台,以Context Graph为开发主题,构建并设计出可实现的目标爬虫系统.通过实际运用检测系统的实用性能,选择国内具有较大规模的汽车网站为研究对象,设置“汽车”为关键词对全部内容展开不同类别的爬取,进而分析所得结果,根据查全率、查准率和F1值综合评价系统的性能.与原有系统相比,升级后算法的模型准确性更好,在一定程度上提高爬取工作的效率. 展开更多
关键词 搜索引擎 主题爬虫 文本分析 机器学习
在线阅读 下载PDF
基于ElasticSearch和语义相似度匹配的教学资源搜索策略 被引量:8
11
作者 陶磊 苏晨阳 +2 位作者 李正丹 朱静雯 张玉志 《数据与计算发展前沿》 CSCD 2022年第2期50-62,共13页
【目的】整合多种教学资源,并在此场景下设计和实现一种高效准确的搜索策略,帮助用户获取丰富的教学内容。【应用背景】教学资源类型众多,数量庞大,用户对于准确检索的需求日益增长,仅基于ElasticSearch进行搜索的效果不尽人意。【方法... 【目的】整合多种教学资源,并在此场景下设计和实现一种高效准确的搜索策略,帮助用户获取丰富的教学内容。【应用背景】教学资源类型众多,数量庞大,用户对于准确检索的需求日益增长,仅基于ElasticSearch进行搜索的效果不尽人意。【方法】在对用户输入的Query进行预处理和分词后,通过ER-BERT语义相似度模型在Query库中匹配出n条近似结果,将其输入到ElasticSearch并构建相关度计算公式,最后按照综合评估的最终得分将匹配结果进行排序。【结果】利用知识图谱技术整合复杂的教学资源,并在此基础上实现了一种基于ElasticSearch和语义相似度匹配的教学资源搜索策略,在保证检索速度的同时可以根据用户检索Query的语义信息进行检索。【结论】实验结果表明使用该教学资源搜索策略增加了检索结果的数量,并在保证检索速度的同时提升了结果的准确性,显著改善了用户的搜索体验。 展开更多
关键词 Elasticsearch 文本相似度 搜索策略 知识图谱
在线阅读 下载PDF
Oracle Text全文检索技术在文档资料管理中的应用 被引量:3
12
作者 李培军 毕于慧 +1 位作者 张权 董玮 《计算机系统应用》 2014年第4期57-60,共4页
本文利用Oracle Text全文检索技术,根据数据库业务逻辑构建了关键词表,通过为关键词表建立索引的方式进行检索,提高了检索效率;以ViusalC++6为开发平台,采用C/S结构技术研发了多类型文档资料管理系统,实现了办公文档资料的高效管理.
关键词 全文检索 文档资料管理系统
在线阅读 下载PDF
基于ElasticSearch分布式搜索引擎的信息检索方法研究 被引量:9
13
作者 董元和 贾炎 +2 位作者 朱勇 李恩泽 薛贤红 《湖北师范大学学报(自然科学版)》 2023年第4期56-61,共6页
随着信息量的骤增,传统关系型数据库很难做到实时高效地检索用户需要的信息,并且无法对信息进行分词及关键词组合的短文本搜索,从而很难优化信息检索结果的推荐展示。针对大量信息频繁检索的问题,采取一种基于ElasticSearch分布式搜索引... 随着信息量的骤增,传统关系型数据库很难做到实时高效地检索用户需要的信息,并且无法对信息进行分词及关键词组合的短文本搜索,从而很难优化信息检索结果的推荐展示。针对大量信息频繁检索的问题,采取一种基于ElasticSearch分布式搜索引擎,并采用分词器和倒排索引等技术,能较好地解决这些问题。同时在研究过程中利用代码实现了基础功能搜索、地理位置搜索以及通过算分排序推荐展示等功能。 展开更多
关键词 分布式搜索引擎 短文本搜索 倒排索引 分词器 信息检索
在线阅读 下载PDF
基于ElasticSearch的输变电工程全文检索研究 被引量:1
14
作者 张建广 徐鲲 +3 位作者 董鉥涛 刘迪 王向上 李春林 《黑龙江科学》 2024年第16期94-97,共4页
随着输变电工程建设工作的开展,多源异构的全过程非结构化文档体量日益增大,需要对这些非结构化文档进行稳定管理。为实现输变电工程非结构化文档的高效检索,研究了基于ElasticSearch的输变电工程全文检索方案,构建电网专用术语词典对... 随着输变电工程建设工作的开展,多源异构的全过程非结构化文档体量日益增大,需要对这些非结构化文档进行稳定管理。为实现输变电工程非结构化文档的高效检索,研究了基于ElasticSearch的输变电工程全文检索方案,构建电网专用术语词典对智能化分词进行辅助优化,融合输变电工程资料的特征信息,对分词成果进行语义赋值,基于语义标签改进分词算法,进一步提升全文检索效率和准确率,搭建了输变电工程全文检索系统,以验证此技术方案的可行性。 展开更多
关键词 输变电工程 全文检索 Elasticsearch 中文分词 语义检索
在线阅读 下载PDF
FICW: Frequent Itemset Based Text Clustering with Window Constraint
15
作者 ZHOU Chong LU Yansheng ZOU Lei HU Rong 《Wuhan University Journal of Natural Sciences》 CAS 2006年第5期1345-1351,共7页
Most of the existing text clustering algorithms overlook the fact that one document is a word sequence with semantic information. There is some important semantic information existed in the positions of words in the s... Most of the existing text clustering algorithms overlook the fact that one document is a word sequence with semantic information. There is some important semantic information existed in the positions of words in the sequence. In this paper, a novel method named Frequent Itemset-based Clustering with Window (FICW) was proposed, which makes use of the semantic information for text clustering with a window constraint. The experimental results obtained from tests on three (hypertext) text sets show that FICW outperforms the method compared in both clustering accuracy and efficiency. 展开更多
关键词 text clustering frequent itemsets search engine
在线阅读 下载PDF
基于Elasticsearch的校内全文搜索平台的研究与实现 被引量:4
16
作者 钦蒋承 沈宏良 《现代计算机》 2018年第23期96-100,共5页
为了解决校园网域内的数字资源无法精确定位和获取问题,对搜索引擎的工作原理和Elasticsearch(ES)的运行机制进行深入研究,实现提供多文件类型的实时全文搜索服务平台,并对ES的中文索引缺陷进行优化。实验结果表明,相比于通用的搜索引... 为了解决校园网域内的数字资源无法精确定位和获取问题,对搜索引擎的工作原理和Elasticsearch(ES)的运行机制进行深入研究,实现提供多文件类型的实时全文搜索服务平台,并对ES的中文索引缺陷进行优化。实验结果表明,相比于通用的搜索引擎和基于内容管理的搜索引擎,所实现的搜索引擎能够更快速、准确、全面地完成校内用户的搜索需求。 展开更多
关键词 搜索引擎 Elasticsearch 中文索引 相关度计算 全文搜索
在线阅读 下载PDF
An Efficient Character-Level Adversarial Attack Inspired by Textual Variations in Online Social Media Platforms
17
作者 Jebran Khan Kashif Ahmad Kyung-Ah Sohn 《Computer Systems Science & Engineering》 SCIE EI 2023年第12期2869-2894,共26页
In recent years,the growing popularity of social media platforms has led to several interesting natural language processing(NLP)applications.However,these social media-based NLP applications are subject to different t... In recent years,the growing popularity of social media platforms has led to several interesting natural language processing(NLP)applications.However,these social media-based NLP applications are subject to different types of adversarial attacks due to the vulnerabilities of machine learning(ML)and NLP techniques.This work presents a new low-level adversarial attack recipe inspired by textual variations in online social media communication.These variations are generated to convey the message using out-of-vocabulary words based on visual and phonetic similarities of characters and words in the shortest possible form.The intuition of the proposed scheme is to generate adversarial examples influenced by human cognition in text generation on social media platforms while preserving human robustness in text understanding with the fewest possible perturbations.The intentional textual variations introduced by users in online communication motivate us to replicate such trends in attacking text to see the effects of such widely used textual variations on the deep learning classifiers.In this work,the four most commonly used textual variations are chosen to generate adversarial examples.Moreover,this article introduced a word importance ranking-based beam search algorithm as a searching method for the best possible perturbation selection.The effectiveness of the proposed adversarial attacks has been demonstrated on four benchmark datasets in an extensive experimental setup. 展开更多
关键词 Adversarial attack text classification social media character-level attack phonetic similarity visual similarity word importance rank beam search
在线阅读 下载PDF
基于微信文本搜索的国内中小学研学实践教育课程现状综述 被引量:1
18
作者 万田户 朱训庭 +1 位作者 丁丛 姚丽芳 《江西科学》 2025年第1期203-210,共8页
在国家系列政策支持下,国内中小学研学实践教育蓬勃发展,而课程则是推动中小学研学实践教育高质量跨越式发展的重要抓手。利用微信文本搜索功能,获取国内中小学研学实践教育课程微信文本864篇,并运用ROST CM6工具对文本内容进行高词频... 在国家系列政策支持下,国内中小学研学实践教育蓬勃发展,而课程则是推动中小学研学实践教育高质量跨越式发展的重要抓手。利用微信文本搜索功能,获取国内中小学研学实践教育课程微信文本864篇,并运用ROST CM6工具对文本内容进行高词频及其聚类、共词矩阵与语义网络结构和情感分析。结论表明,国内研学实践教育课程主题虽然宽泛,但较为多元,其中历史文化、红色研学、艺术发展、自然探索、营地教育以及乡村研学等主题深受青睐;研学实践教育课程设置过于传统与保守,导致课程内容缺乏前沿性与引领性;研学实践教育课程存在与课本脱节现象,实践教育课程开发未能与学校相应理论课程有效衔接。建议分解宽泛主题,实现主题“个性化”;创新传统主题,探索主题“未来时”;开发学科主题,促进主题“多元化”。 展开更多
关键词 研学旅行 研学实践教育 研学课程 微信文本搜索
在线阅读 下载PDF
消费者在线评论排名设计的有用性及其影响
19
作者 黄仕晖 周峰 《山东商业职业技术学院学报》 2025年第2期27-30,共4页
随着信息技术的快速发展,互联网为用户发布产品评论创造了优越的条件。消费者越来越倾向于阅读在线评论以决定自己的购买意向。然而,面对海量的在线评论,消费者很难快速定位到最佳评论以了解产品的真正质量,同样,生产商要调查研究影响... 随着信息技术的快速发展,互联网为用户发布产品评论创造了优越的条件。消费者越来越倾向于阅读在线评论以决定自己的购买意向。然而,面对海量的在线评论,消费者很难快速定位到最佳评论以了解产品的真正质量,同样,生产商要调查研究影响客户购买决策的评论内容也很困难。基于计量经济学分析与文本挖掘技术,尤其是主观性分析方法,以亚马逊商城为例,根据消费者预期的评论有用性和生产商对产品销售的预期效应,设计了面向消费者和生产商的两种在线评论排名。结果发现,主观性分析对评论有用性能够给出有益的线索并对产品的销售有显著影响;最能影响销售的评论,未必就是客户感知有用的评论,反之亦然。研究结果对市场在线论坛的设计具有指导意义和参考价值。 展开更多
关键词 消费者在线评论 有用性 搜索商品 体验商品 文本特征
在线阅读 下载PDF
铀矿勘查知识库设计与系统实现
20
作者 尹锦宇 朱鹏飞 +5 位作者 王宝令 孔维豪 黄树桃 曹珂 刘琳莹 王思宇 《世界核地质科学》 2025年第2期307-316,共10页
60多年的铀矿勘查工作积累大量知识,传统的技术手段和管理措施难以满足信息化时代业务发展需要,铀矿勘查领域的知识服务与信息管理模式亟需升级。通过构建一体化收集,管理和分析铀矿相关的各类信息的知识平台,帮助从业人员依据科学合理... 60多年的铀矿勘查工作积累大量知识,传统的技术手段和管理措施难以满足信息化时代业务发展需要,铀矿勘查领域的知识服务与信息管理模式亟需升级。通过构建一体化收集,管理和分析铀矿相关的各类信息的知识平台,帮助从业人员依据科学合理的分类逻辑快速收集与获取相关信息,实现知识的按需共享+智能优化。重点概述铀矿勘查知识体系的构建、基于铀矿勘查知识库构建的关键过程及知识库的应用状况,确保实现铀矿地质勘查领域知识的管理、检索和应用等功能,系统采用人工上传+机器自动采集导入两种方式丰富知识库的内容组织。上线后在中国核工业地质局各成员单位全面推广,致力于实现铀矿地质勘查领域的知识保存、管理与科学有效的共享应用,推动铀矿勘查领域的知识信息管理模式的转变。 展开更多
关键词 铀矿勘查知识库 知识管理 知识图谱 全文检索
在线阅读 下载PDF
上一页 1 2 27 下一页 到第
使用帮助 返回顶部