A new generation of "Web literate"university students will soon be getting most,if not all, of their course material from univer-sity websites, according to the Australian de-veloper of a CD-ROM. Dr Colin Py...A new generation of "Web literate"university students will soon be getting most,if not all, of their course material from univer-sity websites, according to the Australian de-veloper of a CD-ROM. Dr Colin Pyan, a senior lecturer in psy-chology at James Cook University,Townsville, has developed a CD that has be-展开更多
Writing style is the essential issue even at the early stage the beginners who learnto read and write have to confront.From the part-Notes on reading and writing beforethe part of exercises of each lesson in English B...Writing style is the essential issue even at the early stage the beginners who learnto read and write have to confront.From the part-Notes on reading and writing beforethe part of exercises of each lesson in English Book V-VⅢ we can come to see that the ed-itors attempt to mix the content(ideas)with the corresponding techniques.This is展开更多
【目的/意义】利用图书文本内容实现相似图书推荐,海量图书数据环境下提高图书相似度计算效率。【方法/过程】构建了一种基于图结构的相似图书内容推荐方法,在图书的文本内容进行短语抽取后计算短语网络中的TextRank值获得图书关键词,...【目的/意义】利用图书文本内容实现相似图书推荐,海量图书数据环境下提高图书相似度计算效率。【方法/过程】构建了一种基于图结构的相似图书内容推荐方法,在图书的文本内容进行短语抽取后计算短语网络中的TextRank值获得图书关键词,进而建立图书向量并结合层次可导航小世界算法(Hierarchcal Navigable Small World,HNSW)得到目标图书和推荐图书之间的相似度。【结果/结论】利用基于内容的相似图书推荐方法得到的用户评价平均准确率达到0.807,客观平均准确率显著高于TF-IDF和TextRank的文本表示方法,可以实现较好的图书推荐效果,HNSW算法将计算效率缩小到对数级别,对大数据环境下的相似图书计算效率起到一定的优化作用。【创新/局限】本研究创新性地结合图结构和HNSW算法提高了图书推荐的准确性和计算效率,但受限于对腾讯词典的依赖,影响了向量表达的普适性和跨语言适应性。展开更多
针对文档图像文本行分割方法在处理书写方式多样的多语种古籍时效果不佳的问题,提出一种基于全局滤波器和视觉置换器的多语种古籍文档图像的文本行切分方法(Global Filter and Vision Permutator based U-Net,GVUnet)。构建一个多语种...针对文档图像文本行分割方法在处理书写方式多样的多语种古籍时效果不佳的问题,提出一种基于全局滤波器和视觉置换器的多语种古籍文档图像的文本行切分方法(Global Filter and Vision Permutator based U-Net,GVUnet)。构建一个多语种古籍文档图像文本行分割数据集,包含汉字、古布依文、满文这3个类别,每个类别各50张图像,共150张。GVUnet利用全局滤波器和视觉置换器在提取全局信息的同时,关注文本行位置信息,对古籍文档进行有效分割。实验结果表明,该文提出的文本行分割方法在新构建的数据集上mIoU(mean intersection over union,mIoU)得分达到92.78%,可以有效处理排版方式不同的汉字、古布依文、满文古籍文档。展开更多
文摘A new generation of "Web literate"university students will soon be getting most,if not all, of their course material from univer-sity websites, according to the Australian de-veloper of a CD-ROM. Dr Colin Pyan, a senior lecturer in psy-chology at James Cook University,Townsville, has developed a CD that has be-
文摘Writing style is the essential issue even at the early stage the beginners who learnto read and write have to confront.From the part-Notes on reading and writing beforethe part of exercises of each lesson in English Book V-VⅢ we can come to see that the ed-itors attempt to mix the content(ideas)with the corresponding techniques.This is
文摘【目的/意义】利用图书文本内容实现相似图书推荐,海量图书数据环境下提高图书相似度计算效率。【方法/过程】构建了一种基于图结构的相似图书内容推荐方法,在图书的文本内容进行短语抽取后计算短语网络中的TextRank值获得图书关键词,进而建立图书向量并结合层次可导航小世界算法(Hierarchcal Navigable Small World,HNSW)得到目标图书和推荐图书之间的相似度。【结果/结论】利用基于内容的相似图书推荐方法得到的用户评价平均准确率达到0.807,客观平均准确率显著高于TF-IDF和TextRank的文本表示方法,可以实现较好的图书推荐效果,HNSW算法将计算效率缩小到对数级别,对大数据环境下的相似图书计算效率起到一定的优化作用。【创新/局限】本研究创新性地结合图结构和HNSW算法提高了图书推荐的准确性和计算效率,但受限于对腾讯词典的依赖,影响了向量表达的普适性和跨语言适应性。
文摘针对文档图像文本行分割方法在处理书写方式多样的多语种古籍时效果不佳的问题,提出一种基于全局滤波器和视觉置换器的多语种古籍文档图像的文本行切分方法(Global Filter and Vision Permutator based U-Net,GVUnet)。构建一个多语种古籍文档图像文本行分割数据集,包含汉字、古布依文、满文这3个类别,每个类别各50张图像,共150张。GVUnet利用全局滤波器和视觉置换器在提取全局信息的同时,关注文本行位置信息,对古籍文档进行有效分割。实验结果表明,该文提出的文本行分割方法在新构建的数据集上mIoU(mean intersection over union,mIoU)得分达到92.78%,可以有效处理排版方式不同的汉字、古布依文、满文古籍文档。