摘要
网络能为语料库的构建提供丰富实时的语料。由于不同网站的结构不尽相同,网页内容又呈现结构化和半结构化特征,这使得如何从网络汲取语料成为基于网络构建语料库的首要问题。同时,如何对汲取后的语料进行整合和组织,也是基于网络构建语料库不容忽视的问题。以基于网络构建动态中国政治新闻语料库为例,从网站结构分析、网页下载以语料汲取的技术实现、
出处
《中国教育技术装备》
2013年第23期66-68,共3页
China Educational Technology & Equipment
基金
上海市民办高校重点科研项目"外语有效教学的内容与方法"