HiGo垂直搜索引擎开源版系统需要独立服务器支持,也可以用你本地电脑做服务器来调试,基于lucence+mysql+asp.net,
支持数据索引,中文分词,模糊查询,爬虫采集,精确采集规则模式和模糊采集规则模式相混合(模糊采集不用为每个站定义采集规则,只定义一个总的)
目录结构:
网站文件--上传这个到服务器
|
|----spider_bin 这里为爬虫系统目录
|----ShangPu_zhida_data商家直达栏目数据
|----Main_set_dats 精确采集规则和模糊采集规则的采集规则文件,每个栏目建立一个目录
|----Lanmu_Index_templete 栏目首页模板文件目录
本次公开了所有源码,并命名为HiGo
支持数据索引,中文分词,模糊查询,爬虫采集,精确采集规则模式和模糊采集规则模式相混合(模糊采集不用为每个站定义采集规则,只定义一个总的)
目录结构:
网站文件--上传这个到服务器
|
|----spider_bin 这里为爬虫系统目录
|----ShangPu_zhida_data商家直达栏目数据
|----Main_set_dats 精确采集规则和模糊采集规则的采集规则文件,每个栏目建立一个目录
|----Lanmu_Index_templete 栏目首页模板文件目录
本次公开了所有源码,并命名为HiGo
下载地址已转移到新版网站,请点击左上角-首页,在新版网站搜索此套源码的标题进行下载。