该采集程序是一款傻瓜式的论坛专用采集程序,只需输入文章列表地址和内容页面部分地址就可以进行采集,和其他采集程序相比,使用该程序不需要设置复杂的规则,适合动网论坛7.1以上版本使用,欢迎各位使用并提出宝贵意见。最近更新:2007-11-28
以下是新版本2.1.0主要做的修改
1.可以选择是否采集回帖
2.自动识辨文章编码格式,避免出现乱码
3.html标签过滤更严谨
4.修复了不能编辑回帖的问题
5.修复了采集回帖时下标越界的bug
6.修改了正则规则避免采集Discuz论坛时出现重复帖及标题出现代码的问题
7.可自定义正文标题位置,并可自定义过滤标题的部分内容
8.修复了部分图片连接获取出错的bug
9.调整了163论坛的规则
10.发帖数和回帖数进行了精确统计
11.对源程序进行了dll编译,采集速度及稳定性都有较大提高,同时可以有效防止恶意注入。
12.对可以采集的权限进行了改进,用户可以指定哪些用户可以进行帖子采集(默认是论坛管理员拥有该权限)
13.可选择是否采集标题相同的帖子,开启该功能可有效避免重复采集,不过一定程度会减慢采集速度
14.可字定义入库的帖子表Dv_bbs1、Dv_bbs2等
15.多页采集帖子时,系统会自动把帖子时间分布开来,并且会实现对方先发布的帖子(文章)先进行采集,发帖时间分布于8:00-23:00,使采集的数据更真实
16.对Discuz utf-8编码的论坛进行多页采集时,如果忘记设置标题信息或者标题信息设置不准确,程序在采集第一页以后会自动识别并纠正过来。
17.对sql 论坛,支持在本地连接到论坛数据库进行采集,需要注意的是cj.asp文件中需设置MyBBSUrl="你自己的论坛地址"
18.增加自定义过滤帖子内容,用户可以根据需要过滤或替换多余的信息,让采集的内容更准确
19.不采集回帖的时候,把最后回帖者由默认admin改成发帖者;(2007-11-28)