20070910更新的火车采集器3.2正式版发布下载

所属分类: 实用技巧 / 应用技巧 阅读数: 1768
收藏 0 赞 0 分享
火车头团队一直致力于为广大网站站点提供数据信息和实用的工具软件, 开发团队秉承“专业,专注,沉着,创新”的理念,用实力铸造精品。
经过2007年3月至2007年9月,近5个多个月的研发及几个版本的内部测试,一个具有全新内核和架构的强大信息采集,数据加工软件--火车采集器3.2版
呈献在大家面前,为始终支持和关爱火车软件发展的站长们献上一份谢礼。

    火车采集器1.X-3.X一直免费使用并深受广大站长欢迎,通过大家对3.2测试版的反馈,无论在性能,功能和稳定性上面3.2都是以前版本无法比拟的,
我们此次发布的3.2正式版同样也是免费使用,没有任何限制(功能上附带3.1版的所有基本功能及3.2内部测试版发布的所有功能)
同时为了软件和更好发展及为部分用户更好的技术支持,3.2版也发布支持更多SEO功能和技术支持的个人、标准和企业版三种高级版本,各位朋友可按需选用 高级版本请访问这里

3.2版功能简介

继承3.1的优点,站点+任务式管理,多任务多线程同时运行
3.1版的基本功能可查看这里 http://www.locoy.com/article/show.php?itemid-8/page-1.html

下面仅对3.2正式版中新增的功能做简单列表:
采网址,采内容,发内容三个步骤可以分开分步操作
增加缩略图采集功能,并能保存到本地文件
增加多页采集,使采集多页下载链接或产品多页图片,参数,评论,价格内容成为可能
增加自定义网页编码类型,默认任何编码页都可以实现内部转换,都能正确采集,发布时请选择目标UTF8
增加循环采集(可采集列表和论坛回复列表类似的网页)
增加将循环采集匹配到的结果添加为新记录和间隔符分割的功能
增加内容采集中使用正则匹配的功能
增加WEB发布配置,保存每个网站的发布配置,单任务可以发布到多网站,但任务可以发布到网站的不同栏目
增加数据库发布模块,去掉以前的数据库直导配置,成熟的发布模块可以使不懂数据库结构的人使用数据库直导成为可能
增加分页采集自定义地址格式的功能,完善以前的分页采集中上10页下10页这种无法采集的问题
增加源代码查看和测试工具
增加软件内动态帮助,使用更为方便..
增加对任意采集标签里的内容自动生成摘要和自动拼音的功能
增加保存到本地SQL文件的功能(3.1中未完成),完善各种在线发布和数据库发布功能
改进了下载算法,使下载图片和其他任意格式的文件更快更稳

还有本地任务数据编辑再发布功能 ,
自动获取tag(生成中文关键词功能),
自动英文->中文翻译功能  ,
任务定时自动更新功能 ,
任意格式文件下载功能 ,
(ACCESS,MYSQL,MSSQL)数据库发布模块编辑器
在高级版本中发布,如果需要这些高级功能或获取更多技术支持,请访问:链接

关键词:采网址 采内容 发内容 分步 缩略图 本地 循环采集 多页采集 分页采集 自动拼音 生成摘要 自定义网页编码 数据库发布模块 多网站发布 自动关键词 自动翻译 ACCESS MYSQL MSSQL 自动更新  


使用教程:

如果您有使用火车头以前版本的基础,相信3.2使用起来会更加得心应手

我们也为你准备好两套视频+语音的入门全面教程
请访问 
火车头内容采集器3.2版采集实战教程 http://bbs.locoy.com/spider-17468-1-1.html
火车头内容采集器3.2版模块制作教程 http://bbs.locoy.com/spider-17142-1-1.html
更多精彩内容其他人还在看

如何设置一个严格30分钟过期的Session示例介绍

SESSION和COOKIE是每个面试官必问的知识点,下面为大家介绍下如何设置一个严格30分钟过期的Session,具体示例如下,感兴趣的朋友可以参考下哈,希望对大家有所帮助
收藏 0 赞 0 分享

禁用Cookie三种方法(保护你的隐私)

cookie的作用很多人都知道——cookie里面保存着我们所浏览过的网页的记录,为了安全起见下面为大家介绍禁用Cookie的三种方法,感兴趣的朋友可以参考下哈
收藏 0 赞 0 分享

URL中井号的作用介绍

URL中的井号(#)是比较常见的,下面就为大家介绍一些有关井号的故事,感兴趣的朋友可以了解下
收藏 0 赞 0 分享

访问Excel的几种方式介绍

本文将为大家介绍下访问Excel的几种方式:通过OLEDB方式、通过Microsoft.Office.Interop.Excel访问及其他相关等等,感兴趣的朋友可以参考下,希望对大家有所帮助
收藏 0 赞 0 分享

HttpClient抓取网页的两种方式

可以利用NodeFilter对网页进行分析及利用Visitor对网页进行分析实现抓取网页,具体如下感兴趣的朋友可以参考下,希望对大家有所帮助
收藏 0 赞 0 分享

EditPlus 3设置字体大小(附图)

EditPlus3是我们经常使用的编辑工具,至于如何设置字体大小的问题,有很多朋友在问,下面有个不错教程,大家可以感受下
收藏 0 赞 0 分享

GHOST删除分区和修复硬盘坏扇区不仅仅是备份还原

如果你只是用GHOST来备份和还原数据的话,那你可委屈了这款“功能强大”的软件了。其实GHOST还有一些比较另类的功能,接下来为大家介绍下GHOST删除分区和修复硬盘坏扇区
收藏 0 赞 0 分享

Cookie的使用之保存与获取代码示例

比较实用的设置Cookie和获取Cookie方法,下面的示例大家可以参考下,希望对大家有所帮助
收藏 0 赞 0 分享

sharepoint 2010版本图文安装教程

这篇文章主要为大家详细介绍了Microsoft Share Point2010中文版图文安装的相关资料,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
收藏 0 赞 0 分享

Chrome开发者工具9个调试技巧详解

对于我们前端开发者来说,Chrome自带的开发者工具绝对是不可或缺的调试工具,我们常用的调试方法包含一些console等,而Chrome自带的开发者工具其实很强大,下面我们来聊聊一些你可能不知道的使用方法。
收藏 0 赞 0 分享
查看更多