20070910更新的火车采集器3.2正式版发布下载
所属分类:
实用技巧 / 应用技巧
阅读数:
1728
收藏 0赞 0分享
火车头团队一直致力于为广大网站站点提供数据信息和实用的工具软件, 开发团队秉承“专业,专注,沉着,创新”的理念,用实力铸造精品。
经过2007年3月至2007年9月,近5个多个月的研发及几个版本的内部测试,一个具有全新内核和架构的强大信息采集,数据加工软件--火车采集器3.2版
呈献在大家面前,为始终支持和关爱火车软件发展的站长们献上一份谢礼。
火车采集器1.X-3.X一直免费使用并深受广大站长欢迎,通过大家对3.2测试版的反馈,无论在性能,功能和稳定性上面3.2都是以前版本无法比拟的,
我们此次发布的3.2正式版同样也是免费使用,没有任何限制(功能上附带3.1版的所有基本功能及3.2内部测试版发布的所有功能)
同时为了软件和更好发展及为部分用户更好的技术支持,3.2版也发布支持更多SEO功能和技术支持的个人、标准和企业版三种高级版本,各位朋友可按需选用 高级版本请访问这里
3.2版功能简介
继承3.1的优点,站点+任务式管理,多任务多线程同时运行
3.1版的基本功能可查看这里 http://www.locoy.com/article/show.php?itemid-8/page-1.html
下面仅对3.2正式版中新增的功能做简单列表:
采网址,采内容,发内容三个步骤可以分开分步操作
增加缩略图采集功能,并能保存到本地文件
增加多页采集,使采集多页下载链接或产品多页图片,参数,评论,价格内容成为可能
增加自定义网页编码类型,默认任何编码页都可以实现内部转换,都能正确采集,发布时请选择目标UTF8
增加循环采集(可采集列表和论坛回复列表类似的网页)
增加将循环采集匹配到的结果添加为新记录和间隔符分割的功能
增加内容采集中使用正则匹配的功能
增加WEB发布配置,保存每个网站的发布配置,单任务可以发布到多网站,但任务可以发布到网站的不同栏目
增加数据库发布模块,去掉以前的数据库直导配置,成熟的发布模块可以使不懂数据库结构的人使用数据库直导成为可能
增加分页采集自定义地址格式的功能,完善以前的分页采集中上10页下10页这种无法采集的问题
增加源代码查看和测试工具
增加软件内动态帮助,使用更为方便..
增加对任意采集标签里的内容自动生成摘要和自动拼音的功能
增加保存到本地SQL文件的功能(3.1中未完成),完善各种在线发布和数据库发布功能
改进了下载算法,使下载图片和其他任意格式的文件更快更稳
还有本地任务数据编辑再发布功能 ,
自动获取tag(生成中文关键词功能),
自动英文->中文翻译功能 ,
任务定时自动更新功能 ,
任意格式文件下载功能 ,
(ACCESS,MYSQL,MSSQL)数据库发布模块编辑器
在高级版本中发布,如果需要这些高级功能或获取更多技术支持,请访问:链接
关键词:采网址 采内容 发内容 分步 缩略图 本地 循环采集 多页采集 分页采集 自动拼音 生成摘要 自定义网页编码 数据库发布模块 多网站发布 自动关键词 自动翻译 ACCESS MYSQL MSSQL 自动更新
使用教程:
如果您有使用火车头以前版本的基础,相信3.2使用起来会更加得心应手
我们也为你准备好两套视频+语音的入门全面教程
请访问
火车头内容采集器3.2版采集实战教程 http://bbs.locoy.com/spider-17468-1-1.html
火车头内容采集器3.2版模块制作教程 http://bbs.locoy.com/spider-17142-1-1.html
Win XP系统语言栏丢失解决三例
案例一:
问:一台计算机使用Windows XP操作系统,最近任务栏内无法显示语言栏,我通过“区域和语言选项”里的设置找回了语言栏,重新启动计算机后,问题依旧,请问是什么问题造成的?
收藏 0赞 0分享
设计软件中的系统字体应用小技巧
大家都知道,在操作系统的安装目录下有字体库,要使用种字体首先需要安装,但是这会造成字体占用系统盘空间过多。设计使用的字体都不少,怎么说也有几个G,很占资源,下面教大家一个稍微节省资源的方法。
收藏 0赞 0分享
十个习惯让你精通新的开发技术
这篇文章,是从我的《高效开发人员的五个特征》一文中抽出的一个观点。从我自身的事业和习惯中,我考虑了很多方式怎么样才能有效地学习。
收藏 0赞 0分享
小谈RADMIN爆破
最近做渗透测试时常碰到RADMIN一类的东西..
一碰到此类的程序,一般我都会先看下对方把RADMIN的端口配置成什么..以及相应的PASS(加密过的)
收藏 0赞 0分享
联众密码的逆向算法公布
闲来无事,每天上联众,联众的密码经过加密后保存在本地注册表里,看看是怎么加密的。下了个ollydbg,一路跟踪,发现算法极其简单,给出Delphi版本的解密算法(加密部分有兴趣的一起来讨论)。算法比较粗糟,谁帮优化一下:)
收藏 0赞 0分享
关于三种主流WEB架构的思考
做WEB好几年了,各种语言和技术都稍有涉猎。今天心血来潮,突然想总结一下。其实不论什么技术,什么需求,通常WEB开发就是通过WEB前端管理一个或大或小或独立或分布式的关系型数据库,很多东西都是相通的。这里说的WEB架构,是指WEB应用开发中每种技术独有的资源组织形式(包括文件,数
收藏 0赞 0分享
一篇关于程序员性格的文章第1/3页
软件开发中人们很少注意个人性格问题。自从 1965年Edsger Dijkstra的有里程碑意义的文章“程序开发是一种人类活动”发表以来,程序员性格被认为是合理的和有成效的研究领域,虽然有些题目如“大桥建筑者的心理”和“对律师行为的研究实验”看起来可能是荒唐的,而在计算机领域,“
收藏 0赞 0分享
查看更多