DEDECMS V5.3采集简易教程

所属分类: CMS教程 / dedecms 阅读数: 495
收藏 0 赞 0 分享
关键字描述:教程 简易 采集 我们 内容 网址   如果 作者 V5.3

DedeCms V5.3 采集基础教程。

  首先说明一下的是,第一次写这种教程,有不当的地方请大家包涵。

  进入正文:

  采集过程其实就是copy的过程,只不过,我们copy的是显示结果,而采集主要针对源码进行。

  第1步,建立节点

  我们以图片中的网址为例,目标页面编码一定要选对,不然采集回来的内容会乱码,如果你采集回来的内容有乱码,首先要考虑的是编码问题,这里我们选utf-8,怎么知道别人的编码是什么呢?看看源码<content="text/html; charset=utf-8" />就会明白了。


“区域匹配模式”我选择是的正则表达式,因为如果选“字符串”,将有一些广告代码过滤不掉。

  第2步:文章网址匹配规则。 生活Tips欢迎您(http://ez4life.cn)

  这个就要看采集网站的源代码(图2)了,找到一个包含所有要采集内容网址的代码(要唯一,建议多使用Ctrl F),这样我们就确定了要采集区域的网址,不放心就测试一下。


图2
  最后结果如图3

图3

  第3步:在前面2步的基础上我们已经找到了需要采集的网址,下面来看具体的采集内容。

  在内容配置选项中,如果你比较懒,可以象我一样不要选那么多的选项,只选择你感兴趣的部分,如文章标题,作者及来源等,在dede cmsV5.3中已经把dede V5.1的规则进行了改造,易于初学者使用了,其基本形式是标签和内容放在一块的,V5.1要分开始标签和结束标签,其实原理都是一样的。

  这里讲讲自定义作者的问题。V5.3以前的版本采集时可以用@me="作者“的形式自定义作者,而v5.3只能用替换的方法实现了,当然也有不便之处,这样我们就确定了基本的东西了。



  第4步:便是我们要的内容核心了,这里会用到比较多的过滤规则,幸好dede V5.3给我们准备了一些常用的,不过,如果你想采集比较复杂的网页那还得学会一些常用的正则表达式了。这样我们就基本学会了dedecms V5.3的采集,是不是有点简单?

侠客站长站 (www.jb51.net )



  第5步:导出内容,这个我就不多讲了。
更多精彩内容其他人还在看

脚本之家使用火车头发布DEDECMS 5.5 出现乱码的解决办法

今天做了一个站测试用,由于是新站没有太多时候去添加内容,就想到用火车头来采集。采集的工作比较顺利。
收藏 0 赞 0 分享

dedecms 列表页标题修改图文方法(利于优化)

dedecms实现
收藏 0 赞 0 分享

DEDECMS 5.1的SEO技巧之栏目列表页优化

本人刚接触DEDECMS系统还不到半,觉得DEDE系统不错,很好优化,我现在介绍一下我在使用过程中的SEO技巧,希望给初学者一些帮助
收藏 0 赞 0 分享

DeDeCms V5.6 数据批量索引到淘特搜索引擎

由于DedeCms没有将文章的生成地址保存在数据库中,因此需要做的就是索引一个字段:LinkUrl来保存文章生成地址。
收藏 0 赞 0 分享

dedecms 问答系统取消积分与用户登陆验证的方法

现在我要用dedecms来做一个问答功能,功能是不需要用户登陆并可以提问,因为问题时需要积分所以我把登际与积分都取消了。
收藏 0 赞 0 分享

dedecms 5.3/5.5全站伪静态含SEO重复记录优化

DEDECMS系统栏目、文章页面、分页面伪静态和域名301重定向详细方法
收藏 0 赞 0 分享

dedecms 每个栏目下的文章总数的调用

实现统计每个栏目下的文章总数的调用修改方法,经网友测试基本上没有问题。
收藏 0 赞 0 分享

dedecms制作英文站需要修改的地方

我一直都不喜欢用DEDE做英文站,不是不好,而是需要改动的地方太多了,并不像一些网上说的改改字体,改改编码那么轻松的事情。
收藏 0 赞 0 分享

dedecms英文模板 英文网站程序的选择

dedecms英文模板目前很多,但一眼看上去都是一些老版本了,而且卖模板的人说是SEO过,其实网站程序的优化都没有做好,还不如自己动手改改 dedecms官方默认的模板。
收藏 0 赞 0 分享

DEDECMS 支付宝操作手册

织梦CMS携手支付宝推出DedeCMS V5.6全新支付接口,DedeCMS系统为国内做早开源的PHP内容管理系统,系统除了拥有强大,灵活的内容管理功能之外,还增加了分类、书库、黄页、圈子、问答等模块,同时该版本中整合了最新支付宝在线支付接口。
收藏 0 赞 0 分享
查看更多