ruby+nokogori抓取糗事百科前10页并存储进数据库示例

所属分类: 脚本专栏 / ruby专题 阅读数: 1950
收藏 0 赞 0 分享

ruby,nokogori,爬取糗事百科最新的10页加图片比并同时保存进文本跟数据库

复制代码 代码如下:

#encoding:utf-8
require "open-uri"
require "nokogiri"
require "mysql"
@dbh=Mysql.real_connect("localhost","root","dengli","pachong")
@file=open("qb.txt","w")
def getQiubai(url)
  data=open(url){|f| f.read}
  doc=Nokogiri::HTML(data)
  doc.css('div.block.untagged.mb15.bs2').each{|p|
    content=p.css('div.content').text
    @file.puts("#{content}\n")
    img=p.css('div.thumb img').each{|img|
       imgAddr=img.attr('src')
       @file.puts("#{imgAddr}\n")
       time=Time.now
       sql="INSERT INTO qiushibaike (`body`,`img`,`time`) VALUES ('#{content}','#{imgAddr}','#{time}')"
       @dbh.query(sql)
       }
  }
end
for i in 1..10
  @file.puts("这是第#{i}页")
  url="http://www.qiushibaike.com/8hr/page/#{i}"
  getQiubai(url)
end

更多精彩内容其他人还在看

Ruby简明教程之循环语句介绍

这篇文章主要介绍了Ruby简明教程之循环语句介绍,非常简洁的讲解,可以作为语法备忘,需要的朋友可以参考下
收藏 0 赞 0 分享

Ruby简明教程之判断语句介绍

这篇文章主要介绍了Ruby简明教程之判断语句介绍,非常简洁的讲解,可以作为语法备忘,需要的朋友可以参考下
收藏 0 赞 0 分享

Ruby简明教程之数组和Hash介绍

这篇文章主要介绍了Ruby简明教程之数组和Hash介绍,非常简洁的讲解,可以作为语法备忘,需要的朋友可以参考下
收藏 0 赞 0 分享

Ruby简明教程之方法(Method)介绍

这篇文章主要介绍了Ruby简明教程之方法(Method)介绍,ruby的方法分为实例方法、类方法、函数方法等,本文分别做了讲解,需要的朋友可以参考下
收藏 0 赞 0 分享

Ruby字符串、条件、循环、数组、Hash、类基本操作笔记

这篇文章主要介绍了Ruby字符串、条件、循环、数组、Hash、类基本操作笔记,需要的朋友可以参考下
收藏 0 赞 0 分享

Ruby中字符串左侧补零方法实例

这篇文章主要介绍了Ruby中字符串左侧补零方法实例,常用的方法是使用字符的rjust方法来实现,需要的朋友可以参考下
收藏 0 赞 0 分享

Rails脚手架使用实例

这篇文章主要介绍了Rails脚手架使用实例,通过8个步骤来实现一个完整案例,需要的朋友可以参考下
收藏 0 赞 0 分享

rails上传图片代码实例

这篇文章主要介绍了rails上传图片代码实例,包含model层和view层的代码,需要的朋友可以参考下
收藏 0 赞 0 分享

rails创建应用程序实例

这篇文章主要介绍了rails创建应用程序实例,本文从零开始教你完成一个rails网站应用的创建过程,需要的朋友可以参考下
收藏 0 赞 0 分享

rails常用数据库查询操作、方法浅析

这篇文章主要介绍了rails常用数据库查询操作、方法浅析,总结的比较全,WEB开发种常用的数据库操作都列出了rails对应代码,需要的朋友可以参考下
收藏 0 赞 0 分享
查看更多