Ruby实现网页图片抓取

所属分类: 脚本专栏 / ruby专题 阅读数: 1188
收藏 0 赞 0 分享

前段时间看到很多人写的下妹子脚本,自己也写一个

module CommonHelper
 
 require 'nokogiri'
 require 'open-uri'
 
 def down_load_xmz
  site_url = "http://www.xxx.com"
 
  for index_page in 1..141
   doc_html = Nokogiri::HTML(open(site_url+'/share/comment-page-'+index_page.to_s))
   doc_html.css("#comments p img").each do |item_img|
    puts item_img[:src]
    download_img(item_img[:src])
   end
  end
 end
 
 ########下载图片
 def download_img(img_url)
  begin
   img_file = open(img_url) { |f| f.read }
   file_name = img_url.split('/').last
   #puts file_name
   open("public/meizi/"+file_name, "wb") { |f| f.write(img_file) }
   return "/public/meizi/"+file_name
  rescue => err
   puts err
   return ''
  end
 end
 
end

更多精彩内容其他人还在看

Ruby 面向对象知识总结

这篇文章主要介绍了Ruby 面向对象的的相关资料,文中讲解非常详细,实例代码帮助大家更好的理解和学习,感兴趣的朋友可以了解下
收藏 0 赞 0 分享

Ruby中任务构建工具rake的入门学习教程

这篇文章主要介绍了Ruby中任务构建工具rake的入门学习教程,讲解了包括命名空间和默认任务的执行等基础知识,需要的朋友可以参考下
收藏 0 赞 0 分享

Ruby程序中发送基于HTTP协议的请求的简单示例

这篇文章主要介绍了Ruby程序中发送基于HTTP协议的请求的简单示例,包括对HTTPS请求的介绍,需要的朋友可以参考下
收藏 0 赞 0 分享

Ruby的字符串与数组求最大值的相关问题讨论

这篇文章主要介绍了Ruby中的字符串与数组求最大值的相关问题,文中还提到了sort排序方法的相关用法,需要的朋友可以参考下
收藏 0 赞 0 分享

Ruby中Time对象的常用函数总结

这篇文章主要介绍了Ruby中Time对象的常用函数总结,包括Ruby中一些实用的时间算法,需要的朋友可以参考下
收藏 0 赞 0 分享

详解Ruby中正则表达式对字符串的匹配和替换操作

这篇文章主要介绍了Ruby中正则表达式对字符串的匹配和替换操作,包括对结果分组和一些特殊全局变量的介绍,需要的朋友可以参考下
收藏 0 赞 0 分享

深入剖析Ruby设计模式编程中对命令模式的相关使用

这篇文章主要介绍了Ruby设计模式编程中对命令模式的相关使用,文中还讲到了关于观察者模式和命令模式的一些概念区别,需要的朋友可以参考下
收藏 0 赞 0 分享

实例解析Ruby设计模式开发中对观察者模式的实现

这篇文章主要介绍了实例解析Ruby设计模式开发中对观察者模式的实现,Ruby中自带的observer类自然是绝佳的使用示例,需要的朋友可以参考下
收藏 0 赞 0 分享

设计模式中的观察者模式在Ruby编程中的运用实例解析

这篇文章主要介绍了设计模式中的观察者模式在Ruby编程中的运用实例解析,观察者模式中主张设立观察者对象来降低对象之间的耦合,需要的朋友可以参考下
收藏 0 赞 0 分享

解析proxy代理模式在Ruby设计模式开发中的运用

这篇文章主要介绍了proxy代理模式在Ruby设计模式开发中的运用,通过代理模式以客户透明的形式可以动态地为目标对象加以行为控制,需要的朋友可以参考下
收藏 0 赞 0 分享
查看更多