asp.net保存远程图片的代码

所属分类: 网络编程 / ASP.NET 阅读数: 861
收藏 0 赞 0 分享
注意:并没有实现CSS中的图片采集,且图片的正则还有待完善。
复制代码 代码如下:

using System;
using System.Data;
using System.Configuration;
using System.Web;
using System.Web.Security;
using System.Web.UI;
using System.Web.UI.WebControls;
using System.Web.UI.WebControls.WebParts;
using System.Web.UI.HtmlControls;

//引入空间
using System.Net;
using System.IO;
using System.Text;
using System.Text.RegularExpressions;
using System.Collections;

/// <summary>
/// 采集
/// </summary>
public class caiji
{
public caiji()
{
//
// TODO: 在此处添加构造函数逻辑
//
}

/// <summary>
/// 要采集的网页的连接地址
/// </summary>
/// <param name="url">url</param>
/// <returns></returns>
public static string caijiByUrl(string url,string chargest,string path)
{
string str = GetSourceTextByUrl(url,chargest);

ArrayList lib = new ArrayList();

int i = 0;
//根据url取得网站域名
Uri uri = new Uri(url);

//Scheme或者协议,一般为http,Host为取得域名
string baseurl = uri.Scheme + "://" + uri.Host + "/";

//提取出url,包括src等信息
//\S匹配任何非空白字符
Regex g = new Regex(@"(src=(""|\')\S+\.(gif|jpg|png|bmp)(""|\'))", RegexOptions.Multiline | RegexOptions.IgnoreCase);

MatchCollection m = g.Matches(str);

foreach (Match math in m)
{
//已经提取到图片的路径了,但还需要分绝对路径,相对路径,以及后缀名是否为图片,因为可能为.asp,.aspx这些,比如验证码图片
string imgUrl = math.Groups[0].Value.ToLower();//转成小写,=号之间可能有不定的空格

//去除src与单引号,双引号
imgUrl = imgUrl.Replace("src","");
imgUrl = imgUrl.Replace("\"","");
imgUrl = imgUrl.Replace("'","");
imgUrl = imgUrl.Replace("=","");
imgUrl = imgUrl.Trim();

//路径处理
if (imgUrl.Substring(0, 4) != "http")
{
//需要判断是否是绝对路径还是相对路径
if (imgUrl.Substring(0, 1) == "/")
{
imgUrl = baseurl + imgUrl;
}
else
{
imgUrl = url.Substring(0,url.LastIndexOf("/") + 1) + imgUrl;
}
}

//判断元素是否已经存在,-1为不存在
if (lib.IndexOf(imgUrl) == -1)
{
lib.Add(imgUrl);
}
}

string str_ = string.Empty;
WebClient client = new WebClient();

for (int j = 0; j < lib.Count; j++)
{
string savepath = path + DateTime.Now.Month + DateTime.Now.Day + DateTime.Now.Minute + DateTime.Now.Second + j + lib[j].ToString().Substring((lib[j].ToString().Length) -4,4);
try
{
client.DownloadFile(new Uri(lib[j].ToString()), savepath);
str_ += lib[j].ToString() + "<br /> 保存路径为:" + savepath + "<br /><br />";
}
catch (Exception e)
{
str_ += e.Message;
}

}

return str_;
}

public static string GetSourceTextByUrl(string url,string chargest)
{
WebRequest request = WebRequest.Create(url);
request.Timeout = 20000;//20秒超时
WebResponse response = request.GetResponse();

Stream resStream = response.GetResponseStream();
StreamReader sr = new StreamReader(resStream,Encoding.GetEncoding(chargest));
return sr.ReadToEnd();
}
}

使用:比如我是保存到upload文件夹中的:
复制代码 代码如下:

string path = Server.MapPath("~/upload/");
Response.Write(caiji.caijiByUrl(https://www.jb51.net, "utf-8", path));
更多精彩内容其他人还在看

asp.net中利用ashx实现图片防盗链代码

直接分析盗链原理:看下面用httpwatch截获的http发送的数据
收藏 0 赞 0 分享

ASP.NET程序中常用代码汇总

对于学习asp.net的朋友能用的到
收藏 0 赞 0 分享

asp.net 无重复随机数代码

asp.net产生无重复随机数的实现代码
收藏 0 赞 0 分享

asp.net(C#)中上传大文件的几中常见应用方法

最近博客需要做一个文件上下载功能,我从网上找了点资料,整理了下希望对大家有帮助!
收藏 0 赞 0 分享

asp.net AJAX实现无刷新获得数据

提供一个使用AJAX实现无刷新判断注册用户名是否被注册的代码:
收藏 0 赞 0 分享

Ajax.net Sys未定义错误解决办法

用Asp.net2.0开发的系统,使用了Ajax技术,在本地没有任何问题!但是发布到Web托管服务器上后,系统总是出现“Sys 未定义”的错误!
收藏 0 赞 0 分享

asp.net(c#)判断远程图片是否存在

不错的应用,大家可以拓展到,判断远程文件是否存在等功能
收藏 0 赞 0 分享

asp.net保存远程图片的代码

最近有点烦,没怎么看书,几天下来,就研究了一个保存远程图片的。
收藏 0 赞 0 分享

Asp.Net类库中发送电子邮件的代码

发送电子邮件是许多需要用户注册的网站的通用功能,通过正则表达式我们可以过滤掉不符合电子邮件格式的输入,但是仍没有办法确保用户填写的电子邮件地址一定是他本人真实有效的电子邮件地址
收藏 0 赞 0 分享

ASP.NET表单验证方法详解第1/2页

在表单提交的时候,经常需要对录入信息的长度、格式、内容等进行验证,以便获得合理的信息。在ASP.NET开发中主要的验证方法,我总结了一下,主要有一下几种,如有不足之处请朋友们予以指出。
收藏 0 赞 0 分享
查看更多