ASP+FSO生成的网页文件默认编码格式以及转换成UTF-8编码方法

所属分类: 网络编程 / ASP编程 阅读数: 1864
收藏 0 赞 0 分享
具体特征如下:
1、通过模板实现俄文正常。
2、通过后台数据库生成的静态俄文信息,后台显示正常, 前台乱码。
3、英文正常。
和该主题相关的类似或不同表达
FSO写UTF-8编码文件
FSO怎么才能生成utf-8编码的文件
FSO生成的文件默认是什么编码格式
如何转换成UTF-8编码
FSO生成静态网页的问题
ASP中用FSO生成文件代码如下
复制代码 代码如下:

function createfile(sfilename,scontent)
set fso=server.CreateObject("scripting.filesystemobject")
set f1=fso.opentextfile(sfilename,2,true,-1)
f1.write(scontent)
f1.close
set fso=nothing
end function

fso.opentextfile(sfilename,2,true,-1) 最后一个参数-1是指定编码格式为Unicode,编码格式为Unicode在网页显示的是UTF-16 little-endian。
OpenTextFile方法
创建指定文件并返回TextStream对象,该对象可用于读或写创建的文件。
object.OpenTextFile(filename[, iomode[, create[, format]]])
参数 object,必选项。应为FileSystemObjec或Folder对象的名称。 这里是fso。
filename,必选项。字符串表达式,指明要创建的文件。 这里是sfilename。
iomode,可选参数,表示该文件是被用来读、写还是追加,默认为1表示读,2表示写操作,8表示追加操作。
create,可选参数,如果文件不存在是否创建,默认为false,如果希望进行创建,则设置为true。
format,参数可为下列设置之一,默认为ASCII格式,并没有我们要的utf-8:
TristateUseDefault -2 以系统默认格式打开文件。
TristateTrue -1 以Unicode格式打开文件。
TristateFalse 0 以ASCII格式打开文件。
FSO的编码属性只有三种,系统默认,Unicode,ASCII,并没有我们要的utf-8,所以一般中文系统上使用FSO组件生成的文件都是gb2312编码格式。
解决方法一
GB2312编码包含俄语字母,如果页面设置为简体中文GB2312, 那么俄文能够正常显示, 但由于中文默认“宋体”显示,在 “宋体”中俄语会显示为全角字符,很难看,所以要采用外文字体,如“新罗马”或“Arial”等。中国客户那里可以交差, 但真正的俄国人浏览页面时, 就需要下载和安装中文,很不理想, 很可能导致放弃浏览网页。
解决方法二
ASP由于是一种古老的语言,它的一些功能对UTF-8支持非常差。FSO不支持直接生成UTF-8格式的文件,因为它无法指定需要的文件格式,比如,想生成一个UTF-8格式的文件,使用常用的Scripting.FileSystemObject对象就不行。必须换一种思路,用Adodb.Stream,当前一些blog程序就是这样实现的,如zblog。
Scripting.FileSystemObject 对象创建文件的函数,是下面方式:
FileSystemObject.CreateTextFile(filename[,overwrite[,unicode]])
其中的unicode属性是这样描述的:
可选项。Boolean值指明是否以Unicode或ASCII文件格式创建文件。如果以Unicode文件格式创建文件,则该值为True;如果以ASCII文件格式创建文件,则该值为False。如果省略此部分,则假定创建ASCII文件。
鲜然,无法用这个函数来创建UTF-8格式文件。
使用ADODB.Stream对象,使用方法见下面:
复制代码 代码如下:

Set objStream = Server.CreateObject("ADODB.Stream")
With objStream
.Open
.Charset = "utf-8"
.Position = objStream.Size
.WriteText=str
.SaveToFile server.mappath("/sitemap.xml"),2
.Close
End With
Set objStream = Nothing

附录:ASCII、Unicode、UTF-8介绍
ASCII是一种字符集,包括大小写的英文字母、数字、控制字符等,它用一个字节表示,范围是0-127。
由于ASCII表示的字符非常有限,各个国家或者地区在此基础上提出了自己的字符集,比如在中国应用非常广泛的GB2312,它为汉字提供了编码,用两个字节表示。
这些字符集之间互不兼容,相同的数字可能表示不同的字符,为信息交流带来了麻烦。
Unicode是一种字符集,它将世界上的所有字符映射成一个唯一的数字(code point),比如字母a对应的数字0x0041。目前Unicode还处于发展中,它所包容的字符越来越多。
在将Unicode表示的字符进行存储时,还需要一定的编码方式,比如UCS-2,它用两个字节来表示Unicode编码的字符。而UTF-8是Unicode字符集的另外一种编码方式,它是变长度的,最多6个字节,小于127的字符用一个字节表示,与ASCII字符集的结果一样,因而具有非常好的兼容性,ASCII编码下的英语文本不需要修改就可以当作UTF-8编码进行处理,应用非常广泛。
更多精彩内容其他人还在看

asp知识整理笔记4(问答模式)

这是关于asp知识整理的最后一份笔记,希望大家仔细阅读。
收藏 0 赞 0 分享

ASP基础知识VBScript基本元素讲解

这篇文章主要介绍了ASP基础知识VBScript基本元素的相关资料,需要的朋友可以参考下
收藏 0 赞 0 分享

ASP编码和解码函数详解

这篇文章主要介绍了ASP编码和解码函数的相关资料,需要的朋友可以参考下
收藏 0 赞 0 分享

ASP显示页面执行时间的方法

这篇文章主要介绍了ASP显示页面执行时间的方法,在本地测试一下输出页面需要多少时间,需要的朋友可以参考下
收藏 0 赞 0 分享

ASP基础入门第一篇(ASP技术简介)

本文将以 Active Server Pages 为中心,向你全面展示制作动态商业网站的步骤和技巧并通过大量的实例,让你在不断的理论和实践之中笑傲“网络”……
收藏 0 赞 0 分享

ASP基础入门第二篇(ASP基础知识)

这篇文章是ASP基础入门第二篇,第一篇展示了ASP动态网站设计的一些最基本的方法,相信通过实践各位对 ASP 已经有了最基本的了解,本文将进一步介绍ASP动态网站的一些基本技巧,需要的朋友可以参考下
收藏 0 赞 0 分享

ASP基础入门第三篇(ASP脚本基础)

通过前两篇的学习,相信各位已经对 ASP 的动态网站设计有了一个基本的概念和整体的印象。从本篇开始作者将从脚本语言的使用着手,由浅入深地带领大家探索 ASP 动态网站设计的真正奥秘。
收藏 0 赞 0 分享

ASP基础入门第四篇(脚本变量、函数、过程和条件语句)

大家在学习了脚本语言 VBScript 的变量、常量和过程的基本概念后,本期将继续向各位介绍 VBScript 的函数和语法。
收藏 0 赞 0 分享

ASP基础入门第五篇(ASP脚本循环语句)

在本文上两篇中,我们学习了脚本语言 VBScript 的变量、函数、过程和条件语句,本篇将继续给大家介绍 VBScipt 的循环语句,并对脚本语言在 ASP 中的应用加以总结。  
收藏 0 赞 0 分享

ASP基础入门第六篇(ASP内建对象Request)

从本篇开始作者从 ASP 内建对象着手,为大家详细剖析 ASP 的六个内建对象和各种组件的特性和方法,需要的朋友可以参考下
收藏 0 赞 0 分享
查看更多