批处理处理文本文件去重复实现代码

所属分类: 脚本专栏 / DOS/BAT 阅读数: 261
收藏 0 赞 0 分享

最近需要将重复的内容去掉,所以就想到了使用bat或vbs实现,没想到网上已经有人写好了,测试也正好学习一下

使用方法:把文本拖到批处理上就行了。。。

@echo off
:: Code by oicu#lsxk.org 2007/11/29

rem chcp 437>nul
:: 看情况使用,utf-8编码的文件不能少了chcp命令,一般无需使用,
:: 但无论是否使用都不支持utf-16的文件。

:: pushd "%~dp1"
:: 如果不用pushd和popd,文件都要用绝对路径不能只用文件名。

if "%~1"=="" goto :EOF
set outputfile=%~dpn1_output%~x1

type nul>"%outputfile%"

echo Waiting...

for /F "tokens=1* delims=:" %%i in ('findstr /n .* "%~1"') do (
  findstr /B /E /C:"%%j" "%outputfile%">nul 2>&1 || echo.%%j>>"%outputfile%"
)

pause
start "" notepad "%outputfile%"
:: popd
exit

【 在 oicu (Oh! I see you!) 的大作中提到: 】
: 去重复倒是行。。缺点就是慢和保留原有的空行了。

以下是vbs实现的代码

以下是这个脚本的源代码,复制后另存为vbs后缀的文件,双击即可运行。文件要放在C盘根下的Text.TXT,请特别注意:文本中一行一条记录,不要有空行。

Const adOpenStatic = 3
Const adLockOptimistic = 3
Const adCmdText = &H0001 
Set objConnection = CreateObject("ADODB.Connection")
Set objRecordSet = CreateObject("ADODB.Recordset")

strPathToTextFile = "C:\"
strFile = "Test.txt"

objConnection.Open "Provider=Microsoft.Jet.OLEDB.4.0;" & _
   "Data Source=" & strPathtoTextFile & ";" & _
     "Extended Properties=""text;HDR=NO;FMT=Delimited"""

objRecordSet.Open "Select DISTINCT * FROM " & strFile, _
  objConnection, adOpenStatic, adLockOptimistic, adCmdText

Do Until objRecordSet.EOF

Set objFSO = CreateObject("Scripting.FileSystemObject")
   set Fp=objFSO.OpenTextFile("C:\test1.txt",8,True,0)
   fp.WriteLine objRecordSet.Fields.Item(0).Value
   fp.close
   set objFSO = nothing
   objRecordSet.MoveNext
Loop

更多精彩内容其他人还在看

mshta命令用法示例

这篇文章主要介绍了mshta命令用法示例 ,需要的朋友可以参考下
收藏 0 赞 0 分享

使用BAT批处理执行sql语句的代码

有时候需要执行一些Sql语句时,不想开企业管理器,或者是发给客户执行但那边又不懂代码,这时就可以用下面方法
收藏 0 赞 0 分享

批处理的图形界面实现方法小结

其实所谓的图形界面就是通过bat通过调用mshta来实现的一些对话框效果,这里特整理下, 方便需要的朋友
收藏 0 赞 0 分享

批处理中的echo命令图文详解

这篇文章主要介绍了批处理中的echo命令图文详解,里面都附有详细的图片执行效果,非常不错需要的朋友可以参考下
收藏 0 赞 0 分享

批处理中常用命令介绍(Echo、rem、goto、call、pause、if、for)

这篇文章主要介绍了批处理中常用命令介绍,包括Echo、rem、goto、call、pause、if、for,学习bat必备的啊
收藏 0 赞 0 分享

改变cmd命令提示符颜色的3个小技巧

这篇文章主要介绍了改变cmd命令提示符颜色的3个小技巧,推荐使用第三个技巧,需要的朋友可以参考下
收藏 0 赞 0 分享

使用BAT批处理在RAR压缩文件中批量添加文件的方法

这篇文章主要介绍了使用BAT批处理在RAR压缩文件中批量添加文件的方法,可以用在很多地方,例如做下载加的朋友,想要加个网站快捷方式在以前压好的压缩文件中等,需要的朋友可以参考下
收藏 0 赞 0 分享

bat 传递超过10个参数的情况

批处理文件中可引用的参数为%0~%9, %0是指批处理文件的本身,也可以说是一个外部命令;%1~%9是批处理参数,也称形参;而替换形参的实参若超过了批处理文件中所规定数值(9个)且想在批处理文件中应用这些实参的话,shift命令可以帮你实现
收藏 0 赞 0 分享

BAT 参数去引号(各种去引号的奇葩方式)

这篇文章主要介绍了BAT 参数去引号,各种去引号的奇葩方式,需要的朋友可以参考下
收藏 0 赞 0 分享

使用批处理命令设置windows系统的ip地址和dns附图

这篇文章主要介绍了如何使用批处理命令设置windows系统的ip地址和dns,需要的朋友可以参考下
收藏 0 赞 0 分享
查看更多