批处理处理文本文件去重复实现代码

所属分类: 脚本专栏 / DOS/BAT 阅读数: 322
收藏 0 赞 0 分享

最近需要将重复的内容去掉,所以就想到了使用bat或vbs实现,没想到网上已经有人写好了,测试也正好学习一下

使用方法:把文本拖到批处理上就行了。。。

@echo off
:: Code by oicu#lsxk.org 2007/11/29

rem chcp 437>nul
:: 看情况使用,utf-8编码的文件不能少了chcp命令,一般无需使用,
:: 但无论是否使用都不支持utf-16的文件。

:: pushd "%~dp1"
:: 如果不用pushd和popd,文件都要用绝对路径不能只用文件名。

if "%~1"=="" goto :EOF
set outputfile=%~dpn1_output%~x1

type nul>"%outputfile%"

echo Waiting...

for /F "tokens=1* delims=:" %%i in ('findstr /n .* "%~1"') do (
  findstr /B /E /C:"%%j" "%outputfile%">nul 2>&1 || echo.%%j>>"%outputfile%"
)

pause
start "" notepad "%outputfile%"
:: popd
exit

【 在 oicu (Oh! I see you!) 的大作中提到: 】
: 去重复倒是行。。缺点就是慢和保留原有的空行了。

以下是vbs实现的代码

以下是这个脚本的源代码,复制后另存为vbs后缀的文件,双击即可运行。文件要放在C盘根下的Text.TXT,请特别注意:文本中一行一条记录,不要有空行。

Const adOpenStatic = 3
Const adLockOptimistic = 3
Const adCmdText = &H0001 
Set objConnection = CreateObject("ADODB.Connection")
Set objRecordSet = CreateObject("ADODB.Recordset")

strPathToTextFile = "C:\"
strFile = "Test.txt"

objConnection.Open "Provider=Microsoft.Jet.OLEDB.4.0;" & _
   "Data Source=" & strPathtoTextFile & ";" & _
     "Extended Properties=""text;HDR=NO;FMT=Delimited"""

objRecordSet.Open "Select DISTINCT * FROM " & strFile, _
  objConnection, adOpenStatic, adLockOptimistic, adCmdText

Do Until objRecordSet.EOF

Set objFSO = CreateObject("Scripting.FileSystemObject")
   set Fp=objFSO.OpenTextFile("C:\test1.txt",8,True,0)
   fp.WriteLine objRecordSet.Fields.Item(0).Value
   fp.close
   set objFSO = nothing
   objRecordSet.MoveNext
Loop

更多精彩内容其他人还在看

Windows cmd命令行输入输出重定向问题

这篇文章主要介绍了Windows cmd命令行输入输出重定向问题,需要的朋友可以参考下
收藏 0 赞 0 分享

cmd下过滤文件名称的两种方法

这篇文章主要介绍了cmd下过滤文件名称的两种方法,需要的朋友可以参考下
收藏 0 赞 0 分享

DOS命令行下使用HaoZip进行文件压缩的方法

这篇文章主要介绍了DOS命令行下使用HaoZip进行文件压缩的方法,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
收藏 0 赞 0 分享

经常用的DOS命令大全(经典收藏)

DOS(Disk Operating System)是一个使用得十分广泛的磁盘操作系统,就连眼下流行的Windows9x/ME系统都是以它为基础。这篇文章主要介绍了经常用的DOS命令大全(经典收藏),需要的朋友可以参考下
收藏 0 赞 0 分享

一键配置jdk环境变量的批处理代码

在重装系统后,可能需要配置计算机的环境变量,在这里以配置Java环境变量为例讲解一种比较简单的设置方法,需要的朋友可以参考下
收藏 0 赞 0 分享

批处理版chm文件反编译器 v1.3

你手头是否有几本chm格式的电子书?你是否有过满世界搜索反编译chm软件的痛苦经历?你是否抱怨过这些软件有这样或那样的限制?然而,你是否意识到,就在你的系统里,微软已经为你准备好了小巧而强悍的反编译程序
收藏 0 赞 0 分享

纯批处理获取硬件信息的代码

此程序纯批处理,且纯净绿色,也不会在生成文件中包含我的个人信息,大家不要随意修改里面的代码结构,很可能自己电脑没问题,到了别的电脑就会获取不准
收藏 0 赞 0 分享

批处理万年历实现代码(包括农历日期)

这篇文章主要介绍了批处理万年历实现代码(包括农历日期),月历查询工具 最初发表于CN-DOS,输出数字排序有问题大家可以自行修复一下
收藏 0 赞 0 分享

批处理文件bat脚本实现代码自动提交和项目部署

这篇文章主要介绍了批处理文件bat脚本实现代码自动提交和项目部署,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
收藏 0 赞 0 分享

cmd环境变量命令set 设置永久环境变量命令setx

这篇文章主要介绍了cmd环境变量命令set 设置永久环境变量命令setx,需要的朋友可以参考下
收藏 0 赞 0 分享
查看更多