关于表格的正则表达式讨论(表格)

所属分类: 网络编程 / 正则表达式 阅读数: 353
收藏 0 赞 0 分享
看过许多UBB代码,包括JS,ASP,JSP的,一直没发现表格的UBB,虽然可以直接用HTML模式实现相同表格功能,但对于某些开放的站点来说开放HTML模式终究是不合适的,故一直想实现表格的UBB。

     我的设想是在HTML编辑器(HTML,FRONTPAGE,DW)中作好表格,把<替换为[,>替换为],直接复制HTML并提交发布。

     可惜经过实践,发现很难。因为表格的HTML标记和其他元素的HTML标记差别很明显,主要原因TD,TR,特别是TABLE都能嵌套。其实我遇到的关键问题在于我不会写 不包含某个单词或语句(非单字符)的正则 ,譬如下面标记


QUOTE:
[TABLE][TR]  [TD]哈哈[TABLE][TR][TD]的[/TD][/TR][/TABLE][/TD][/TR][/TABLE]
你要匹配正确[TD]*[/TD]你就得必须保证*不包括[TABLE][TR][TD]等,注意不能用[^\[]*?啊,因为用他无法匹配正确的[/TD]的,所以问题在与我怎么保证这个*不包括[TABLE][TR][TD]呢,(我不会写)。所以我:

退一步,先用\[td[^\]]*?\][^\[]*?\[table找到最后一个(其实最内层的)表格,然后把最内层的表格转为HTML标记,然后循环从头开始再来一次,一直到所有标记被替换。这个理论上是可以实现的。我用JSP正在实验,需要时间,希望有兴趣朋友用ASP,PHP实验一下。

因为我急用,所以我又退了一步,就是直接查找][TABLE]等标记然后替换,有4个表达式,[TABLE][TR][TD]、[/TD][/TR][TR][TD]、[/TD][TD]、[/TD][/TR][TABLE] ,大家知道,UBB需要把/R/N替换成<BR>的,于是我用上面作出的正则查找并替换掉所有[TABLE]和[TR]和[TD]和[/TD]和[/TR]和[/TABLE]中的换行。其实这个表达式比下面表达式就多了这个替换换行功能,其不足之处是很明显的,就是不能完善的剔除非配套的标记,必须保证所有TABLE标记是正确配套的(有TBODY的再改改就是了),否则乱套。总 这一步我实践还不错。

再退一步,其实没法退了,就是直接单个查找替换[TABLE]等标记,这是最苯的方法了,也是效果最不好的,因为大家知道在HTML编辑器里的表格标记中好多换行的,而UBB是为换行转为<BR>的,所以这个方法实现了会发现好多空行的,而且这个方法和上面那一步一个共同缺点就是更不能剔除非配套标记。


附我写的退一步后的正则:(我用JSP)


QUOTE:
\\[(table)([^\\[]*?)\\][^\\[]*?\\[tr\\][^\\[]*?\\[td([^\\[]*)\\]|\\[\\/(td)\\][^\\[]*?\\[\\/tr\\][^\\[]*?\\[tr\\][^\\[]*?\\[td([^\\[]*)\\]|\\[\\/(td)\\][^\\[]*?\\[td([^\\[]*)\\]|\\[\\/(td)\\][^\\[]*?\\[\\/tr\\][^\\[]*?\\[\\/table\\]
我想如果是管理员发布信息什么的,能保证表格标记的正确的话用这个还可以的。其实如果有人想捣乱的话,再严谨的UBB也不能防止的啊。
欢迎有兴趣者来此讨论,提出更好建议,打造最好最全的UBB。

[Ctrl+A 全选 注:引入外部Js需再刷新一下页面才能执行]
更多精彩内容其他人还在看

正则表达式匹配 非XXX的行

问题:如何匹配"非:.+123.123.123.10.+ " 行
收藏 0 赞 0 分享

正则表达式不包含属性

一个标签里不包含某个属性 的 正则表达式的写法
收藏 0 赞 0 分享

ASP正则函数替换分页后的参数

在分页系统里面用到的把page后面得东西都给丢掉
收藏 0 赞 0 分享

asp match正则函数使用Matchs实例

asp matchs函数提供了对正则表达式匹配的只读属性的访问。一直都用这个函数,没想到本站竟然没有这类文章,汗一个,最近我会多加一些这样的文章
收藏 0 赞 0 分享

asp 图片正则 替换,替换前检查图片是不是本地地址的方法

这个图片正则先检查图片的地址,不是本地的则用本地的asp突破盗链,方便使用,注意是答chinaz的朋友问的一个问题
收藏 0 赞 0 分享

java正则表达式彻底研究

从J2SE1.4起Java增加了对正则表达式的支持就是java.util.regex包
收藏 0 赞 0 分享

正则表达式口诀 正则表达式学习工具

正则表达式口诀 + 常用的正则表达式 + 正则表达式学习工具+正则处理工具 正则是每个程序员绕不开的堡垒,只有把它攻下来。我觉得正则之所以难,第一难是需要记忆,第二难是要求具备抽象逻辑思维。
收藏 0 赞 0 分享

比较实用的正则表达式学习笔记

最近在学习正则,一些比较有用的东西怕忘记,记下来,比较乱,想一条记录一条
收藏 0 赞 0 分享

asp只采集网站可见文本的正则

它可以过虑Js 可以过滤 CSS 过滤HTML标识,只采集页面的可见文本。
收藏 0 赞 0 分享

asp.net常用正则表达式

比较常用的多种语言支持的正则整理收集
收藏 0 赞 0 分享
查看更多