关于正则表达式:PHP – BBCode 解析器 – 解析 bbcode 链接标记和未标记链接

PHP - BBCode parser - Parse both bbcode link tag and not tagged link

我需要这样做:

当用户插入一个 BBCode 标签时,我会使用 preg_replace 和 regex 进行一些转换。

例如

1
2
3
4
5
6
7
8
9
10
11
12
13
function forumBBCode($str){
   $format_search=array(
      '#\\[url=(.*?)\\](.*?)\\[/url\\]#i'
   );

   $format_replace=array(
      '$2'
   );

   $str=preg_replace($format_search, $format_replace, $str);
   $str=nl2br($str);
   return $str;
}

现在我也想要这个:当用户插入带有链接的普通文本时,这也必须被转换。我无法通过 preg_replace 函数执行此操作,因为如果我将代码编写为

1
2
3
4
5
$format_search
'#(www\\..*?)#i'

$format_replace
'$1'

它将转换链接 2 次(在 [url] 中以及当链接没有此标记时)。

所以我认为这个功能:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
    function checkLinks($string) {
    $arrelab="";
    $arr=split(' |\
\
'
, $string);
    for($i=0; $i<sizeof($arr); $i++) {
        echo $i." -".$arr[$i]."<br/>";
        if ((strpos($arr[$i], 'www.')!==false) or (strpos($arr[$i], 'http://')!==false) or (strpos($arr[$i], 'ftp://')!==false)) {
            if (strpos($arr[$i], '[url=')===false) {
                $arr[$i]=''.$arr[$i].'';
            }
        }

        $arrelab=$arrelab."".$arr[$i];
    }
    return $arrelab;
}

问题是我需要拆分换行符,至于空格。
任何帮助将不胜感激。

附言对不起我的英语不好:)

干杯


使用后向断言很容易解决。

1
preg_replace('#(?<![>/"])((http://)?www.........)#im', '$1'

因此,正则表达式将跳过任何包含在" 或 > 中或以 / 开头的 URL
这是一种解决方法,而不是解决方案。

PS: target="_blank" 是用户纠缠。把它剪掉。


最简单的选择是首先解析纯文本网址,并确保它们不会立即出现在等号之后。

来自马里奥斯的更新:

preg_replace('#(?<![>/"])(((http|https|ftp)://)?www[a-zA-Z0-9\\-_\\.]+)#im', '$1'


有一种更简单的方法可以做到这一点。我在 RedBonzai 开发人员博客中创建了一个演练。它的链接在这里:http://www.redbonzai.com/blog/web-development/how-to-create-a-bb-codes-function-in-php/

如果您有任何问题,请告诉我。

RedBonzai


你的问题可以通过阅读你的标题来识别..结合正则表达式进行解析

您不能使用正则表达式"解析"html 或 bb 代码,因为它们不是正则语言。

你应该编写(或找到)一个 bb 代码解析器,而不是使用正则表达式。

Google 的第一个 BB 代码解析器结果是 NBBC:新的 BBCode 解析器。但我从未使用过它,所以我无法评论质量。