关于从XMLReader打开的simplexml中的php:CData

CData in simplexml opened from XMLReader

我有一堆XML文件,使用XMLReader将其加载到脚本中,创建DOM对象,然后转换为Simplexml。

问题是XML文件之一使用的SIMPLEXML会忽略的CDATA,通常使用SIMPLEXML_LOAD_FILE,我会添加LIBXML_NOCDATA参数,但是由于我使用的是simplexml_import_dom,因此我无法弄清楚如何在下面的sceanrio中忽略CDATA。

有什么想法吗?

非常感谢
布雷特

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
$file = 'test.xml';
$reader = new XMLReader();
$reader->open($file);      
while ($reader->read())
{
    // are we in a product?
    if ($reader->nodeType == XMLReader::ELEMENT &&
        strtolower($reader->localName) == 'product')

    {
        if (!$node = $reader->expand()) {
            //do nothing
        }
        else {
             // expand the node into a DOMNode
        // Convert to SimpleXML via DOM, messy but SimpleXML is soo much nicer.
        $dom  = new DomDocument();
        $dom->appendChild($dom->importNode($node, true));
        $products = simplexml_import_dom($dom);

        // do whatever we want to do with the product data

}

您可以尝试类似:

1
2
3
<?php
$str = $dom->saveXML();
$product = simplexml_load_string($str, 'SimpleXMLElement', LIBXML_NOCDATA | LIBXML_NOBLANKS);


关于SimpleXML对CDATA节点的处理似乎有很多困惑和错误信息。 它不会"忽略" CDATA,它只是通过将特定节点表示为对象而不是纯字符串来记住该特定节点在CDATA中。

如果您始终遵循将SimpleXML的返回值显式转换为字符串的优良作法,则应该可以看到CDATA的内容。

有关更多信息,请参见http://php.net/function.simplexml-load-string.php#84365

另外,您提到的LIBXML_NOCDATA参数可以传递给simplexml_load_string。 如果由于某些其他原因确实需要XMLReader,则可以使用$reader->readOuterXML()而不是通过DOMDocument进行转换。