JupyterNotebook运行Pyspark出现异常：′PipelinedRDD′ object has no attribute ′toDF′

问题描述

我在使用jupyter notebook连接pyspark进行pyspark操作，在使用’toDF‘函数将rdd转换为DataFrame出现‘PipelinedRDD' object has no attribute 'toDF'的异常。但是奇怪的一点是，我用pyspark启动spark shell直接进行操作时，’toDF‘函数是可以正常使用的。