当两个相似的类同时存在时,spark uber jar和spark-submit –jars之间的类路径解析

Classpath resolution between spark uber jar and spark-submit --jars when similar classes exist in both

当我的spark应用程序的uber jar和我的spark-submit shell命令的--jars选项的内容都包含相似的依赖项时,类加载的优先级是什么?

我从第三方库集成的angular提出这个问题。如果我将--jars设置为使用2.0版的第三方库,并且使用2.1版组装了该spark-submit脚本中的uber jar,则该类在运行时加载?

目前,我想保留对hdfs的依赖关系,并将其添加到spark-submit的--jars选项中,同时希望通过一些最终用户文档来要求用户设置此第三方库的范围将在其spark应用程序的maven pom文件中"提供"。


这在某种程度上由params控制:

  • spark.driver.userClassPathFirst