pandas 标量UDF失败，IllegalArgumentException

本文介绍了 pandas 标量UDF失败，IllegalArgumentException的处理方法，对大家解决问题具有一定的参考价值，需要的朋友们下面随着小编来一起学习吧！

问题描述

首先，如果我的问题很简单，我深表歉意.我确实花了很多时间研究它.

First off, I apologize if my issue is simple. I did spend a lot of time researching it.

我正在尝试按照此处.

这是我的代码:

from pyspark import SparkContext
from pyspark.sql import functions as F
from pyspark.sql.types import *
from pyspark.sql import SQLContext
sc.install_pypi_package("pandas")
import pandas as pd
sc.install_pypi_package("PyArrow")

df = spark.createDataFrame(
    [("a", 1, 0), ("a", -1, 42), ("b", 3, -1), ("b", 10, -2)],
    ("key", "value1", "value2")
)

df.show()

@F.pandas_udf("double", F.PandasUDFType.SCALAR)
def pandas_plus_one(v):
    return pd.Series(v + 1)

df.select(pandas_plus_one(df.value1)).show()
# Also fails
#df.select(pandas_plus_one(df["value1"])).show()
#df.select(pandas_plus_one("value1")).show()
#df.select(pandas_plus_one(F.col("value1"))).show()

脚本在最后一条语句处失败:

The script fails at the last statement:

我在这里想念什么?我只是在遵循手册.谢谢您的帮助

What am I missing here? I am just following the manual. Thanks for your help

issues

pandas 标量UDF失败，IllegalArgumentException

问题描述

推荐答案