我创建了一个SQL表,它有一个varchar(10)类型的“ID”列
现在,当我解析CSV文件并将其加载到此表中时,ID列值(1,2,3,4,5,…)存储为(1.0,2.0,.3.0,.4.0,.5.0,…)。
我无法推断为什么在SQL中将列类型设置为Varchar时,所有id都转换为decimal,如何避免这种情况?
表的create语句:

CREATE TABLE INFO (
    AsOfDate DATE NOT NULL,
    Employee_ID VARCHAR(10) DEFAULT NULL,
    Emlpoyee_Name VARCHAR(200) DEFAULT NULL,
    Emlpoyee_Designation VARCHAR(200) DEFAULT NULL,
    KEY IDX1_INFO(Employee_ID)
    ) ENGINE = MyISAM DEFAULT CHARSET = latin1;

CSV文件如下所示:
20180215, 1, John, Data Analyst
20180215, 2, Alex, Full Stack Developer
20180215, 3, Paul, Senior Manager
.
.
.

要分析文件,我使用简单的Pandas逻辑:
df = pd.read_csv("/path/to/csv/file/")

备注:我不能将列类型声明为Int,因为有一些id,如A1、B7等。

最佳答案

这可能有助于:

  temp=u"""a,b,c,d
    2,2,2,2.0"""
    #after testing replace io.StringIO(temp) to filename
    df = pd.read_csv(io.StringIO(temp),
                     dtype={'a': int, 'b': float},
                     converters={'c': D.Decimal, 'd': D.Decimal})
print (df)
   a    b  c    d
0  2  2.0  2  2.0

for i, v in df.iterrows():
    print(type(v.a), type(v.b), type(v.c), type(v.d))

关于python - varchar值将存储为小数,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/48811978/

10-12 17:02