我在熊猫中有以下数据框
需要将所有值插入带有汉字的数据仓库中,但汉字被视为垃圾(?????)(百å¨è±±åšï¼ˆèˆŸå±±ï¼‰å•¤é…'有é™å… ¬å¸
)如上
插入查询是动态准备的。
我需要有关如何处理以下场景的帮助:
将文件读取为UTF-8,并使用字符集UTF-8使用pyodbc连接写入数据仓库。
df=pd.read_csv(filename,dtype='str',encoding='UTF-8')
cnxn = database_connect() ##Connect to database##
cnxn.setencoding(ctype=pyodbc.SQL_CHAR, encoding='UTF-8')
cnxn.autocommit = True
cursor = cnxn.cursor()
for y in range(len(df)):
inst='insert into '+tablename+' values ('
for x in range(len(clm)):
if str(df.iloc[y,x])=='nan':
df.iloc[y,x]=''
if x!=len(clm)-1:
inst_val=inst_val+"'"+str(df.iloc[y,x]).strip().replace("'",'')+"'"+","
else:
inst_val=inst_val+"'"+str(df.iloc[y,x]).strip().replace("'",'')+"'"+")"
inst=inst+inst_val #########prepare insert statment from values inside in-memory data###########
inst_val=''
print("Inserting value into table")
try:
cursor.execute(inst) ##########Execute insert statement##############
print("1 row inserted")
except Exception as e:
print (inst)
print (e)
同样的值应该插入sql数据仓库
最佳答案
您正在使用动态SQL构造包含汉字的字符串文字,但是您将其创建为
insert into tablename values ('你好')
当SQL Server期望Unicode字符串文字形式为
insert into tablename values (N'你好')
您最好使用适当的参数化查询来避免此类问题:
sql = "insert into tablename values (?)"
params = ('你好',)
cursor.execute(sql, params)
关于python - 汉字插入问题,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/57721682/