我在熊猫中有以下数据框

python - 汉字插入问题-LMLPHP

需要将所有值插入带有汉字的数据仓库中,但汉字被视为垃圾(?????)(百å¨è±±åšï¼ˆèˆŸå±±ï¼‰å•¤é…'有é™å… ¬å¸
)如上
插入查询是动态准备的。
我需要有关如何处理以下场景的帮助:

将文件读取为UTF-8,并使用字符集UTF-8使用pyodbc连接写入数据仓库。

df=pd.read_csv(filename,dtype='str',encoding='UTF-8')
cnxn = database_connect() ##Connect to database##
cnxn.setencoding(ctype=pyodbc.SQL_CHAR, encoding='UTF-8')
cnxn.autocommit = True
cursor = cnxn.cursor()
for y in range(len(df)):
 inst='insert into '+tablename+' values ('
 for x in range(len(clm)):
  if str(df.iloc[y,x])=='nan':
   df.iloc[y,x]=''
  if x!=len(clm)-1:
   inst_val=inst_val+"'"+str(df.iloc[y,x]).strip().replace("'",'')+"'"+","
  else:
   inst_val=inst_val+"'"+str(df.iloc[y,x]).strip().replace("'",'')+"'"+")"
 inst=inst+inst_val #########prepare insert statment from values inside in-memory data###########
 inst_val=''
 print("Inserting value into table")
 try:
  cursor.execute(inst) ##########Execute insert statement##############
  print("1 row inserted")
 except Exception as e:
  print (inst)
  print (e)


同样的值应该插入sql数据仓库

最佳答案

您正在使用动态SQL构造包含汉字的字符串文字,但是您将其创建为

insert into tablename values ('你好')


当SQL Server期望Unicode字符串文字形式为

insert into tablename values (N'你好')


您最好使用适当的参数化查询来避免此类问题:

sql = "insert into tablename values (?)"
params = ('你好',)
cursor.execute(sql, params)

关于python - 汉字插入问题,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/57721682/

10-09 04:07