Pandas新手填坑血泪史-DF中数据类型转换（object ->Float)

如题所述

举报该文章

相关建议 2024-08-14

从文件读取数据后，得到一个dataframe，其中一列名为item_price，为字符串类型（object）。目的为将此列转换为float类型。

初始尝试使用df.astype()进行转换时，遇到了ValueError：无法将字符串'$2.39'转换为浮点数。于是查阅其他方法，发现to_numeric()可能更适用。

to_numeric()用于转换数据类型，其中errors参数默认为raise，遇到非数字字符串时会报错。可调整为'coerce'，发生转换异常时使用NAN代替。

成功使用to_numeric()后，发现数据全部转换为NAN。原因在于设置的errors参数为'coerce'，实际数据中存在包含逗号和美元符号的字符串。

理解到to_numeric()的'coerce'参数作用后，意识到数据列存在问题。解决思路为去除数据中的逗号和美元符号，确保为纯数字字符串后进行转换。

最终，使用to_numeric()成功转换数据类型，证实了astype()并非问题所在，astype()使用更为直接简便。还提及了另一种实现方法，但其依赖于明确了解数据中逗号的分割位置。

数据转换过程中的坑，通过查阅资料、分析错误信息、调整参数及尝试不同方法得以解决。在此过程中，理解了转换函数的参数作用，以及数据预处理的重要性。填坑之路虽长，有你我并不孤单。

温馨提示：内容为网友见解，仅供参考

当前网址：https://aolonic.com/aa/d3nd44gnn1nak5154n.html

其他看法

无其他回答

Pandas新手填坑血泪史-DF中数据类型转换(object ->Float)
从文件读取数据后，得到一个dataframe，其中一列名为item_price，为字符串类型（object）。目的为将此列转换为float类型。初始尝试使用df.astype()进行转换时，遇到了ValueError：无法将字符串'$2.39'转换为浮点数。于是查阅其他方法，发现to_numeric()可能更适用。to_numeric()用于转换数据类型，其中error...