Pandas in Python
数据筛选
https://blog.csdn.net/g863402758/article/details/53488140
- 多列数据筛选的逻辑关系记得每组加上圆括号
- unix时间戳转换
报错记录:关于这个查到一个issue #7846, 但仍不知怎么处理1data["date"] = pd.to_datetime(data["Timestamp UTC ms"],unit='ms',utc=True).tz_convert('Asia/Shanghai')23TypeError: index is not a valid DatetimeIndex or PeriodIndex
最后发现换到index就没报错了
列操作
调整列顺序
1df = df[['user_id','book_id','rating','mark_date']] # 调整列顺序为'user_id','book_id','rating','mark_date'2```34- 列删除5- `axis`6```python7data = data.drop(['Room','Day','UTC','Time'],axis=1)字符串类型列的操作
1data.insert(0,'date',data['UTC'].str[:10])列改名
https://www.jianshu.com/p/9e43c7bc26cb1data = data.rename(columns={'Timestamp UTC ms':'date'})2```345## 列数据类型6https://www.jb51.net/article/139630.htm7- 在对数据进行处理之前应该先查看加载数据的相关信息8```python9data.info()- 修改某一列的数据类型
1data['UTC'] = data['UTC'].astype('str')