Python中标准库学习笔记
Python中标准库学习笔记
一、os库
1.获取当前的文件相对路径——os.getcwd()
import os
path = os.getcwd()
print(path)
/Users/jackeroo
2.列出指定路径下的文件夹包含的文件和子文件名称——os.listdir()
import os
path = '/Users/jackeroo/Downloads'
file_list = os.listdir(path)
for file in file_list:
print(file)
.DS_Store
.localized
2021中国物流科技发展报告-罗戈研究-2021-247页.pdfå
2020哔哩哔哩流量生态白皮书-蓝鲸浑水-2020.12-95页.pdf
Compressor_4.5.2_MAS__TNT_Torrentmac.net.dmg
一般零售行业深度研究:海外电商渗透率提升&中国产品能力提升推动跨境电商行业快速发展,看好中国制造的品牌化出海机会-20210127-天风证券-21页.pdf
ripro.zip
Motion_5.5.1_MAS__TNT_Torrentmac.net.dmg
一网互通&Morketing-2020Q4《BrandOS TOP 100出海品牌社交平台表现力白皮书》.pdf
Adobe_Lightroom_Claccic_v10.1.1__TNT_Torrentmac.net.dmg
Final_Cut_Pro_10.5.2_MAS__TNT_Torrentmac.net.dmg
3.分离文件名和扩展名——splitext()
import os
path = '2021中国物流科技发展报告-罗戈研究-2021-247页.pdf'
separate = os.path.splitext(path)
print(separate) #打印出来的结果是一个元组
('2021中国物流科技发展报告-罗戈研究-2021-247页', '.pdf')
4.重命名文件和文件夹——os.rename(src,dst)
import os
'''
oldname = '/Users/jackeroo/Downloads/2021中国物流科技发展报告-罗戈研究-2021-247页.pdf'
newname = '/Users/jackeroo/Downloads/2021中国物流科技发展报告-罗戈研究(共247页).pdf'
os.rename(oldname,newname)
'''
#改名后打印该文件夹下的所有文件名和文件夹名称
path = '/Users/jackeroo/Downloads'
file_list = os.listdir(path)
for file in file_list:
print(file)
.DS_Store
.localized
2020哔哩哔哩流量生态白皮书-蓝鲸浑水-2020.12-95页.pdf
2021中国物流科技发展报告-罗戈研究(共247页).pdf
Compressor_4.5.2_MAS__TNT_Torrentmac.net.dmg
一般零售行业深度研究:海外电商渗透率提升&中国产品能力提升推动跨境电商行业快速发展,看好中国制造的品牌化出海机会-20210127-天风证券-21页.pdf
ripro.zip
Python标准库学习笔记.md
Motion_5.5.1_MAS__TNT_Torrentmac.net.dmg
一网互通&Morketing-2020Q4《BrandOS TOP 100出海品牌社交平台表现力白皮书》.pdf
Adobe_Lightroom_Claccic_v10.1.1__TNT_Torrentmac.net.dmg
Final_Cut_Pro_10.5.2_MAS__TNT_Torrentmac.net.dmg
5. 遍历目录树——os.walk()
import os
turples = os.walk('/Users/jackeroo/Downloads')
for turple in turples:
print(turple,'\n')
('/Users/jackeroo/Downloads', ['Compressor_4.5.2_MAS__TNT_Torrentmac.net.dmg', 'Motion_5.5.1_MAS__TNT_Torrentmac.net.dmg', 'Adobe_Lightroom_Claccic_v10.1.1__TNT_Torrentmac.net.dmg', 'Final_Cut_Pro_10.5.2_MAS__TNT_Torrentmac.net.dmg'], ['.DS_Store', '.localized', '2020哔哩哔哩流量生态白皮书-蓝鲸浑水-2020.12-95页.pdf', '2021中国物流科技发展报告-罗戈研究(共247页).pdf', '一般零售行业深度研究:海外电商渗透率提升&中国产品能力提升推动跨境电商行业快速发展,看好中国制造的品牌化出海机会-20210127-天风证券-21页.pdf', 'ripro.zip', 'Python标准库学习笔记.md', '一网互通&Morketing-2020Q4《BrandOS TOP 100出海品牌社交平台表现力白皮书》.pdf'])
('/Users/jackeroo/Downloads/Compressor_4.5.2_MAS__TNT_Torrentmac.net.dmg', [], ['Compressor_4.5.2_MAS__TNT_Torrentmac.net.dmg', '.Compressor_4.5.2_MAS__TNT_Torrentmac.net.dmg.torrent', '.FCAC973451BE0665667606FA9ACBC16C2F00C059.js'])
('/Users/jackeroo/Downloads/Motion_5.5.1_MAS__TNT_Torrentmac.net.dmg', [], ['.Motion_5.5.1_MAS__TNT_Torrentmac.net.dmg.torrent', '.F4103F724FE77E0C2D32E90EFE64AAE3D44D69C4.js', 'Motion_5.5.1_MAS__TNT_Torrentmac.net.dmg'])
('/Users/jackeroo/Downloads/Adobe_Lightroom_Claccic_v10.1.1__TNT_Torrentmac.net.dmg', [], ['.Adobe_Lightroom_Claccic_v10.1.1__TNT_Torrentmac.net.dmg.torrent', '.827340191E04AE89F99ABE992F07B4AD0BB88293.js', 'Adobe_Lightroom_Claccic_v10.1.1__TNT_Torrentmac.net.dmg'])
('/Users/jackeroo/Downloads/Final_Cut_Pro_10.5.2_MAS__TNT_Torrentmac.net.dmg', [], ['.Final_Cut_Pro_10.5.2_MAS__TNT_Torrentmac.net.dmg.torrent', '.73149C61818436FDF6E7ED3EE61B8288BC60F6C9.js', 'Final_Cut_Pro_10.5.2_MAS__TNT_Torrentmac.net.dmg'])
6.获取系统中的CPU数量——cpu_count()
print(os.cpu_count()) #获取CPU的核心数量
8
print(os.getlogin()) #获取登录系统的用户名
jackeroo
print(os.getpid()) #获取当前进程ID
1457
print(os.getppid()) #获取父进程id
1442
print(os.popen(r'/Users/jackeroo/Downloads/2021中国物流科技发展报告-罗戈研究(共247页).pd','r'))
import os
times = os.times()
print(times)
print('用户时间',times.user)
print('系统时间',times.system)
print('所有子进程的用户时间',times.children_user)
posix.times_result(user=1.04, system=0.61, children_user=0.0, children_system=0.0, elapsed=1615040006.69)
用户时间 1.04
系统时间 0.61
所有子进程的用户时间 0.0
二、Pandas库
1.使用pandas打开Excel文件——pd.read_excel()
import pandas as pd
#解决数据输出时列名不对齐的问题
pd.set_option('display.unicode.east_asian_width',True)
df = pd.read_excel('/Users/jackeroo/Downloads/Python数据分析从入门到实践-源码/03/01/data.xlsx')
print(df.head())
排名 球员 球队 进球(点球) 出场次数 出场时间 射门 射正
0 1 瓦尔迪 莱斯特 17(3) 20 1800 49 29
1 2 英斯 南安普敦 14 22 1537 57 26
2 3 奥巴梅扬 阿森纳 14(1) 22 1945 55 22
3 4 拉什福德 曼联 14(5) 22 1881 74 34
4 5 亚伯拉罕 切尔西 13 21 1673 66 29
2. Series标签及索引
import pandas as pd
s1 = pd.Series([88,66,78,88+66+78],index=['语文','数学','英语','总分'])
print(s1)
print(s1['总分'])
print(s1['英语'])
print(s1[3])
print(s1[1:2])
print(s1.index)
print(s1.values)
语文 88
数学 66
英语 78
总分 232
dtype: int64
232
78
232
数学 66
dtype: int64
Index(['语文', '数学', '英语', '总分'], dtype='object')
[ 88 66 78 232]
3.DataFrame对象
import pandas as pd
pd.set_option('display.unicode.east_asian_width',True)
#通过二维数组创建DataFrame对象
data = [[110,115,123],[107,132,88],[109,120,130]]
index = ['王婷','刘涛','孙浩']
columns = ['语文','数学','英语']
df = pd.DataFrame(data=data,index=index,columns=columns)
print(df)
通过字典创建DataFrame对象
#通过字典创建DataFrame对象
import pandas as pd
pd.set_option('display.unicode.east_asian_width',True)
df = pd.DataFrame(
{
'语文':[110,123,114],
'数学':[120,88,132],
'英语':[109,120,130],
'班级':'高一17班'
},index=['王健','刘莉','孙婕']
)
print(df)
语文 数学 英语 班级
王健 110 120 109 高一17班
刘莉 123 88 120 高一17班
孙婕 114 132 130 高一17班
使用pandas导入外部Excel数据
import pandas as pd
pd.set_option('display.unicode.east_asian_width',True)
df = pd.read_excel('/Users/jackeroo/Downloads/Python数据分析从入门到实践-源码/03/12/1月.xlsx')
print(df.head())
买家会员名 买家实际支付金额 收货人姓名 宝贝标题
0 mrhy1 41.86 周某某 零基础学Python
1 mrhy2 41.86 杨某某 零基础学Python
2 mrhy3 48.86 刘某某 零基础学Python
3 mrhy4 48.86 张某某 零基础学Python
4 mrhy5 48.86 赵某某 C#项目开发实战入门
使用pandas导入指定的Sheet页的数据
import pandas as pd
#使用pandas导入指定的Sheet页的数据
pd.set_option('display.unicode.east_asian_width',True)
df = pd.read_excel('/Users/jackeroo/Downloads/Python数据分析从入门到实践-源码/03/13/1月.xlsx',sheet_name='莫寒')
print(df.head())
买家会员名 买家支付宝账号 买家实际支付金额 订单状态 收货人姓名 \
0 mmbooks101 ******** 41.86 交易成功 赵某人
1 mmbooks102 ******** 41.86 交易成功 李某某
2 mmbooks103 ******** 48.86 交易成功 高某某
3 mmbooks104 ******** 48.86 交易成功 高某某
4 mmbooks105 ******** 48.86 交易成功 高某某
收货地址 联系手机 订单创建时间 \
0 贵州省 贵阳市 花溪区 1********** 2018-05-16 09:38:00
1 新疆维吾尔自治区 乌鲁木齐市 水磨沟区 1********** 2018-05-09 15:31:00
2 云南省 红河哈尼族彝族自治州 开远市 1********** 2018-05-25 15:21:00
3 云南省 红河哈尼族彝族自治州 开远市 1********** 2018-05-14 20:21:00
4 云南省 红河哈尼族彝族自治州 开远市 1********** 2018-05-22 18:47:00
订单付款时间 宝贝标题 宝贝种类 物流单号 \
0 2018-05-16 09:41:00 Android项目开发实战入门 1 No:221307653963
1 2018-05-09 15:31:00 Android项目开发实战入门 1 No:221307653740
2 2018-05-25 15:21:00 ASP.NET项目开发实战入门 1 No:221307653898
3 2018-05-14 20:22:00 ASP.NET项目开发实战入门 1 No:221307653892
4 2018-05-22 18:47:00 C#项目开发实战入门 1 No:221307653942
物流公司 订单备注 宝贝总数量 类别 图书编号
0 申通快递 'null 1 全彩系列 B16
1 申通快递 'null 1 全彩系列 B16
2 申通快递 'null 1 全彩系列 B17
3 申通快递 'null 1 全彩系列 B17
4 申通快递 'null 1 全彩系列 B18
使用pandas导入csv格式文件
#使用pandas导入csv格式文件
import pandas as pd
pd.set_option('display.max_columns',500)
pd.set_option('display.width',1000)
pd.set_option('display.unicode.east_asian_width',True)
df = pd.read_csv('/Users/jackeroo/Downloads/Python数据分析从入门到实践-源码/03/16/1月.csv',encoding='gbk')
print(df.head())
买家会员名 买家实际支付金额 收货人姓名 宝贝标题 订单付款时间
0 mrhy1 41.86 周某某 零基础学Python 2018/5/16 9:41
1 mrhy2 41.86 杨某某 零基础学Python 2018/5/9 15:31
2 mrhy3 48.86 刘某某 零基础学Python 2018/5/25 15:21
3 mrhy4 48.86 张某某 零基础学Python 2018/5/25 15:21
4 mrhy5 48.86 赵某某 C#项目开发实战入门 2018/5/25 15:21
使用pandas导入txt文档
#使用Pandas导入txt文档
import pandas as pd
df = pd.read_csv('/Users/jackeroo/Downloads/Python数据分析从入门到实践-源码/03/17/1月.txt',sep='\t',encoding='gbk')
print(df.head())
买家会员名 买家实际支付金额 收货人姓名 宝贝标题 订单付款时间
0 mrhy1 41.86 周某某 零基础学Python 2018/5/16 9:41
1 mrhy2 41.86 杨某某 零基础学Python 2018/5/9 15:31
2 mrhy3 48.86 刘某某 零基础学Python 2018/5/25 15:21
3 mrhy4 48.86 张某某 零基础学Python 2018/5/25 15:21
4 mrhy5 48.86 赵某某 C#项目开发实战入门 2018/5/25 15:21
1. 本站所有文章和内容源于站长整理与输出,如有侵权请邮件联系站长!
2. 本站部分文章教程提供PDF版本付费下载收藏备用,网页版可免费阅读与浏览!
3. 联系站长或者加入社群,请通过顶部菜单栏加入,或者邮件联系 [email protected]
Jackeroo的个人独立博客 | Working | Life | Interests » Python中标准库学习笔记
Jackeroo的个人独立博客 | Working | Life | Interests » Python中标准库学习笔记