导读:数据分析将做为一门通用技能,进入越来越多的区别工作中。毕竟“技多不压身”,把握数据分析,一方面能够提高自己相应的业务能力,另一方面亦能够让自己创立一种从数据出发的视角,用大数据思维去思考各样问题。
作者:老A
如需转载请联系华章科技
Excel里面的透视表(Pivot Table)确实是做数据分析的必须技能。透视表能够帮你快速汇总数据,看到各类型数据的直观特征就像是让你站在了一个更高的视角上去看你的数据。做为进阶,Excel自带的函数,各样插件,以及VBA亦是很好的工具。
但当数据量大到用Excel打开都要好久,电脑打开文件都会死机的时候,这种亦就不适合用office工具了,亦或咱们想进一步提升能力的时候,必须学习有些hardcore技能,即用编程语言做数据分析。
这儿重点有R和Python两大流派。我个人举荐Python,一方面Python代码简单易懂,容易上手;另一方面学习资料超级多。关于Python的学习资料,这儿我举荐《利用Python进行数据分析》,这本书涵盖了利用Python做数据清洗,数据可视化及分析的技能点,能够作一本参考书、工具书,亦能够对着书里面的案例进行实操。
受这本书的启发,我写了下面是几个处理Excel的小程序,仅供大众参考学习数据分析和数据从Excel中获取数据。Python对Excel的读写重点有xlrd、xlwt、xlutils、openpyxl、xlsxwriterp这几个形式。详细的安装办法能够从网上查一下,而后导入Python中就能够运用了。
1. xlrd重点是用来读取excel文件
import xlrd
workbook = xlrd.open_workbook(u Python进行数据分析测试.xls)
sheet_names= workbook.sheet_names()
for sheet_name in sheet_names:
sheet2 = workbook.sheet_by_name(sheet_name)
print sheet_name rows = sheet2.row_values(1)
cols = sheet2.col_values(1)
print rows
print cols
2. xlwt重点是用来写excel文件
import xlwt
wbk = xlwt.Workbook()
sheet = wbk.add_sheet(sheet 1)
sheet.write(0,1,test text)#第0行
第1列写入内容
wbk.save(test.xls)
3. xlutils结合xlrd能够达到修改excel文件目的
import xlrd
from xlutils.copy import copy
workbook = xlrd.open_workbook(u Python进行数据分析测试.xls)
workbooknew = copy(workbook)
ws = workbooknew.get_sheet(0)
ws.write(3, 0, changed!)
workbooknew.save(u Python进行数据分析测试copy.xls)
4. openpyxl能够对excel文件进行读写操作
from openpyxl import Workbook
from openpyxl import load_workbook
from openpyxl.writer.excel import ExcelWriter
workbook_ = load_workbook(u" Python进行数据分析测试.xlsx")
sheetnames =workbook_.get_sheet_names()
print sheetnames
sheet = workbook_.get_sheet_by_name(sheetnames[0])
print sheet.cell(row=3,column=3).value
sheet[A1] = 47
workbook_.save(u" Python进行数据分析测试新.xlsx")
wb = Workbook()
ws = wb.active
ws[A1] = 4
wb.save("检索.xlsx")
最后把《利用Python进行数据分析》这本书的内容再给大众介绍一下,书中含有海量的实践案例,讲解怎样利用各样Python库(包含NumPy、pandas、matplotlib以及IPython等)有效地处理各式各样的数据分析问题。
因为作者Wes McKinney是pandas库的重点作者,因此这本书亦能够做为利用Python实现数据密集型应用的科学计算实践指南,适合刚才接触Python的分析人员以及刚才接触科学计算的Python程序员。
将IPython这个交互式Shell
做为你的首要
研发环境。学习NumPy(Numerical Python)的
基本和高级知识。从pandas库的数据分析工具
起始。利用高性能工具对数据进行加载、清理、转换、合并以及重塑。利用matplotlib创建散点图以及静态或交互式的可视化结果。利用pandas的groupby功能对数据集进行切片、切块和汇总操作。处理
各样各样的时间序列数据。
经过仔细的案例学习
怎样处理Web分析、社会科学、金融学以及经济学等
行业的问题。关于作者:老A,项目管理师,专业兴趣
科研方向:大数据、计算机软件、通信工程。个人业余
兴趣是
科研无人机制作,银元鉴赏与
保藏。
本文为「大数据」内容合伙人之「鉴书小分队」活动读书笔记,由微X公众号大数据粉丝原创。
延伸阅读《利用Python进行数据分析(原书第2版)》
举荐语:Python数据分析经典畅销书全新升级,第1版中文版累计营销100000册。针对Python 3.6进行全面修订和更新,涵盖新版的pandas、NumPy、IPython和Jupyter。