想要尽较大努力的工人必须首先磨快他们的工具。如果他们工作,他们必须有工具来称他们的手。
很多数据分析的初学者都担心学习和使用什么工具。这里我就简单说一下。请参见下表:
软件应用范围的优缺点
EXCEL主流办公软件数据录入方便,学习使用门槛低,分析功能弱,数据存储容量不足,无法应对大数据。
对于数据量大、重复劳动的应用场景,VBA几乎可以在EXCEL环境下完成所有工作,也可以作为中控平台控制PPT和WORD。对于不是计算机出身的人来说有点难。
Access入门级数据库,适用于大数据量查询的情况,表与表之间的关系处理起来非常方便,查询操作界面非常方便,比EXCEL更难操作
SPSS可以说是目前主流的统计软件,界面美观大方,输出强大比较全面,经常输出“中间过程”,几乎可以实现所有的统计分析功能。初学者经常感到困惑,需要很强的统计基础。中文版的翻译在很多地方有点混乱
XLSTAT是一个与EXCEL无缝集成的分析插件。它可以在简单实用的EXCEL环境中使用。没有必要打开另一个软件。国内没有好的中文版,分析输出不太标准
MODELER专业数据挖掘软件几乎可以完成数据挖掘功能的所有图形界面操作。它使用方便,与SPSS有很高的重叠度,大部分功能都可以在SPSS中实现
r专业统计编程工具开源软件,基本免费,功能强大,编程包随处可见,很多统计过程不需要自己编程,而且绘图功能非常强大。非计算机专业的人有点难上手
以下是简要说明。在我们大多数企业,人眼里,EXCEL VBA ACCESS基本上可以解决大部分需求,而且ACCESS可以轻松搭建一个小型数据库。
XLSTAT是一个与EXCEL无缝集成的分析工具,虽然比较小,但是功能在不断完善。
SPSS号称是入门级的统计软件,体积大,功能强大,基本不用编程。
r、MATLAB、PYTHON、SAS现在都很流行,但是都需要编程。
其实按照我自己的感觉,VBA还是重要的,多才多艺的,编程语言是多合一的。VBA大师学其他软件很快。