这周写作业, 用jupyter时遇坑一枚, 导致我改了作业10次以后才全对通过. 10次交作业而且这个坑与我当前的编程习惯有关. 有必要记录下来, 以免未来再犯.

Convert NOAA weahter data file ".dly" to Pandas DataFrame

Follow this instruction https://www1.ncdc.noaa.gov/pub/data/ghcn/daily/readme.txt

Get data from ftp://ftp.ncdc.noaa.gov/pub/data/ghcn/daily

World bank data cleaner¶

世界银行数据清洗工具.

世界银行有个开放的数据库http://data.worldbank.org 这个数据库很强大, 里面有各国各种经济数据. 我看了GDP, GDP年增长率, 税收, 税收占GDP百分比几个数据集, 发现里面的格式基本相同. 因此就可以统一清理数据了.

所以做了一个这样的简单清洗器. 两个函数:

worldbank_data_reader(filename)用于读取原始数据, 因为读取一次文件的成本较高, 而处理的方式可以很多样, 所以建议先读取数据以后保存在一个dataframe中.
worldbank_data_cleaner(origin_df, countries="global", years=(1996,2006)): 对origin_df这个dataframe进行清洗, 提取出感兴趣的国家和感兴趣的年份, 返回出的Dataframe以年份作为index, 以国家名作为columns
- countries 默认为"global", 返回所有国家信息, 也可以使用列表指定感兴趣的国家名, 例如countries=["China","United States"], 注意使用正确的国家名称
- years=(1996, 2006), 按照python的习惯, 返回自1996年至2006年前的数据, 也就是1996, 1997..2004, 2005年的数据.
  阅读更多…

在曼昆的_经济学原理_的第八章中, 讲解了税收与经济之间的关系. 当税率逐渐提高时, 税收的总额会先提高, 税率到达一定水平以后由于税收对经济的影响, 税收反而会下降. 这一变化过程称为拉伐曲线.

根据_经济学原理_中引用“The New York Times,November14.1996,p.D2.”的一篇文章中说, 在1996年之后, 乌克兰打算进行税收的改革, 大幅度减税, 并通过减税来刺激经济.

那么, 这个案例的结果是怎样的? 乌克兰是否按照计划进行了减税, 减税之后该国的经济是否发生了改善? 在这本书中并没有讲解.

本文通过世界银行中乌克兰以及周边前独联体国家的公开数据进行了初步的分析.

最近正在学Applied Plotting, Charting & Data Representation in Python, 老师在第一周的课程中先讲了一遍统计图的审美, 其中有一段是展示如何将图中无用的部分清除, 所谓Dejunkify, 以强调显示主题. 感觉非常好. 完成第二周的作业后, 我应该是能够用matplotlib进行基本的画图了. 所以试着把这个例子重现一遍.

课程中的例子来自于Dark Horse

爱德华·图夫特（Edward Tufte）在他1983年经典的著作“量化信息的视觉显示”（The Visual Display of Quantitative Information）一书中指出：“数据墨水(Data-ink)是图像中不可抹去的核心，是为了反映数字的变化而安排的不可或缺的印迹”

Edward Tufte introduced the concept of data-ink in his 1983 classic The Visual Display of Quantitative Information. In it he states "Data-ink is the non-erasable core of the graphic, the non-redundant ink arranged in response to variation in the numbers represented" (emphasis mine).

一个"好"的统计图, 应当是尽可能多的保留data ink, 尽可能少的chart junk. 这一段动画显示了如何把一个凌乱的统计图删减到只包含必要的"Data-ink"的过程.

接下来我试着用matplotlib重现这个过程, 也算是参照matplotlib cheat sheet 的一次练习.

来自于datacamp, 我觉得一大张PDF不方便. 给改写成jupyter的. 有可能以后再做成竖排的小册子, 方便查阅.

需要下载本文可以点击此处

用jupyter写程序时小心意外的全局变量

NOAA天气数据格式转换

脑洞一打开, 功德自然来

六字真言安全带护套:

励志两则: 为学

励志两则: 劝学

世界银行数据清洗器

World bank data cleaner¶

乌克兰减税问题

如何向成人灌输一个观点

统计图清理

Matplotlib Cheat Sheet