從Python vs Tableau到名字的趨勢分析

至於Python,真的不是太親民。不是說價錢,而是他的learning path。你要做到最簡單的Descriptive,如果你不是programmer底,我想大約要花1-2年的時間吧。因為首先你要學Python基本知識,之後便是Jupyterggplot2seabornPanda等,到了這裡,你應該可以plot到第一個graph了。

有些人在說,Python不能plot靚圖。我雖然是Tableau粉絲,但其實我覺得Python一樣可以出到靚圖。話雖如此,但學Python的路那麼長,為什麼要辛苦自己?數據專業人員通常都會R和Python,但95%的非技術觀眾是不會欣賞你使用Jupyterggplot2seabornPanda的。因為他們關心的,是你的從數據找出什麼來。我試過有一個Client,他在選亞洲的其中一城市開公司,於是我為他做了Researches,找了Amazon為藍本,為他做了分析模型,有圖,有Regression,但他就是說,你不用多說了,給我們說說key findings就可以了,之後直接跳去Marketing Strategies。說了那麼多,其實就是說用什麼都沒分別,你易上手就可以了。不用選難的。

話時話,我最近用Python做了Descriptive Analysis,打算同大家分享一下。今次這個是用美國統計局的出生數據做基礎的,資料很多,因為包括上了由1880-2014年的出生資料。分開了百幾個檔案,如果不是用Python做,都幾麻煩。我就只在男,女子名字中,各選了一組名字來造趨勢圖。男的是Lawrence,Laurence,Lorentz和Lorenzo;而女的,分別是Kate,Katie,Katherine和Kathy。我想知道,那個是才千禧後最多人選的名字呢?

發表迴響

Your email address will not be published. Required fields are marked (required)