menu-icon
anue logo
鉅樂部鉅亨號鉅亨買幣
search icon
時事

〈鉅亨看世界〉超高人氣的R語言套件

鉅亨網編譯林懇 2017-07-07 07:04

據《Priceonomics》報導,2017 年是 ggplot2 的十週年紀念,開發者 Hadley Wickham 也對於 R 語言套件 ggplot2 的高人氣,感到意外。

他提道,「在研討會時大排長龍的要我的簽名是在是太瘋狂了!」

對於不熟悉 R 語言的人,可能會對「排隊要簽名」的空前盛況感到意外,但其實 R 電腦語言在電腦數據統計已相當的主流,而套件的目的則是讓電腦語言變得更簡易使用。

Wickham 的最主要功勞,就是讓數以萬計的工程師們,工作變得更加容易,統計學背景的他開發的套件可是被科技業公司如谷歌 Google (GOOG-US)、臉書 Facebook (FB-US)、推特 Twitter (TWTR-US) 使用。

而不只科技業,像紐約時報的媒體與知名論文周刊 Nature、及美國食品暨藥物管理局 (FDA)、 與美國緝毒局 (DEA) 也都使用其套件。

出身與統計世家的 Wickham 父親則是在康奈爾大學得到統計博士學位,他提道,15 歲就開始對統計有興趣,「我也相信可以有更好的辦法來幫助別人。」他在作品裡也運用了第三正規化 (Third Normal Form),也就是減少資料的副本的一種統計運算方法。

Wickham 在紐西蘭的奧克蘭大學時開始接觸 R 語言,他覺得 R 是「一個容易理解資料的語言。」他也同樣的學習了 SQL 及 Python 等數據科學家熱門的電腦語言。

事實上,R 語言是 1993 年紐西蘭的奧克蘭大學的統計學家 Ross Ihaka 與 Robert Gentleman 發明的,而進一步的發揚光大則是依靠 Wickham 在 R 語言領域上的成就,Wickham 透過了 ggplot2 套件,將 R 語言推上了另一個高峰。

相較 Java,PHP 等熱門語言不同,R 的資料結構是被索引編程 (indexed),然後在實體記憶體裡儲存。Wickham 覺得這實在是太特殊了,並開始開發套件來更快速的解決資料難題。

而他後來開發的 ggplot2 五年內則被下載超過 1000 萬次,上個月則是被下載了 40 萬次。那麼 ggplot2 是個開放原始碼 (open source) 軟體,所以是免費的。讀者可在此下載

Wickham 也提道,啟發他的是一本 Leland Wilkenson 寫的《The Grammar of Graphics (圖像的文法)》,ggplot2 裡面的 gg 就代表著 「grammar」以及「graphics」。他提道,圓餅圖 Pie chart 與長條圖 Bar Chart 其實底層非常接近,而 Wickham 也是用這相似度來開發者程式。

最後,Wickham 問道,這十年前推出的軟體為何沒有人改善?他也號召全世間寫出更棒的程式來推翻 ggplot2。(文:林懇)






Empty