網頁刮取乃是現今數據科學界不可或缺的一部份。眾所周知,大部份有用的數據,都並非以開放數據API型式發佈,而是以普通網頁的形式發佈。本部份將會教授使用功能全面的網頁刮取工具———Puppeteer,由熱門網站中掫取數據,連單頁面應用程式亦能輕鬆處理,同時亦會使用世上最廣泛使用的程式環境NodeJS。
此部份將深入探討以下內容:
Firebase為一個NoSQL文件面向之雲端資料庫,開發者可以運用Firebase,無端很多繁瑣設定之下,就能輕易儲存大量數據。 Firebase深受初學者喜愛,非常適合儲存大數據時代之非結構化數據
此部份將深入探討以下內容:
Python是數據科學界最多人使用的程式語言,本部份將教授基本環境設置、開發工具、Python基本知識,同學將能夠學以致用,再進一步學會使用Python的數據科學程式庫。
此部份將深入探討以下內容
近年有許多數據科學程式庫湧現,大大減輕了數據科學的難度,同學運用這些程式庫,將能夠掫取、清理、視覺化雲端Firebase數據裏的數據,亦能夠進一步處理、分析數據,從而完成一個基礎的資料數據。
此部份將探討以下內容: