大數據 中級課程
即將開課期數
根據近期調查,互聯網有2億個活躍網站。網絡蘊含數據之多,可謂無處不在,對普遍大眾而言,欠缺的不是數據,而是有效的技術去掫取、處理、分析相關數據。本課程將會教授三個關乎數據的重要課題:數據掫取、數據儲存、數據處理。課程亦會同時運用到JavaScript及Python的程式庫,去解決分析數據過程中所遭遇到的問題。
本課程尤其適合有基本編程知識,希望對數據處理及編程有更深理解的同學。
完成本課程的同學能夠學會:
- 使用網頁刮取工具,由網頁掫取及提取數據
- 於NoSQL資料庫儲存及整合數據
- 學習基礎Python知識,以處理數據
- 運用Python數據科技程式庫分析及視覺化數據
課程大綱
網頁刮取
網頁刮取乃是現今數據科學界不可或缺的一部份。眾所周知,大部份有用的數據,都並非以開放數據API型式發佈,而是以普通網頁的形式發佈。本部份將會教授使用功能全面的網頁刮取工具———Puppeteer,由熱門網站中掫取數據,連單頁面應用程式亦能輕鬆處理,同時亦會使用世上最廣泛使用的程式環境NodeJS。
此部份將深入探討以下內容:
- Node環境
- Node套件
- Puppeteer
- 實例分析
NoSQL數據資料庫
Firebase為一個NoSQL文件面向之雲端資料庫,開發者可以運用Firebase,無端很多繁瑣設定之下,就能輕易儲存大量數據。 Firebase深受初學者喜愛,非常適合儲存大數據時代之非結構化數據
此部份將深入探討以下內容:
- 雲端NoSQL資料庫Firebase
- 以Node存取Firebase
- 將已刮取的內容以Firebase儲存
Python入門
Python是數據科學界最多人使用的程式語言,本部份將教授基本環境設置、開發工具、Python基本知識,同學將能夠學以致用,再進一步學會使用Python的數據科學程式庫。
此部份將深入探討以下內容
- Python環境設置
- Python開發工具
- 基礎及進階Python
數據科學入門
近年有許多數據科學程式庫湧現,大大減輕了數據科學的難度,同學運用這些程式庫,將能夠掫取、清理、視覺化雲端Firebase數據裏的數據,亦能夠進一步處理、分析數據,從而完成一個基礎的資料數據。
此部份將探討以下內容:
- Numpy - 支援高階矩陣運算的程式庫
- Pandas - 多格式數據處理工具
- Seaborn - 統計視覺化工具
- Matplotlib - 2D圖表工具
導師團隊
Alex Lau 劉光曆
首席導師
Alex 曾榮獲多項本地及亞太科技大獎,作為多家科技公司的顧問和 Play More Limited 前首席技術官,他具備軟件開發和管理的專業知識。他擁有超過 20 年的程式設計經驗,專長多種程式語言,並開發了多個下載量超過 20 萬的手機應用程式。Alex 非常熱衷於程式設計和教學,現時為 AWS Solution Architect Professional 和 AWS Community Builder,他已培訓超過 700 名學生成為專業的軟件開發人員。他希望透過適切的教學推動本港 IT 行業,提升整體行業的質素和競爭力。
Gordon Lau 劉偉中
聯合創辦人
Gordon 於科技一行有豐富經驗,曾於多間不同行業、規模之公司擔任軟件開發及管理職務。累積超過10年編程經驗及超過4年編程教育經驗,經Gordon教學而成為軟件工程師的同學已超過300人。曾開發 HKGChat 聊天軟件,亦是香港首個公眾開放之編程平台Tecky Code的主要開發者。深信香港IT未來必須要有更多編程人才,來應對世界迅速的科技發展。Gordon 亦對語言、科學、旅行有相當興趣。
- 下期開課日期
- 上課時間 19:00 - 21:30 逢星期二及四
- 修業期 6星期
- 課堂人數
- 上課場地 The Wave 旺角