開(kāi)班時(shí)間:每月滾動(dòng)開(kāi)班
適合人群:大學(xué)生
校區:杭州和盈IT教育、南京和盈IT教育
18210289671
課程詳情:
圍繞科研數據獲取、數據清洗和數據分析的編程技術(shù)培訓。和盈邀請你的參與。
本次培訓主要覆蓋了四部分內容。 Stata 編程、Python 爬蟲(chóng)、 ArcGIS 應用和因果推斷計量經(jīng)濟學(xué)與 Stata 實(shí)現。旨在讓學(xué)員熟練掌握 Stata 數據的讀取、數據的清洗和處理、網(wǎng)絡(luò )數據讀寫(xiě);掌握 Python 爬蟲(chóng),并能獨立編寫(xiě)爬蟲(chóng)程序,使用ArcGIS 進(jìn)行地理信息數據管理、展示與分析等實(shí)用技術(shù),了解應用計量經(jīng)濟學(xué)中的因果推斷原理與 Stata 實(shí)現。
我們將采取實(shí)例教學(xué),讓大家將所學(xué)技巧與科研過(guò)程中遇到的實(shí)際問(wèn)題相結合,學(xué)了就能用!助您成為數據獲得、數據分析、數據管理和數據展示的達人!
李老師:
擅長(cháng) Python 編程、Stata 編程,熟悉 Python 與 ArcGIS 交互 ,具有豐富的程序設計經(jīng)驗,負責業(yè)界公司多個(gè)百萬(wàn)級爬蟲(chóng)項目,參與多個(gè)實(shí)證研究項目,完成過(guò)多項高難度爬蟲(chóng)任務(wù),經(jīng)驗豐富。
和盈編程培訓內容
第一部分、Stata
Stata 基礎
Stata 常用函數
Stata 數據清洗、整理
Stata 文本處理
Stata 宏與循環(huán)
Stata 讀寫(xiě)網(wǎng)絡(luò )數據
-抓取谷歌地圖API獲取經(jīng)緯度信息、百度地圖API
-抓取十八大以來(lái)落馬官員的數據
-抓取和訊網(wǎng)上市公司社會(huì )責任報告數據
-學(xué)員意向網(wǎng)站爬取(選講)
Stata Debugging
第二部分、Python
對于高效完成大規模爬蟲(chóng)項目而言,Python是比Stata更為合適的編程語(yǔ)言。通過(guò)這部分的學(xué)習,你將了解到:Python的安裝和基礎語(yǔ)法;如何解析紛繁復雜的各類(lèi)靜態(tài)、動(dòng)態(tài)網(wǎng)站;如何利用多進(jìn)程的優(yōu)勢爬取數據并與數據庫交互;如何導入各類(lèi)型本地數據,爬取網(wǎng)址對應所需數據,并保存為本地數據(Stata dta 、csv 等);如何解決基本的反爬蟲(chóng)問(wèn)題。學(xué)習Python,也有利于你進(jìn)一步學(xué)習對大數據進(jìn)行數值運算,統計分析,機器學(xué)習。
Anaconda 環(huán)境配置及IDE安裝
Python 語(yǔ)法及數據結構入門(mén)
網(wǎng)頁(yè)結構分析(HTML、CSS選擇器、Xpath定位)
網(wǎng)站協(xié)議,發(fā)送請求,解析網(wǎng)站
【實(shí)戰】:靜態(tài)網(wǎng)頁(yè)爬蟲(chóng)
數據處理及存取(正則表達式、Pandas)
Python 與 MySQL 數據庫交互
反爬蟲(chóng)初探
【實(shí)戰】:多進(jìn)程爬蟲(chóng)
Selenium 模擬瀏覽器爬蟲(chóng)
【實(shí)戰】:動(dòng)態(tài)網(wǎng)頁(yè)爬蟲(chóng)
代碼穩健、json 數據處理(選講)
表單提交、網(wǎng)站登錄及 Cookie(選講)
【實(shí)戰】:學(xué)員意向網(wǎng)站爬取(選講)
第三部分、ArcGIS
地圖數據展示(基本畫(huà)圖展示)
地理信息數據管理、分析
Python 與 ArcGIS 交互
利用 OpenStreetMapAPI 獲取全球任意地點(diǎn)新行政邊界底圖
已知地址獲取經(jīng)緯度、已知經(jīng)緯度獲取地址、交通路線(xiàn)查詢(xún)等
第四部分、因果推斷與Stata實(shí)現
Difference-in-difference
Regression Discontinuity Design
其它事項
1、請學(xué)員自帶筆記本電腦,我們將協(xié)助您提前安裝好所需軟件。
2、提供午餐盒飯,培訓住宿安排。
3、本次培訓限額人數40人,即日起開(kāi)始正式接受報名和付費,先到先得,招滿(mǎn)即止。
要不要學(xué)編程?什么時(shí)候學(xué)編程培訓不算晚?
這是一個(gè)數字化的世界,在這個(gè)世界里,有計算機科學(xué)。人們閱讀電子書(shū)而不是紙質(zhì)書(shū)籍;課堂上使用的是數字顯示屏而不是粉筆與黑板;人們的相機和汽車(chē)都已經(jīng)數字化;孩子們剛學(xué)打字就知道如何使用拼寫(xiě)檢查,剛學(xué)算術(shù)就可以使用Excel,這些都是數字化工具,但我們仍要學(xué)習有關(guān)書(shū)寫(xiě)和計數的知識。人們能夠熟練使用谷歌或Facebook,但不知道谷歌搜索背后復雜的算法和Fackbook是如何保護隱私的。
計算機和編程是數字世界的核心。信息科學(xué)開(kāi)發(fā)出軟件來(lái)讓整個(gè)世界數字化成為可能。它是一種教育、一門(mén)科學(xué)和一門(mén)藝術(shù)——而不僅僅是賦予人們以工具和操作。人們一次又一次地將使用數字工具和編程相混淆,其實(shí)兩者毫無(wú)關(guān)系。
所以,信息科學(xué)有必要進(jìn)入課堂,與物理、化學(xué)和數學(xué)平起平坐。但它又有很強的技術(shù)屬性,你必須學(xué)會(huì )自己編程、使用計算機來(lái)解決問(wèn)題。這是必不可缺的一個(gè)方面。
教師簡(jiǎn)介:浙江大學(xué) 碩士 公司職務(wù): WEB/JAVA培訓講師; 開(kāi)發(fā)經(jīng)驗: 4年以上; 培訓經(jīng)驗: 4年(指專(zhuān)職講師年限),加開(kāi)發(fā)8年IT行業(yè)經(jīng)驗; 技術(shù)專(zhuān)長(cháng): 精通html5、css3、javascript等,熟悉各行業(yè)web開(kāi)發(fā)的特點(diǎn)、需求以及對應的業(yè)務(wù);精通J2SE,J2EE,JSP/Servlet,Struts,Spring,Oracle, PHP,從事過(guò)各類(lèi)網(wǎng)站開(kāi)發(fā)。
教師簡(jiǎn)介:李老師 蘭州大學(xué) 本科 公司職務(wù): Python培訓講師; 開(kāi)發(fā)經(jīng)驗: 4年以上; 培訓經(jīng)驗: 2年(指專(zhuān)職講師年限),加開(kāi)發(fā)6年IT行業(yè)經(jīng)驗; 技術(shù)專(zhuān)長(cháng): 多年軟件開(kāi)發(fā)經(jīng)驗和豐富的教學(xué)經(jīng)驗,精通Python、PHP、Objective-C、Swift、MySQL等編程語(yǔ)言,條理清晰,注重培養學(xué)生的學(xué)習能力。
教師簡(jiǎn)介:羅老師 江西師范大學(xué) 本科 公司職務(wù): WEB/JAVA培訓講師; 開(kāi)發(fā)經(jīng)驗: 4年以上; 培訓經(jīng)驗: 3年(指專(zhuān)職講師年限),加開(kāi)發(fā)7年IT行業(yè)經(jīng)驗; 技術(shù)專(zhuān)長(cháng): 精通html5、css3、javascript等,熟悉各行業(yè)web開(kāi)發(fā)的特點(diǎn)、需求以及對應的業(yè)務(wù);精通Java、J2SE、J2EE、JSP/Servlet、MySQL、Oracle、JS、C、Linux;熟悉Android。
杭州市西湖區體育場(chǎng)路580號昆侖大廈3號樓
適合人群:大學(xué)生
學(xué)習周期:每月滾動(dòng)開(kāi)班
適合人群:大學(xué)生
學(xué)習周期:每月滾動(dòng)開(kāi)班
適合人群:大學(xué)生
學(xué)習周期:每月滾動(dòng)開(kāi)班
適合人群:大學(xué)生
學(xué)習周期:每月滾動(dòng)開(kāi)班
適合人群:大學(xué)生
學(xué)習周期:每月滾動(dòng)開(kāi)班
適合人群:大學(xué)生
學(xué)習周期:每月滾動(dòng)開(kāi)班