編輯推薦
本書適合以下讀者:一、想要進入因果推斷領域的初學者,該書比市場上流行的主要教材(如《基本無害的計量經濟學》 )門檻低,學習成本不高。二、適合已經會了一點因果推斷,但是知其然不知其所以然的讀者。這本書用一些例子、用一些非常生動鮮明的方式去講授因果推斷的方法和本質,對於會運行程序,會寫文章,但對方法的本質理解不深的讀者,這本書能夠加深、修正和規範讀者對方法的理解。三、適合想快速了解因果推斷領域最新方法的讀者。該書涵蓋的方法最新最全,適合想了解工具變數方法、合成控制方法、面板數據等一些方法的最新進展的讀者。
內容簡介
本書是關於社會科學中因果關係確定方法的最新著作,其敘述風格尤其適合於經濟學學生的學習。因果推斷是當前國際學術界最熱門的研究領域之一,是一種通過事物的原因推導至某個肯定結果的邏輯方式。本書介紹了社會科學家得以確定因果關係的主要數學工具和方法,是作者十多年研究和教學成果的結晶。內容包括:概率理論和統計回顧、回歸的性質、有向無環圖、因果模型的潛在結果、匹配和子分類、不連續回歸、工具變數和面板數據、差分、綜合控制。對於基本內容,作者在回顧基本的因果推理概念、概率與回歸概念的基礎上,介紹了有向無環圖 (Directed Acyclic Graphs,DAG)、潛在結果因果模型 (Potential Outcomes Causal Model)、匹配 (Matching) 以及斷點回歸 (Regression Discontinuity) 等因果推理工具和因果識別策略。其中,DAG 幾乎出現在書籍中的每一章節。
這本書不僅涵蓋了很多案例,關注了工具變數法、斷點回歸法等准實驗方法,還包括了經濟學者目前關注的合成控製法。此外,書中提供了案例分析所需的數據、代碼內容。因而,本科生、碩士生和剛入學的博士生如果想了解因果推理和學習諸如合成控製法這類的最新方法,可以參考這本書。
作者簡介
斯科特·坎寧安(Scott Cunningham),美國得克薩斯州貝勒大學經濟學教授,美國知名的計量經濟學家,主要研究領域:犯罪經濟學和勞動經濟學,在《經濟研究評論》(RES)等頂級期刊發表論文數十篇。
目錄
第一章 導論
什麼是因果推斷?
不要混淆相關性和因果性
最優化使一切變得內生
示例:確定需求的價格彈性
總結
第二章 概率與回歸知識複習
第三章 有向無環圖
有向無環圖表示法的介紹
第四章 潛在結果因果模型
物理隨機化
隨機化推斷
總結
第五章 匹配和子分類
子分類
精確匹配
近似匹配
第六章 斷點回歸
斷點回歸非常常見
使用RDD進行評估
對識別的挑戰
復刻一個流行設計:勢均力敵的選舉
拐點回歸設計
結論
第七章 工具變數
工具變數的歷史:父與子
工具變數的直覺認識
同質性處理效應
父母濫食冰毒和兒童寄養
弱工具變數問題
異質性處理效應
應用
流行的IV設計
結論
第八章 面板數據
DAG的例子
估計
數據練習:對成人服務提供者的調查
總結
第九章 雙重差分
約翰·斯諾=的霍亂假說
估計
推斷
通過事件研究和前期的平行提供平行趨勢的證據
安慰劑對DD方法的重要性
具有時間差異的雙向固定效應
結論
第十章 合成控製法
比較案例研究的介紹
監獄建設和黑人男性監禁
本書總結
精彩書摘
斯科特・坎寧安(Scott Cunningham) 的因果推斷有以下優點:1 涵蓋範圍和技術更新程度超越目前流行的因果推斷著作。本書包含了最為前沿的各類因果識別方法,且包括了這些方法的最新進展,包含了合成控製法和因果圖模型。1 作者從基礎的概率與回歸分析講起,引出因果革命中最基礎的兩個分析工具――無向因果圖和潛在分析框架。接下來分別介紹了目前主流的因果識別方法,分別是:匹配與分層方法,斷點回歸,工具變數,面板數據與雙重差分法,合成控製法。以雙重差分法(DID)為例,最近兩年出現了一大批基於異質性處理效應的DID 估計,這些方法也被經濟學頂級期刊(AER,QJE等)上的文章所採用,對雙重差分法的最新進展給出了介紹,而市場上其他書籍沒有。2 2 融匯了編程實例、數據和詳細的解釋,分別使用Stata和R程序中的演示實證練習,手把手教給讀者,真正想讀者之所想。使用兩套程序完成相同的任務,一方面照顧了經濟學以及社會學、政治學等其他不同專業的讀者的需求偏好,另一方面對已經了解了R並且想要學習Stata,或者已經了解了Stata想要學習R的讀者會很有幫助。本書作者在網站提供了可下載的數據集和程序。3 實用性強,能讓初學者快速入門和上手開始研究。這些實例有些是因果推斷領域的經典論文,有些則是作者自己的研究所得。這些實例具體而微地像讀者展示了一項研究成果是如何開展的,如何獲取數據、編寫代碼,如何利用理論和場景知識,在自己的項目中實現合理的設計。一個對因果推斷和編程一無所知的人,也可以從這本書開始,逐步達到勝任因果推斷的境地。4 該書圖文並茂,語言風趣簡練,引入入勝。中文版糾正了英文原書中的許多編校錯誤。
以下是核心內容的基本架構,方便大家更好地了解這本書:
首先,作者簡介了有關因果推理、概率與回歸相關概念和理論,為新接觸因果推理的讀者更好地學習打好基礎。
第一章引言作者通過識別需求的價格彈性等一系列案例,介紹了因果推理的含義、如何區分相關性與因果關係等基本內容;
第二章概率與回歸回顧中,從基礎的概率理論出發,回顧了隨機過程、樣本空間、統計獨立性、事件和條件概率以及期望值、方差等統計定義。在此基礎上,介紹了普通最小二乘法、方差分析理論、穩健標準誤等統計數據分析的基本方法。
其次,為更好地識別因果關係,第三章至第五章介紹了因果推理的工具。
第三章引入有向無環圖 (DAG),這是一個有助於澄清變數之間的因果關係的強大的工具,討論了後門標準和對撞機偏差兩個概念。詳細閱讀這一章對後續閱讀有很大的幫助;
第四章討論了潛在結果因果模型。因果效應可被定義為實際發生狀態和反事實狀態之間的比較,潛在結果表示法用反事實表示因果關係。書中定義了各種類型的因果效應:平均處理效應 (ATE)、干預組的平均處理效應 (ATT)、控制組的平均處理效應 (ATU)等。潛在結果因果模型成立依賴兩個關鍵假設:一是強調被干預對象相互獨立;二是在一定條件下,分配機制不會對潛在結果產生影響。潛在結果是由分配機制決定的,也十分強調匹配和傾向值分析對因果推理的重要性;
第五章繼續描述匹配和分配問題。貫穿這一章的概念是有條件獨立假設 (CIA),通過學生分配問題表明處理分配是有條件的隨機。當樣本較少時,分配缺乏足夠的數據,因而使得匹配和傾向值分析顯得尤為重要。精確匹配和近似匹配均是因果推理的重要組成部分,傾向得分匹配作為一個工具,以使不同組別具有可比性。
最後,在剩下的第六章至第十章,此書理論結合案例,分別介紹了識別因果推理的策略,包括斷點回歸、工具變數、面板數據、差分、合成控制五個方法。
斷點回歸 (Regression Discontinuity) 的設計圍繞核心變數、臨界值、處理組分配和結果本身之間的關係。精確斷點回歸是其中一種方法,使用一個連續的分數,通過任意選擇一個臨界值來分配處理組和控制組,比較高於和低於臨界值的人來估計一種特定的平均值。作者藉助一個案例 「複製一個流行的設計:接近的選舉」 進行具體說明;
工具變數 (Instrumental Variables) 設計可能是有史以來最重要的研究設計之一。作者從顯示一系列因果效應的 DAG 開始進行分析,認為其包含了理解工具變數策略所需的所有信息。工具變數法通常用於解決遺漏變數偏差、測量誤差等問題,兩階段最小二乘法是一個比較常用的方法,書中提供了一些數據,幫助讀者更好地理解如何在實際數據中實現兩階段最小二乘法。與斷點回歸不同,工具變數法的識別假設有 5 個。這使得使用工具變數法時通常出現弱工具變數等問題,因而研究者很難找到滿足所有 5 個條件的工具變數;
面板數據 (Panel Data) 包含不同單位時間內重複測量的縱向數據。固定效應是一種估計因果效應有用的方法。只要處理和結果隨時間變化,並且存在嚴格的外生性,那麼固定效應將消除任何和所有未觀測和觀測的處理變數相關的不隨時間變化的協變數。但是,這種方法不能處理隨時間變化的、未觀測到的異質性,而且當存在強反向因果路徑時,面板方法是有偏的。作者通過回顧描述面板數據的 DAG 情況下,討論一篇論文,然後在 R 和 Stata 中進行一個數據集的練習,很好的解釋了上述問題;
差分 (Difference-In-Differences) 已經成為定量社會科學中最受歡迎的研究設計之一。作者以簡單的形式(同時處理一組單位)和更常見的形式(即在不同時間點處理一組單位)來解釋差分方法。這一章的重點是確定估計處理效應所需的假設,包括通過事件研究提供平行趨勢證據、安慰劑的重要性、有時間差異的雙向固定效應等;
合成控制 (Synthetic Control) 目前是一個活躍的研究領域,人們期望通過合成控制方法進行大量的證偽聯繫。使用合成控製法進行比較案例研究,必須通過基於安慰劑的推斷找到確切的 值,檢查預處理的匹配,調查用於匹配的協變數的平衡性,並通過安慰劑估計檢驗模型的有效性。書中通過 「監獄建設和黑人男性監獄」 的案例,展示了如何在 Stata 中估計合成控制方法。但是,還有很多相關問題書中沒有給出解決方法。
因果推理是一個重要且有趣的領域,越來越受到社會科學研究者的關注。
潛在結果因果模式提供了一種直觀的方式來思考因果效應,該模型在理解使用異質的准實驗研究設計來確定因果關係所需的假設方法非常有效;
有向無環圖對項目的設計階段非常有用,在理論模型和對某些現象的理解以及識別所關心的因果效應的策略方面都受到關注;
其它的識別因果效應的策略是目前微觀經濟學中最常見的。