Sansan Tech Blog

Sansanのものづくりを支えるメンバーの技術やデザイン、プロダクトマネジメントの情報を発信

【Dive into the Economics of Networks】vol.1 Introduction

f:id:komatsuna4747:20210127160740j:plain

Sansan DSOC研究員の小松です。本連載では、ネットワーク経済学、特にネットワーク計量経済学を中心に記事を書いていきます。*1

連載第1回目となる本稿では、ネットワーク経済学を学ぶモチベーションと本連載のロードマップを述べます。

なぜネットワーク経済学について連載を書くか

この分野を連載テーマとして選択した理由は、ネットワーク経済学の近年の進展は目覚ましく、純粋に興味深いからです。ネットワーク分析の理論、実証の論文が急速に増加している印象があり、経済学のサーベイ論文集である Annual Review of Economics にも毎年ネットワークに関する論文が掲載されています。ネットワーク計量経済学で顕著な業績のある Bryan Graham も、かつてはその難解さゆえ大学院生にこの分野はあまり勧める気がしなかったが、その状況は変わりつつあると述べています。

youtu.be

また幸い (?) なことに、ネットワーク経済学に関して日本語で解説を試みる記事は少なく、十分な参入余地があるように思われます。

個人としての理由は単純で、業務に必要となるからです。私はネットワーク経済学の専門家でも何でもありません。Sansan 入社以来ネットワーク経済学を学んではいますが、未だにドがつく素人です。しかし、弊社のもつ名刺交換を中心としたネットワークデータは非常に興味深いものであり、それをどのように料理するかが、研究員としては問われます。共同研究などで必要にかられネットワーク分析を学んでおり、そのアウトプットとしての場としてこのブログを利用しようという目論見です。間違いなどあれば遠慮なくご指摘下さい。

本連載のロードマップ

大きく分けて、4つのテーマについて書こうと考えています。グラフの定義やネットワークの要約統計量など、基本的な部分は省略する予定です。

  1. Econometrics of Interactions in Networks
  2. Econometrics of Network Formation
  3. Joint Estimation of Outcomes and Network Formation
  4. Estimating Peer Effects using Partial Network Data

1つ目のテーマは、ネットワークを所与としてノード間の相互作用を推定することです。例えば、個人間で peer effect がどの程度存在するのかを推定したり (survey は Bramoullé et al. (2020) 参照)、企業間の R&D ネットワークの企業の売上への効果を推定したり (Köing, Liu, and Zenou, 2019)、ネットワークを介した経済ショックの伝播を分析したり (Acemoglu, Ozdaglar, and Tahbaz-Salehi, 2015)、応用範囲は幅広いです。そのモデル化、識別を考えていきます。

このテーマの応用として、ネットワーク上でのキープレーヤーを特定するというものがあります (理論は Ballester et al. (2006)、応用例は Köing, Liu, and Zenou (2019)、Liu et al. (2020) 参照)。ネットワーク上の相互作用がわかれば、「そのノードを取り除くとネットワーク全体の活動量が最も下落する」という意味で、ネットワークのキープレーヤーを特定することが可能となります。このキープレーヤーについても、応用例をあげつつ紹介します。弊社では研究成果を Data Science Report という形で定期的に発信していますが、その1つとしてキープレーヤーを題材に書きました。こちらにありますので、よろしければご覧下さい。

alt

余裕があれば、情報の拡散のキープレーヤーというトピックで、Banerjee et al. (2013)も紹介できればと思います。

2つ目のテーマは、ネットワークがどのように生成されるかをモデル化し、推定することです。上で説明したノード間の相互作用の推定では、ネットワークが所与、つまり外から与えられることを前提されるケースが多いのですが、ネットワークは実際にはノード同士が戦略的に形成していたりするなど、内生的に生成されていると考えるのが自然です。 例えば、似た者同士はつながりやすいという現象は「ホモフィリー (homophily)」と呼ばれ*2、それがどの程度存在しているのかは大きな研究テーマです。また「友達の友達」という第三者の存在がつながりにどの程度効くのかを知ることは、ある1つのノードに与えたショックが他のノードにどれほど拡がるかを知るという点で、政策的にも重要なトピックになり得ます。 そこでよく使われるモデルは Exponential Family Random Graph Model (ERGM) と呼ばれるものがあります。Mele (2017) は、ネットワーク生成過程にポテンシャルゲームと呼ばれるゲームのクラスを導入し、ネットワーク生成ゲームがある仮定のもとで以下のような定常分布に一意に収束することを示しました。

\pi(g, X; \theta) = \exp(Q(g, X; \theta)) /  \sum_{\omega \in \mathcal{G}} \exp(Q(\omega, X; \theta))

ノーテーションの説明は省きます。この ERGM の応用例としては Liu et al. (2020)、Mele (2020) などがあります。推定は困難を伴うのですが、その困難さとそれをどう克服するかを Mele (2017) を中心に読み解きます。

また現在、このネットワーク生成過程のトピックについて、クラスター構造を考慮したモデルを推定する共同研究を行っています。その研究成果もご紹介できればと思います。興味のある方は Vu, Hunter, and Schweinberger (2013)、Schweinberger and Luna (2018)、Babkin et al. (2020)を参照ください。

これまであげた2つのテーマは、ネットワーク上でのアウトカムとネットワーク生成過程を分離して考えているものでした。その両方を同時に推定するというのが3つ目に取り上げるテーマです。企業間の R&D ネットワークの企業を対象とした研究として Köing, Liu, and Zenou (2019) を既にあげましたが、それをネットワーク生成過程とアウトカムの決定を同時に推定したものが Hsieh, Köing, and Liu (2020) です。first author である Chih-Sheng Hsieh のホームページには replication file がありますが*3、全て Fortran で書かれているのが悩みの種です。時間を見つけてそのコードを R に書き直し、 その公開までこぎつけるというのを、この3つ目のテーマのゴールにします。

最後のトピックは、ネットワークに関する情報が不完全な中でも、関心のあるパラメーターをどのように推定するかという話です。これまでのテーマはネットワークデータが存在することを前提としていますが、実際ネットワークデータを得ることは困難を伴います。 その中で、個人間の相互作用をどのように推定するかという研究が近年増加しています (e.g., Breza et al. (2020))。その研究動向についても紹介できればと思います。

Useful materials

優秀な読者の方であれば、私の拙い解説を待たずとも、ネットワーク経済学を自分で学んでいけるに違いありません。自習用の material をいくつか紹介します。

まずこの分野の大家である Yves Zenou のこのレクチャーノートが出発点としては良いと思います。ゲーム理論、計量両方に関して包括的にまとまっており、重宝します。

Teaching - Yves Zenou

Stanford の Matthew Jackson が、Coursera にてネットワーク経済学に関するレクチャーを公開しています。理論だけでなく上で触れた ERGM についても解説があり、参考になります。 自身の研究である Statistical Exponential Random Graph Model (SERGM) についても解説しています。

www.coursera.org

彼の書いた教科書も、手元に置いておくとよいでしょう。

Amazon | Social and Economic Networks | Jackson, Matthew O. | Pure Mathematics

上の Jackson の教科書では計量に関してはあまりカバーされていませんが、以下の教科書は最近のネットワーク計量経済学について概観しており、重宝します。

Amazon | The Econometric Analysis of Network Data | Graham, Bryan, de Paula, Aureo | Business Mathematics

UC Berkeley の Bryan Graham が書いた Handbook Chapter も、ネットワーク計量の最新トピックを網羅しています。彼の HP から original 版をダウンロードできます。

www.sciencedirect.com

本連載では、ネットワーク分析を行うために R を用います。R でネットワーク分析を行うパッケージとして statnetigraph があります。それらにも慣れておくとよいでしょう。

Welcome to the statnet website | statnet.github.io

igraph – Network analysis software

ERGM の推定ではベイズ推定が重要となる場面が多いです。以下の本を読んで、今日からあなたもベイジアンです。

モンテカルロ統計計算 (データサイエンス入門シリーズ) | 鎌谷 研吾, 駒木 文保 |本 | 通販 | Amazon

ERGM は R の ergm を用いると推定することができます。以下はそのチュートリアルです。

Exponential Random Graph Models (ERGMs) using statnet

R の ERGM は C 言語を中心に実装されています。それゆえか、R の ERGM 情勢は複雑怪奇です。 その混沌に一石を投じたのが、弊社研究員の前嶋の以下のブログです。ERGM を R で最初から実装することを試みており、大変勉強になります。

meana0.hatenablog.com

終わりに

大風呂敷を広げてしまい、本当に連載を完結できるかは不明ですが、出来るところまでやってみます。

次回は早速、1つめのトピックである "Econometrics of Interactions in Networks" に入っていきます。

References

  • Acemoglu, D., Ozdaglar, A., and Tahbaz-Salehi, A. (2016). Networks, shocks, and systemic risk. In The Oxford Handbook of the Economics of Networks.
  • Babkin, S., Stewart, J. R., Long, X., & Schweinberger, M. (2020). Large-scale estimation of random graph models with local dependence. Computational statistics & data analysis, 152, 107029.
  • Ballester, C., Calvó‐Armengol, A., & Zenou, Y. (2006). Who's who in networks. Wanted: The key player. Econometrica, 74(5), 1403-1417.
  • Banerjee, A., Chandrasekhar, A. G., Duflo, E., & Jackson, M. O. (2013). The diffusion of microfinance. Science, 341(6144).
  • Bramoullé, Y., Djebbari, H., & Fortin, B. (2020). Peer effects in networks: A survey. Annual Review of Economics, 12, 603-629.
  • Breza, E., Chandrasekhar, A. G., McCormick, T. H., & Pan, M. (2020). Using aggregated relational data to feasibly identify network structure without network data. American Economic Review, 110(8), 2454-84.
  • Hsieh, C. S., König, M. D., & Liu, X. (2020). A structural model for the coevolution of networks and behavior. Review of Economics and Statistics, forthcoming.
  • König, M. D., Liu, X., & Zenou, Y. (2019). R&D networks: Theory, empirics, and policy implications. Review of Economics and Statistics, 101(3), 476-491.
  • Lee, L. F., Liu, X., Patacchini, E., & Zenou, Y. (2020). Who is the key player? A network analysis of juvenile delinquency. Journal of Business & Economic Statistics, 1-9.
  • Mele, A. (2017). A structural model of dense network formation. Econometrica, 85(3), 825-850.
  • Mele, A. (2020). Does school desegregation promote diverse interactions? An equilibrium model of segregation within schools. American Economic Journal: Economic Policy, 12(2), 228-57.
  • Schweinberger, M., & Luna, P. (2018). HERGM: Hierarchical exponential-family random graph models. Journal of Statistical Software, 85(1).
  • Vu, D. Q., Hunter, D. R., & Schweinberger, M. (2013). Model-based clustering of large networks. The annals of applied statistics, 7(2), 1010.

*1:弊社研究員の黒木が、「ネットワークの統計解析」というテーマで連載を行っています。そちらもご覧ください。

buildersbox.corp-sansan.com

ネットワーク統計分析とネットワーク計量経済学の何が違うのかという話は、いずれできればと思っています。

*2:弊社研究員の前嶋のブログに、ホモフィリーの解説があります。 buildersbox.corp-sansan.com buildersbox.corp-sansan.com

*3:https://sites.google.com/site/chihshenghsieh/research?authuser=0

© Sansan, Inc.