Sansan Tech Blog

Sansanのものづくりを支えるメンバーの技術やデザイン、プロダクトマネジメントの情報を発信

勉強会「Econ Fiesta」を実施しました

こんにちは。DSOC R&D研究員の小松です。DSOC R&Dの社会科学グループSocSciに所属し、経済学の知見を日々の業務に活かすことができないか日々思索しているホモ・エコノミクスです。

本ポストでは、2020年8月28日にSansanとサイバーエージェントさん共催で実施した勉強会「Econ Fiesta」について報告します。

Econ Fiestaとは?

f:id:komatsuna4747:20200901120032p:plain
ここ数年、経済学者を雇う企業がテック系を中心として増加しています。これは、経済学者が企業の抱える問題の解決に貢献していること、および企業側もその価値を見出しつつあることの証左であると言えるでしょう*1

こうした動きの中心は、アメリカをはじめとする海外でした。しかし近年、日本においても経済学者の産業界における活躍が目につくようになってきました。経済学者がテック企業をはじめ産業界でどのような研究や働き方をしているかを紹介し、このトレンドを継続させ大きな流れとしていくためのお祭り、すなわち"Fiesta"が、本勉強会の位置付けです*2

以下、各登壇者の発表内容をまとめます(敬称略)。

高次元データから消費者行動のパターンを抽出する手法について

docs.google.com

発表者:
松井 暉 (南カリフォルニア大学)

概要:
消費者行動の把握は、マーケティング戦略の立案のみならず、経済政策の運営においても重要な課題である。しかし消費パターンの検出は、週内の規則性、季節性など、消費者の行動に影響を与える様々な要因を考慮する必要がある高次元の問題である。本発表では、非負テンソル因数分解(Non-negative Tensor Factorization: NTF)を用いて、週内および週間の消費パターンを一度に検出する手法を紹介した。

推しポイント:
詳細なデータがあれば属性がわかるのは当然ということで、必要最小限なデータからどこまで消費者の属性がわかるかを試みている点です。NTFによって得られた消費者の特徴ベクトルで消費者をクラスタリングして、実際のdemographyデータと照らし合わせていますが、スライド14ページを見ると、クラスター1は若い子供なしの消費者、クラスター4は子持ちの女性の傾向がはっきり出ています。膨大な消費データを前にすると途方に暮れても不思議ではありませんが、その状況を打破する1つの武器を授けていただきました。
消費データからその消費者の好みを推計するというのは、顕示選好と呼ばれる経済学の最も重要なアイデアの1つですが、消費データから消費者の属性を推計するというのもその類推なのでしょうか。

Building Econ Together: Structural Economics as OSS

speakerdeck.com

発表者:
Juan Martínez・西田 貴紀 (Sansan株式会社 DSOC 研究開発部)

概要:
経済学の理論と実証を合わせた構造推定は、反実仮想分析など意思決定場面でユニークな洞察を与えうる魅力的な分析手法である。しかしその実行は容易ではなく、その一因として構造推定のためのライブラリが少なく、手軽に実行することができない点がある。そうした参入障壁を下げることを目的として、Sansan DSOCがOpen-Source Software (OSS) の考えに基づいて開発している、構造推定をはじめとした経済学の分析手法に関するライブラリ”Econ Source”を発表し、その活用例を示した。
github.com

推しポイント:
まずは、動的離散選択モデルという構造推定の授業で習う代表的なモデルを、クラウド名刺管理サービスSansanの契約プラン選択という、実務上重要な問題に対して応用した点です。その内容を詳述できないのが大変心苦しいところですが、今後分析で得られたインサイトが意思決定者の信念にどう影響を与えられるかが注目です。
あとは、Econ Sourceの発表ですね。オープンに課題解決を目指したいというコンセプトはもちろん、JuanのWeb開発経験に基づいたライブラリ開発は、私自身大変勉強になっております。このあたりはデータ分析者にとっても有益な点が多いと思いますので、別途まとめていけたらと思います。

以下は、当日時間の都合上紹介できなかった、"Source DDC"を用いて動的離散選択モデルのシミュレーションと推定を行うコードの一例です。Rust and Phelan (1997)*3のモデルを単純化したモデルでシミュレートしたデータをもとにパラメーターを推定しています。Google Colaboratoryを用いているので、どなたでも確認可能です。
gist.github.com

経済学・機械学習の応用 - 因果効果による広告入札戦略の例

speakerdeck.com

発表者:
森脇 大輔 (株式会社サイバーエージェントAI Lab経済学チームリサーチサイエンティスト)

概要:
"Economists in Tech Comapnies"の日本におけるパイオニアとして、経済学者の活用を推し進めるサイバーエージェント。経済学者がリサーチサイエンティストとして、どのような働き方をしているのかを紹介した。そして、広告枠の入札において広告の因果効果にもとづく入札戦略を提案し実装、実際のプロダクトで実験して論文、著名な国際ワークショップに採択された話を中心に、事業貢献と学術貢献の両立にあたっての難しさや面白さを語った。

推しポイント:
事業の中で面白いアイデアを提案し、論文としてまとめるというリサーチサイエンティストとしての働き方は、大変魅力的です。そうした働き方ができるのは、研究とは必ずしも直結しないタスクをこなせる優秀なデータサイエンティストを多く抱えてこそなのでしょう。また、研究開発として対外的に発表することで、その企業のブランディング・採用強化につながるというお話は、まさにその通りです。我が経済学グループも研究活動に邁進せねばと、身が引き締まりました。
また後半の話は、広告配信の因果効果をバイアスを除去して推定するという、サイバーエージェントさんの十八番です。uplift modelingはユーザーの属性から個別的因果効果を予測するモデルだそうで、ビジネスへの応用を考える上で勉強する価値が大いにありそうです。

Finding Key Players in Networks

speakerdeck.com

発表者:
小松 尚太 (Sansan株式会社 DSOC 研究開発部)

概要:
ネットワークにおけるキープレーヤーは誰か。本発表では、キープレーヤーを「取り除かれるとネットワーク全体の活動量が最も下落するようなノード」と定義し、そうしたノードを特定するアルゴリズムを紹介した。キープレーヤー特定する上での困難の1つとして、ノード間の相互作用をモデル化し識別、推定する必要がある。本発表ではその相互作用を一致性を持つように推定できる方法を紹介した。そしてこのキープレーヤーを特定するアルゴリズムを、日本の市区町村間ネットワークで経済活動を支えるキーシティの特定、そして社内同僚ネットワークでITツールの利用を支えるキープレーヤーの特定に応用した。

推しポイント:
キープレーヤー特定の上で鍵となるのは、ネットワーク上でつながっている他のノードのアウトカムが自身にアウトカムに与える影響である「スピルオーバー効果」をどう識別するかです。そのために「友達の友達」の情報を利用すること、ネットワークそのものの内生性をうまく取り除いてあげる点がミソです。
あとは、本発表で用いられているネットワークデータです。キーシティ特定には名刺交換データに基づく市区町村ネットワークを、社内のITツール活用のキープレーヤー特定には、名刺交換情報に基づいて推定した社内の同僚ネットワークをそれぞれ使用しています*4。他ではなかなか見られないネットワークデータを贅沢に用いて料理しています*5

おわりに

以上、Econ Fiestaの実施報告でした。ありがたいことに、懇親会にも多くの方にご参加いただきました。特に、現在経済学の大学院に在籍している方から、こうした動きへの期待が伺えました。Econ Fiestaは今後も幅広いゲストを招きながら実施予定ですので、ぜひcompassなどのイベント情報を定期的に確認いただければと思います。

そしてSansanは、産業界における経済学をより一層盛り上げていくことにコミットしていきます。ぜひ、このムーブメントを一緒に盛り上げていきましょう。




buildersbox.corp-sansan.com
buildersbox.corp-sansan.com
buildersbox.corp-sansan.com

*1:テック企業において、経済学者のどのようなスキルが活かされているかを深く知りたい場合は、Susan Athey教授とMichael Luca教授による以下の論文を参照下さい。無料で読めます。 Economists (and Economics) in Tech Companies - American Economic Association

*2:もともと開発経済学を学ぶ端くれだった者としては、日本の国際協力の分野でもこうした動きがより広まることを期待しています。例えば、麹町にある某機構とか。

*3:Rust, John and Christopher Phelan. 1997. “How Social Security and Medicare Affect Retirement Behavior in a World of Incomplete Markets.” Econometrica. July, 65:4, pp. 781–831.

*4:名刺交換に基づく社内の同僚ネットワークの推定方法については、弊社研究員の前嶋がオペレーションズリサーチ誌の論文にて解説しています。 http://www.orsj.or.jp/e-library/elcorsj64.html

*5:素材が良くても調理方法が悪ければ全てが台無しです。しかし、その調理方法であるネットワーク計量経済学のここ10年の発展は目覚ましく、その成果がサーベイ論文誌Annual Review of Economicsで毎年出版されています。ネットワーク計量経済学は闇深いというのが私の第一印象ですが、そこに差す光が徐々に強さを増している気配を感じます。

© Sansan, Inc.