Sansan Tech Blog

Sansanのものづくりを支えるメンバーの技術やデザイン、プロダクトマネジメントの情報を発信

アムステルダムで開催されたIC2S2でオーラル発表を行いました!

f:id:sansan_nissy:20190801180847j:plain
こんにちは! DSOCの西田です。最近、網のカットソーにハマっていて、追加で購入してしてしまいました。日焼けには気をつけたいと思います。

さて、今回はNetSci2019に引き続き、7月17~20日にオランダで開催されたIC2S2 2019に参加し、オーラル発表をしてきましたので、参加レポートをお届けします!
IC2S2とは、International Conference on Computational Social Scienceの略で、Computational Social Science(計算社会科学)分野の国際学会のことです。昨年もポスター報告とスポンサーとして参加しました。もっとComputational Social Science(計算社会科学)について詳しく知りたい! という方は昨年の参加レポートをご覧ください!

jp.corp-sansan.com



今回は以下の内容で興味深かった発表の内容をレポートさせていただきます!

また、私のオーラル発表の内容は前回のNetSci2019のものとほぼ同内容のため、下記の記事・スライドをご覧ください。

f:id:s_yuka:20190802092752j:plain
オーラル発表の様子


buildersbox.corp-sansan.com
発表スライド[日本語版]
speakerdeck.com

[Keynote] Mixing patterns in social interactions by Leto Peel

1つ目は、ネットワークにおける同類性という指標をグローバルに測定するのではなく、ローカルにも測定する方法を開発し、実際のネットワークでその特徴を見たという研究です。

発表内容の要約は下記の通り。

  1. ソーシャルネットワークにおいては、興味関心、趣味、性別、年齢等の観点から似た者同士でつながりが生まれるホモフィリーという性質があるように、Assortativity(同類性)という尺度でその特徴を捉えることができる
  2. これまでAssortativityはNewmanによる指標が一般的で、一つのネットワーク全体でAssortativityを測定することが一般的であった(Global Assortativity)
  3. 小さなネットワークにおいてはGlobal Assortativityを用いることで特徴を捉えることができるが、SNS等の大きなソーシャルネットワークでは、グローバルに一つの特徴をもつネットワークというよりも、ローカルに様々な特徴をもつネットワークの集合体だとした方が正確に捉えられる(Local Assortativity)
  4. 上記のモチベーションで、Local Assortativityを測定する指標を開発し、現実のネットワークでその特徴を捉えた
  5. Facebook 100 というアメリカの100の大学におけるFacebook上のつながりに、住んでいる寮におけるLocal Assortativityを用いて分析したところ、Global Assortativityは同じでもLocal Assotativityは異なる分布をしていることがわかった。さらに、大学1年生においてはLocal Assortativityが高い傾向にあり、同じ寮の中でつながりをつくりやすい傾向があることが読み取れた(下図)


https://www.pnas.org/content/pnas/115/16/4057/F5.large.jpg


Global Assortativity(モジュラリティ)については知っていましたが、ローカルで測定するという指標はネットワーク分析の解像度を高めるものだなと思いました。実際のデータに応用した例でも、シンプルにわかりやすくネットワークの性質を明らかにしていて早く実務でも応用したくなりました。ネットワーク分析の手法はスケーラブルでないものも少なくないので、こういったビッグデータ時代における新しい分析手法の提案はとても貴重だと思っています。

こちらの研究について、より詳しく知りたいという方は、こちらから発表資料と論文をご確認ください!
www.pnas.org

[Labor Markets] Universal resilience of labor markets by Morgan Frank

2つ目は、アメリカの各都市における労働移動・職業移動を分析した研究について紹介します。

発表内容の要約は下記の通り。

  1. 近年の金融危機やAIなどの技術進歩を踏まえて、現在の労働市場の性質を把握し、今後どのように労働市場が変化していくのかを捉えた
  2. 業種・職種等のレベルではなく、労働者の持つスキルに着目して、アメリカの各都市における職業移動の性質を捉えるモデルを考案した
  3. 各都市において、各職業において求められるスキルの類似度を計算し、職業間の類似度ネットワークを構築した
  4. 失業者の数と求人の数をもとに労働者のマッチングを考えるMortensen-Pissaridesモデルを拡張し、求められるスキルが類似しているほどマッチングしやすいというモデルを構築した
  5. スキルのデータで拡張したMortensen-Pissaridesモデルをもとにシミュレーションした結果、各都市間で就職率には差があることがわかり、職業間でスキルを通じてつながりがある都市の方が金融危機やAI等の技術進歩による雇用ショックに耐性があることを示した

モデルから導かれた結果は直感と合うものでしたが、経済学のモデルをビッグデータドリブンで拡張し、シミュレーションを行なっているところが興味深かったです。ストーリーもシンプルかつ結果の見せ方もわかりやすく、とても参考になる研究発表でした。

f:id:sansan_nissy:20190801181055j:plain

[Keynote Panel] Computational Social Science: Past, Present and Future by Duncan Watts

最後に研究ではありませんが、Computational Social Scienceのこれまで、現在、これからを語っていたDuncan Watts氏の発表が印象的だったのでご紹介します! 昨年のIC2S2の発表もとても印象的だったので、今回もとてもたのしみにしていました!(昨年の様子はこちらから)

今回は、Computational Social Scienceという新しい学問の立ち上げの象徴である論文(Lazer et al, 2009)が発表されてから10年、IC2S2という学会が始まってから5年というタイミングでこちらの発表が行われました。

主な発表の内容は下記の通り。

  1. あらゆるビッグデータを活用できる時代になり、社会科学分野と機械学習分野の知見を掛け合わせることで、Computational Social Scienceという分野からいくつもの興味深い知見を見い出すことができたが、両分野における問題点も少なくない
  2. 社会科学分野においては、再現性の問題が深刻になっており、論文として発表するために分析から求めた効果量を大きく見せたり、統計的に優位であるように調整したりする行為(P-hacking)などが問題視されている
  3. 機械学習分野における予測モデルに関する研究でも同様の問題が起きており、同じデータで同じモデルを使用しているにも関わらず、結果に違いが生じるケースがある(参考: Hofman et al , 2017) 。さらに、Emailを用いて従業員の満足度を予測する研究においては、ある年はうまく予測できるモデルができたものの、翌年はモデルの精度が大きく下がる結果なども得られており、予測する事象の背後にあるメカニズム(例:「ランダムに近い現象なのか否か」「非定常過程か否か」)を考慮できていないという問題がある
  4. 上記の問題に対して、下記の取り組みを強化し、より多く質の高いデータを研究に使用することが望まれる。1) 個人情報の扱いに十分に注意する体制を構築し、アカデミアと産業のコラボレーションを加速させる、2) 産業界のデータは研究用に作られたデータではないことを理解し、バイアスの補正を怠らない、3) 社会科学分野の研究者独自の研究用データインフラストラクチャーを構築する(参考: The Sloan Digital Sky Survey
  5. これまでの社会科学は論文の執筆数と引用数で生産性を評価し、研究で示される理論と新規性を重視されてきたが、導かれてきた理論には一貫性がなく不完全であり、実社会への応用も限定的である。これからはこれらの課題を解決すべく、社会科学分野に閉じこもるのではなく、他分野との学際的な研究を行い、新規性や意外性ではなく再現可能な正確性を重視し、どれだけ実用的な知見が得られたのかという尺度で生産性やインパクトを測定していくべきである

普段の研究者間でも上記にあるような問題点はよく話すことなので、とても納得感のあるものでした。一般的に企業保有のサービスに関するデータから、研究対象の事象に対してバイアスを完全に取り除いて分析をすることはとても難しいことではあると思いますが、結果のロバストネスチェックを怠らないことやバイアスがかかっている場合には、どういったバイアスであるかまで考察することを怠らないようにしなければいけないと改めて思いました。また、この分野で有名な研究では新規性や意外性があるものが多いという印象を持っていましたが、それだけではなく実社会にいかに貢献できる研究であるかという視点と社会実装というところまで考えて研究開発に取り組んでいきたいです。

f:id:sansan_nissy:20190801181133j:plainf:id:sansan_nissy:20190801181145j:plain

[おわりに] 計算社会科学のあるべき姿を目指して

今回の学会は、昨年はポスター発表枠での参加でしたが、今年は、すごいなと憧れていたMITの研究者の方々と同じオーラル発表で報告することができ、とても嬉しかったです。しかし、同じステージといえども、研究内容や発表の質に関しては自分はまだまだだなと感じることが多かったのが正直な感想です。Duncan Watts氏の発表から、これからComputational Social Scienceがより豊かな社会の実現のために重視すべきことなど今後の研究方針のヒントになることも多かったので、今回の学びを今後の研究に活かしていきたいです。

また、まだまだ日本では産業界と社会科学分野の研究者とのコラボレーションが少ないと感じているので、この分野において日本が世界に大きな貢献をし、同時に日本社会がより良くなることを目指し、共同研究プラットフォームであるSansan Data Discoveryや自社勉強会であるSocSci Meetupなどのイベントを通じて、この分野を盛り上げていきたいです!

f:id:sansan_nissy:20190801181224j:plainf:id:sansan_nissy:20190801181219j:plain

© Sansan, Inc.